Runway推出视频扩展工具:Expand Video可以无缝的为视频扩展画面
Runway推出的一项创新视频编辑工具:Expand Video 。能够无缝转换横向视频为竖向视频,反之亦然无需牺牲画面细节或使用模糊背景。使它通过生成新区域将视频转...
ChatGPT-4o登顶大模型竞技场,OpenAl重夺第一宝座
在OpenAI开发者日新加坡站活动中,ChatGPT再次展现了其强大的竞争力。最新版本的ChatGPT-4o(以下简称40)在更新后,成功击败了此前排名第一的谷歌Gemini,重新...
Mistral Al发布了全新的Pixtral Large开源模型 超越GPT-40、Gemini-1.5 Pro和Claude-3.5 Sonnet
Mistral AI发布了全新的Pixtral large模型,这是一款具备多模态能力的开源模型,基于Mistral Large2构建,参数量达到1240亿,并进一步扩展了图像与文本理解能...
ElevenLabs构建语言对话AI代理的功能 可使用其语音模型接入AI模型
ElevenLabs 宣布其开发者平台新增了创建对话式AI代理的功能。 这项新功能允许开发者平台上构建对话式AI代理,支持自定义变量,如语调、响应长度等。
月之暗面发布k0-math推理模型,对标OpenAIo1系列
月之暗面推k0-math模型,数学能力超OpenAlo1系列模型。Kimi探索版创新搜索体验。k0math和Kimi探索版将分批上线Kimi网页版和APP,助力解决数学和搜索调研任务...
Context Autopilot:全球首个上下文引擎驱动的AI办公助手
Context Autopilot是由Context公司推出的一款AI办公助手,旨在通过先进的人工智能技术提升工作效率。它能够像人类一样思考、学习,并使用用户习惯工具来完成...
HeyGen正在开放HeyGen API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人
HeyGen正在开放API,通过HeyGen API,企业能够使用生动的虚拟人视频提升平台的互动性,转化原本单-的内容为更加吸引用户的动态体验。
字节跳动发布AI图像编辑工具:SeedEdit无需专业图片处理技能 一句话即可实现P图
SeedEdit是一个AI图像编辑工具,由Doubao团队开发。它的特殊之处在于,可以根据用户输入的文字指令直接对图像进行编辑
NVIDIA推出的Al Blueprint:可以帮你观看数小时的视频并提供摘要总结和问答
NVIDIA推出的Al Blueprint, 这是一套用于构建视觉A!代理的框架,帮助开发者构建视频理解和摘要功能的解决方案。 Blueprint利用生成式AI、视觉语言模型(VLM)...
Google正式推出Gemini Al驱动的视频演示应用 Vids通过简单提示即可生成视频演示
Google正式推出了其Gemini Al驱动的视频演示应用程序Vids,用户可以通过简单的提示生成视频演示。