微软推出炸裂的Copilot Vision功能 可实时监控你的上网行为 随时提供AI帮助
微软推出全新的Copilot Vision功能,它通过嵌入到 Edge 浏览器中,提供实时网页内容分析和互动。 它可以通过与用户的网页浏览同步,实时监控你的网页浏览行为...
月之暗面出海遇阻:Kimi赚钱难题下新模型k0-math能否破局
怎么赚钱?特别是他们的C端工具Kimi,虽然投放了不少广告,但用户似乎并不太买账。
OpenAl首席产品官:ChatGPT网页端本周引入高级语音模式
早在今年9月,OpenAl就首次展示了ChatGPT的语音功能。但当时,这一功能仅限于 i0S 和 Android应用。高级语音模式依托最新的 GPT-40模型,具备原生音频处理能...
OpenAl押注的1X明示下一步:NEOBeta——让机器人跑起来
1X公司AI副总裁为机器人求跑步机,暗示研发进程。其主推人形机器人NEOBeta,已展示烹饪等家务潜力,未来望包揽家务,目前正收集数据,将在挪威工厂大规模生产。
NVIDIA发布一款音乐生成模型:Fugatto可以对声音生成与转换进行精细化控制
NVIDIA发布了一款音乐生成人工智能模型:Fugatto。通过简单的文本提示或音频输入,用户可以创作全新的声音景观或修改已有的声音元素。例如,用户可以通过文字...
Anthropic发布了MCP「模型上下文协议」Model Context Protocol无缝连接本地和远程数据源
Anthropic发布了Model Context Protocol (MCP),一个旨在将AI助手与数据源(如本地内容存储库、业务工具、开发环境)无缝连接的开放标准。该协议通过改善AI获取...
Runway推出了全新的图像生成模型:Frames能够生成统一美学的多样化变体图像
Runway推出了最新的图像生成模型Frames,该模型以卓越的风格一致性和视觉真实感为特色,为创作者提供了前所未有的风格控制能力。它不仅能够设定项目的特定视...
Runway推出视频扩展工具:Expand Video可以无缝的为视频扩展画面
Runway推出的一项创新视频编辑工具:Expand Video 。能够无缝转换横向视频为竖向视频,反之亦然无需牺牲画面细节或使用模糊背景。使它通过生成新区域将视频转...
ChatGPT-4o登顶大模型竞技场,OpenAl重夺第一宝座
在OpenAI开发者日新加坡站活动中,ChatGPT再次展现了其强大的竞争力。最新版本的ChatGPT-4o(以下简称40)在更新后,成功击败了此前排名第一的谷歌Gemini,重新...
Mistral Al发布了全新的Pixtral Large开源模型 超越GPT-40、Gemini-1.5 Pro和Claude-3.5 Sonnet
Mistral AI发布了全新的Pixtral large模型,这是一款具备多模态能力的开源模型,基于Mistral Large2构建,参数量达到1240亿,并进一步扩展了图像与文本理解能...