ElevenLabs构建语言对话AI代理的功能 可使用其语音模型接入AI模型
ElevenLabs 宣布其开发者平台新增了创建对话式AI代理的功能。 这项新功能允许开发者平台上构建对话式AI代理,支持自定义变量,如语调、响应长度等。
月之暗面发布k0-math推理模型,对标OpenAIo1系列
月之暗面推k0-math模型,数学能力超OpenAlo1系列模型。Kimi探索版创新搜索体验。k0math和Kimi探索版将分批上线Kimi网页版和APP,助力解决数学和搜索调研任务...
Context Autopilot:全球首个上下文引擎驱动的AI办公助手
Context Autopilot是由Context公司推出的一款AI办公助手,旨在通过先进的人工智能技术提升工作效率。它能够像人类一样思考、学习,并使用用户习惯工具来完成...
HeyGen正在开放HeyGen API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人
HeyGen正在开放API,通过HeyGen API,企业能够使用生动的虚拟人视频提升平台的互动性,转化原本单-的内容为更加吸引用户的动态体验。
字节跳动发布AI图像编辑工具:SeedEdit无需专业图片处理技能 一句话即可实现P图
SeedEdit是一个AI图像编辑工具,由Doubao团队开发。它的特殊之处在于,可以根据用户输入的文字指令直接对图像进行编辑
NVIDIA推出的Al Blueprint:可以帮你观看数小时的视频并提供摘要总结和问答
NVIDIA推出的Al Blueprint, 这是一套用于构建视觉A!代理的框架,帮助开发者构建视频理解和摘要功能的解决方案。 Blueprint利用生成式AI、视觉语言模型(VLM)...
Google正式推出Gemini Al驱动的视频演示应用 Vids通过简单提示即可生成视频演示
Google正式推出了其Gemini Al驱动的视频演示应用程序Vids,用户可以通过简单的提示生成视频演示。
苹果正式推出集成AppleIntelligence新框架和Siri Siri可以实时读取你屏幕信息并执行操作
苹果正式推出集成Siri和Apple Inteligence新框架:App Intents ,允许开发者在 i0S 18.2+、mac0S 15.2+等平台上,让其应用的屏幕内容可被 siri和Apple Intelli...
X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术
X-Portrait2是一款基于深度学习的高效人像动画生成工具。用户只需提供一张静态的肖像图和一个带有表情和动作的“驱动视频',X-Portrait2就可以将视频中的表情...
Fish Audio发布语音到语音模型Fish AgentV0.1 3B实现“即时”语音克隆
Fish Audio发布高级语音处理模型Fish Agent V0.1 3B,它是一个语音到语音模型,它可以高效、精确地生成和处理语音,尤其适合模拟或克隆不同的声音。 该模型是...