标签:资讯文章

HeyGen正在开放HeyGen API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen正在开放API,通过HeyGen API,企业能够使用生动的虚拟人视频提升平台的互动性,转化原本单-的内容为更加吸引用户的动态体验。

字节跳动发布AI图像编辑工具:SeedEdit无需专业图片处理技能 一句话即可实现P图

SeedEdit是一个AI图像编辑工具,由Doubao团队开发。它的特殊之处在于,可以根据用户输入的文字指令直接对图像进行编辑

NVIDIA推出的Al Blueprint:可以帮你观看数小时的视频并提供摘要总结和问答

NVIDIA推出的Al Blueprint, 这是一套用于构建视觉A!代理的框架,帮助开发者构建视频理解和摘要功能的解决方案。 Blueprint利用生成式AI、视觉语言模型(VLM)...

Google正式推出Gemini Al驱动的视频演示应用 Vids通过简单提示即可生成视频演示

Google正式推出了其Gemini Al驱动的视频演示应用程序Vids,用户可以通过简单的提示生成视频演示。

苹果正式推出集成AppleIntelligence新框架和Siri Siri可以实时读取你屏幕信息并执行操作

苹果正式推出集成Siri和Apple Inteligence新框架:App Intents ,允许开发者在 i0S 18.2+、mac0S 15.2+等平台上,让其应用的屏幕内容可被 siri和Apple Intelli...

X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术

X-Portrait2是一款基于深度学习的高效人像动画生成工具。用户只需提供一张静态的肖像图和一个带有表情和动作的“驱动视频',X-Portrait2就可以将视频中的表情...

Fish Audio发布语音到语音模型Fish AgentV0.1 3B实现“即时”语音克隆

Fish Audio发布高级语音处理模型Fish Agent V0.1 3B,它是一个语音到语音模型,它可以高效、精确地生成和处理语音,尤其适合模拟或克隆不同的声音。 该模型是...

Layouts新功能 只需设计一次 图像动画自动适应屏幕大小和各种布局

Rive引入的新功能Layouts为设计师和开发者提供了一种方法,可以在各种设备上创建动态、响应式的动画图形,同时保持Rive标志性的交互性和动画流畅性,

Recraft发布其最新图像生成模型:RecraftV3可精确处理复杂长文本和手指等解剖学细节

Recraft推出了其最新的图像生成模型--Recraft V3,通过引入设计语言思维,Recraft V3能够在图像生成领域超越所有主要竞争对手。 Recraft V3能够在生成图像时...

Claude 3.5新功能支持对100页的PDF图像、图表和图形进行可视化分析

Claude 3.5 Sonnet发布PDF图像预览新功能,允许用户分析长度不超过100页的PDF中的视觉内容 此功能使用户能够轻松上传文档并提取信息,特别适用于包含图表、图...
1 2 3 4 5 6 14