资讯文章 | 第 4 页

HeyGen正在开放HeyGen API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen正在开放API，通过HeyGen API，企业能够使用生动的虚拟人视频提升平台的互动性，转化原本单-的内容为更加吸引用户的动态体验。

文章

12个月前

字节跳动发布AI图像编辑工具:SeedEdit无需专业图片处理技能一句话即可实现P图

SeedEdit是一个AI图像编辑工具，由Doubao团队开发。它的特殊之处在于，可以根据用户输入的文字指令直接对图像进行编辑

文章

12个月前

NVIDIA推出的Al Blueprint:可以帮你观看数小时的视频并提供摘要总结和问答

NVIDIA推出的Al Blueprint，这是一套用于构建视觉A!代理的框架，帮助开发者构建视频理解和摘要功能的解决方案。 Blueprint利用生成式AI、视觉语言模型(VLM)...

文章

12个月前

Google正式推出Gemini Al驱动的视频演示应用 Vids通过简单提示即可生成视频演示

Google正式推出了其Gemini Al驱动的视频演示应用程序Vids，用户可以通过简单的提示生成视频演示。

文章

12个月前

苹果正式推出集成AppleIntelligence新框架和Siri Siri可以实时读取你屏幕信息并执行操作

苹果正式推出集成Siri和Apple Inteligence新框架:App Intents ，允许开发者在 i0S 18.2+、mac0S 15.2+等平台上，让其应用的屏幕内容可被 siri和Apple Intelli...

文章

12个月前

X-Portrait 2:由字节跳动开发可将任意视频角色的表情和动作转移到任意对象的技术

X-Portrait2是一款基于深度学习的高效人像动画生成工具。用户只需提供一张静态的肖像图和一个带有表情和动作的“驱动视频'，X-Portrait2就可以将视频中的表情...

文章

12个月前

Fish Audio发布语音到语音模型Fish AgentV0.1 3B实现“即时”语音克隆

Fish Audio发布高级语音处理模型Fish Agent V0.1 3B，它是一个语音到语音模型，它可以高效、精确地生成和处理语音，尤其适合模拟或克隆不同的声音。该模型是...

文章

1年前 (2024)

Layouts新功能只需设计一次图像动画自动适应屏幕大小和各种布局

Rive引入的新功能Layouts为设计师和开发者提供了一种方法，可以在各种设备上创建动态、响应式的动画图形，同时保持Rive标志性的交互性和动画流畅性，

文章

1年前 (2024)

Recraft发布其最新图像生成模型:RecraftV3可精确处理复杂长文本和手指等解剖学细节

Recraft推出了其最新的图像生成模型--Recraft V3，通过引入设计语言思维，Recraft V3能够在图像生成领域超越所有主要竞争对手。 Recraft V3能够在生成图像时...

文章

1年前 (2024)

Claude 3.5新功能支持对100页的PDF图像、图表和图形进行可视化分析

Claude 3.5 Sonnet发布PDF图像预览新功能，允许用户分析长度不超过100页的PDF中的视觉内容此功能使用户能够轻松上传文档并提取信息，特别适用于包含图表、图...

文章

1年前 (2024)

AItool8-AI未来已来

标签：资讯文章

HeyGen正在开放HeyGen API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

字节跳动发布AI图像编辑工具:SeedEdit无需专业图片处理技能一句话即可实现P图

NVIDIA推出的Al Blueprint:可以帮你观看数小时的视频并提供摘要总结和问答

Google正式推出Gemini Al驱动的视频演示应用 Vids通过简单提示即可生成视频演示

苹果正式推出集成AppleIntelligence新框架和Siri Siri可以实时读取你屏幕信息并执行操作

X-Portrait 2:由字节跳动开发可将任意视频角色的表情和动作转移到任意对象的技术

Fish Audio发布语音到语音模型Fish AgentV0.1 3B实现“即时”语音克隆

Layouts新功能只需设计一次图像动画自动适应屏幕大小和各种布局

Recraft发布其最新图像生成模型:RecraftV3可精确处理复杂长文本和手指等解剖学细节

Claude 3.5新功能支持对100页的PDF图像、图表和图形进行可视化分析