博客 | 第 8 页 | Ai导航站

Deepgram推出了全新的AI语音代理API能够进行实时自然的语音对话

Deepgram推出了全新的AI语音代理API，这是一个统一的语音对话API，旨在让AI代理能够进行自然的对话。该API依赖于快速的语音识别和语音合成模型，支持实时的语...

文章

8个月前

ChatGPT的高级语音模式或将于本月24日被OpenAI公司正式推出，这一重大更新或将为人工智能语音交互领域带来革命性变化。

文章

8个月前

Veo模型将被YouTube Shorts引入Google DeepMind，它允许创作者制作6秒的独立视频片段，并将AI生成的背景与现有视频结合，扩展视觉创意。

文章

8个月前

Runway宣布推出其视频生成模型的API。该API旨在帮助开发者和公司将Runway的生成式AI模型集成到第三方平台、应用程序和服务中。

文章

8个月前

OpenAl在其最新AI模型o1(具有“思考”和“增强推理”能力，擅长解决科学、编码和数学等领域的复杂任务)的“预览”版本发布后，透露其具有“中等”风险，特别是对于制...

文章

8个月前

Suno推出Covers功能，通过Cover功能，你可以将任何音频，从简单的录音到完整制作的歌曲，转化为一种全新的风格，同时保留原有的旋律。我们的最新功能已经在早...

文章

8个月前

Adobe预览了三项新的 AI 视频生成功能，这些功能由其正在开发的 Firefly 视频模型（于 4 月演示）提供支持，将于今年年底投入使用。 “生成延长”功能可将视频...

文章

8个月前

Vchitect 2.0是由上海人工智能实验室开发的视频生成模型，它支持通过文本和图像生成5 到 20 秒的高清短视频，用户可以灵活调整视频的宽高比。该模型集成了超...

文章

8个月前

Vidu升级其 AI视频模型，支持让任意主体保持一致，的、重点在于在生成图像时保持主体的一致性，尤其是针对角色和物体类输入的图像

文章

8个月前

Concept Sliders是一种用于扩散模型(如 Stable Diffusion)的LORA 适配器，允许用户在图像生成过程中对特定概念进行精细控制。与依赖提示词生成图像的传统方法...

文章

8个月前