Vchitect 2.0:人工智能实验室开发视频生成模型 支持生成5-20秒的高清短视频
Vchitect 2.0是由上海人工智能实验室开发的视频生成模型,它支持通过文本和图像生成5 到 20 秒的高清短视频,用户可以灵活调整视频的宽高比。该模型集成了超...
Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段
Vidu升级其 AI视频模型,支持让任意主体保持一致,的、重点在于在生成图像时保持主体的一致性,尤其是针对角色和物体类输入的图像
Concept Sliders:拖到滑块控制特定图像特征 如年龄、性别、眼睛大小等
Concept Sliders是一种用于扩散模型(如 Stable Diffusion)的LORA 适配器,允许用户在图像生成过程中对特定概念进行精细控制。与依赖提示词生成图像的传统方法...
Open Interpreter推出01 App能运行在各种硬件上并由语音控制来操作设备
01 App 是一个适用于 i0s 和 Android 的应用程序,旨在通过语音控制来操作设备。目标是让用户能够在短时间内开发出类似的系统,具备强大的语音识别和文本转语...
Roblox展示新的3DAI工具,实现与游戏玩法直接集成的实时世界构建
该工具旨在通过文本、视频和3D提示创建3D资产,实现与游戏玩法直接集成的实时世界构建。
OpenAI投资百亿,全球AI基建计划大揭秘!
这个项目的目标是构建一套全新的、更强大的AI基础设施。 OpenAI认为,这样的设施将成为未来AI发展的基石,为各种AI应用提供支持,从而推动整个行业的进步。
Anthropic推出企业版Claude 500K上下文,可将GitHub仓库与Claude集成
Anthropic 推出了 Claude Enterprise 计划,帮助企业安全地将内部知识与 Claude Al整合并进行协作 该计划提供了增强的功能,包括 50万字上下文窗口、更多的使...
FLUX.1-dev-LORA:一个混合现实与插画风格模型,可以生成融合了现实与插画元素图像
FLUX.1-dev-LORA是一个混合现实与插画风格模型。该模型可以生成融合了现实与插画元素的图像。它基于FLUX.1-dev基础模型进行训练,特别擅长生成前景角色为插画...
HeAR:Google利用人工智能拯救生命
谷歌推出了一种名为HeAR(健康声学表征)的生物声学 AI 模型,因此研究人员可以使用声学数据“聆听人类的声音并标记呼吸系统疾病的早期迹象”,例如结核病(TB)
微软发布AutoGen Studio:一个无需编写代码即快速构建和设计多代理的系统
AutoGen Studio是微软研究院开发的一款低代码工具,旨在帮助开发者快速原型设计、调试和评估由多个人工智能代理(Multi-Agent Systems)组成的复杂系统,类似dif...