基于 DIT 视频生成架构,能够快速从文本和图像生成高质量、逼真的视频。这款高效的变压器模型直接通过视频进行训练,能够生成物理准确、一致且充满事件的镜头。
快手最新发布的国产视频生成大模型“可灵”大模型,采用了类似Sora的技术路线,并结合了多项自研技术创新,能够生成时长超过120秒、分辨率高达1080p的视频,且能够精准建模复杂运动和物理特性
专门为对话场景设计的文本到语音TTS模型,支持中英文,
基于GLM模型开发,支持多轮对话,具备内容创作、信息归纳总结等能力
Llama 3是Meta公司最新推出的一款开源大型语言模型
SenseTime Tech Day是商汤科技举办的一场人工智能技术交流盛会,将展示最新的人脸识别、图像识别、语音识别等技术,并提供合作机会。
一款基于百度领先的NLP、KG、多模态AI技术的智能创作平台,为媒体工作者提供一站式的内容生产服务和工具,帮助他们快速找到创作灵感、提高内容质量,提升工作效率。
通义官网,致力于实现类人智慧的通用智能
ModelScope社区是一个汇聚最先进机器学习模型的开源社区,提供模型探索、推理、训练、部署和应用的一站式服务。
一个集算法选型、创意分享、模型实验和大模型在线体验为一体的AI学习与实践社区,提供多个强大的大模型,满足不同领域的需求。
国内领先的智能文本处理专家,提供多种产品和解决方案,帮助企业实现文档智能审阅、智能知识管理和智能搜索等功能。
华为云推出的一款面向行业的大模型,包含NLP、CV、多模态、预测和科学计算等功能,可广泛应用于各行各业,助力行业AI升级。
一款全方位的人工智能模型服务平台,提供模型训练、推理、评测、精调等功能与服务,助力模型提供方和使用者实现商业新增长。
由Open AI开发的文本转视频的模型,能够生成复杂场景、理解语言并创建多个镜头。它可以帮助红队成员评估安全风险,并为创意专业人士提供反馈。
一款具备亿级数据预训练的语言模型,可以创新性地生成和交互数字内容,满足丰富的对话诉求。
一站式企业级大模型平台,提供先进的生成式AI生产及应用全流程开发工具链,支持文本生成、图像生成、文本表示、代码生成等多个领域的应用。