DeepSeek-R1模型发布,性能对标OpenAI o1正式版

文章3周前更新 admin
43 0

幻方量化旗下AI公司深度求索(DeepSeek)今日正式发布DeepSeek-R1模型,并同步开源模型权重。据官方介绍,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。DeepSeek-R1模型发布,性能对标OpenAI o1正式版DeepSeek称,R1蒸馏小模型超越OpenAI o1-mini。DeepSeek在开源 DeepSeekR1-Zero和DeepSeekR1两个660B模型的同时,通过DeepSeekR1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标 OpenAI o1-mini的效果。
DeepSeek已将DeepSeekR1训练技术全部公开,在发布并开源R1的同时,同步在协议授权层面也进行了如下调整:
模型开源License统一使用MIT。我们曾针对大模型开源的特点,参考当前行业的通行实践,特别引入DeepSeek License为开源社区提供授权,但实践表明非标准的开源 License可能反而增加了开发者的理解成本。为此,此次我们的开源仓库(包括模型权重)统一采用标准化、宽松的MIT License,完全开源,不限制商用,无需申请。
产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

© 版权声明

暂无评论

暂无评论...