Strawberry 项目的详细细节
“Strawberry”项目原名为 Q*,据报道,去年已被公司内部视为一项突破。内部文档显示团队正致力于此,但其工作细节及公开时间未明。该项目旨在让其人工智能不仅能回答问题,还能自主可靠地浏览互联网进行深度研究。
1.项目背景和目标
项目名称:Strawberry(草莓)
目标:通过增强推理能力,使AI能够自主进行深入研究和长周期任务(LHT),提高AI模型的智能水平
2.项目概述
启用深度研究:Strawberry项目的核心目标是使AI模型不仅能够生成答案,还能自主浏览互联网进行“深度研究”。这意味着AI将能够独立地进行信息检索和分析,并基于其发现采取行动。推理能力提升:Strawberry旨在改进AI模型的推理能力,使其能够更好地处理多步骤问题和长周期任务。这种改进将使AI模型在科学发现、软件开发等复杂领域中表现出色。
3.技术方法
后训练(Post-training):项目涉及一种特殊的后训练方法,即在模型预训练之后,通过进一步的调整和优化,提升模型的性能。这一过程包括但不限于细调(fine-tuning),即通过人工反馈和示例调整模型的输出。
自我训练数据生成:Strawberry项目的方法类似于斯坦福大学开发的“Self-Taught Reasoner”(STaR),通过模型自我生成训练数据,不断提高其智能水平。理论上可使语言模型超越人类智能水平。
4.内部泄露文件和开发进展
内部文档:根据内部文档,Strawberry项目已经在进行中,但具体发布日期尚未确定
“深度研究”数据集:根据0penAl的内部文件,0penAl正在创建、训练和评估模型,使用该公司称之为深度研究”数据集。Strawberry将用于执行需要长时间规划和连续行动的任务,如科学研究和软件开发
© 版权声明
文章版权归作者所有,未经允许请勿转载。
暂无评论...