OpenAl正在开发代号为“Strawberry”的新模型可自主浏览互联网并自主推理

文章1年前 (2024)更新 admin

456 0 0

Strawberry 项目的详细细节
“Strawberry”项目原名为 Q*，据报道，去年已被公司内部视为一项突破。内部文档显示团队正致力于此，但其工作细节及公开时间未明。该项目旨在让其人工智能不仅能回答问题，还能自主可靠地浏览互联网进行深度研究。
1.项目背景和目标
项目名称:Strawberry(草莓)
目标:通过增强推理能力，使AI能够自主进行深入研究和长周期任务(LHT)，提高AI模型的智能水平
2.项目概述
启用深度研究:Strawberry项目的核心目标是使AI模型不仅能够生成答案，还能自主浏览互联网进行“深度研究”。这意味着AI将能够独立地进行信息检索和分析，并基于其发现采取行动。推理能力提升:Strawberry旨在改进AI模型的推理能力，使其能够更好地处理多步骤问题和长周期任务。这种改进将使AI模型在科学发现、软件开发等复杂领域中表现出色。
3.技术方法
后训练(Post-training):项目涉及一种特殊的后训练方法，即在模型预训练之后，通过进一步的调整和优化，提升模型的性能。这一过程包括但不限于细调(fine-tuning)，即通过人工反馈和示例调整模型的输出。
自我训练数据生成:Strawberry项目的方法类似于斯坦福大学开发的“Self-Taught Reasoner”(STaR)，通过模型自我生成训练数据，不断提高其智能水平。理论上可使语言模型超越人类智能水平。
4.内部泄露文件和开发进展
内部文档:根据内部文档，Strawberry项目已经在进行中，但具体发布日期尚未确定
“深度研究”数据集:根据0penAl的内部文件，0penAl正在创建、训练和评估模型，使用该公司称之为深度研究”数据集。Strawberry将用于执行需要长时间规划和连续行动的任务，如科学研究和软件开发

# 文章 # 资讯文章

© 版权声明

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

AI导航站丨AI工具集丨为发现全球优质AI工具产品而生

友链申请免责声明广告合作合作共赢关于我们米集网站分类目录

Copyright © 2025 Ai导航站