0penAl开发了一种名为 CriticGPT的模型,该模型基于 GPT-4,用于帮助发现 ChatGPT 生成代码中的错误。CriticGPT 会对 ChatGPT 的回答进行批评,指出其中的错误,这样可以帮助人工训练师更有效地发现问题,并在从人类反馈中进行强化学习(RLHF)时提高准确性。通过将 CriticGPT整合到 RLHF 标注流程中,可以增强 A 生成的批评的准确性和全面性,从而改进 ChatGPT的整体表现和对齐度。
人类评估的局限性:当前的LLM模型如ChatGPT等,在生成复杂代码时,即使是经验丰富的专家也难以可靠地评估其输出的质量和正确性。CriticGPT通过训练模型生成自然语言评论,帮助人类更准确地评估代码,从而弥补了人类评估的局限性。
提高错误检测能力:模型生成的代码往往包含错误,这些错误可能未被人类评估者发现。CriticGPT在检测这些错误方面表现出色,研究发现其检测到的错误数量比人类承包商更多。
减少偏见和幻觉:虽然CriticGPT也有可能产生幻觉错误,但通过与人类合作(即人机合作团队),能够显著减少这些幻觉,同时保持高效的错误检测能力。
原文:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
© 版权声明
文章版权归作者所有,未经允许请勿转载。
暂无评论...