GPT-4通过图灵测试?
测试过程
1.对话进行:
参与者在不知道代理人身份的情况下与四个代理人分别进行五分钟的对话
代理人包括一个人类和三个AI模型,
2.对话设置:
对话通过一个模拟常规消息应用的界面进行
从质询者发送第一条消息,每次对话持续5分钟,或直到询者做出判断。
每条消息限制在300字符以内,参与者不能粘贴内容。
3.判断任务:
”对话结束后,参与者需要判断他们是否在与人类或AI交谈。
参与者根据对话内容和代理人的表现作出判断。
结果分析:
GPT-4被认为是人类的概率为54%。
ELIZA被认为是人类的概率为22%。
实际人类被认为是人类的概率为67%。
体验地址:https://aitool8.com/sites/499.html
© 版权声明
文章版权归作者所有,未经允许请勿转载。