斯坦福大学、华盛顿大学研究：1000 个 AI 智能体预测人类行为，准确率最高可达 85%

2024-11-25 发布浏览729次点赞0次收藏0次

11 月 25 日消息，据 The Decoder 今日报道，斯坦福大学、华盛顿大学和 Google DeepMind 的研究人员联合开发了一种 AI 智能体（AI Agent，也称“AI 代理”），能够在社会实验中逼真地模拟人类行为。

研究指出，这类模拟系统可以作为一个虚拟实验室，帮助验证经济学、社会学、组织学和政*科学中的理论。研究团队通过对 1000 多名具有代表性的美国人（覆盖多种年龄、性别、教育背景和政*立场）进行访谈，建立了这些 AI 智能体模型。

斯坦福大学、华盛顿大学研究：1000 个 AI 智能体预测人类行为，准确率最高可达 85%

系统运行方式是将详细的访谈记录与 GPT-4o 模型结合。当用户向智能体提问时，系统会加载访谈记录并让 AI 模仿受访者的回答。为生成这些记录，研究团队对每位受访者进行了长达两小时的访谈，并通过 OpenAI 的 Whisper 技术将对话转录成文本。

研究团队设计了多个测试，评估 AI 对人类行为的预测能力，涵盖《通用社会调查》、大五人格评估以及若干行为经济学实验。

结果显示，基于访谈数据的 AI 在预测社会调查（GSS）问题时，准确率高达 85%，远超单纯依赖人口统计信息的 AI 智能体。

斯坦福大学、华盛顿大学研究：1000 个 AI 智能体预测人类行为，准确率最高可达 85%

研究团队在五项社会科学实验中测试了人类与 AI 的表现，其中四项研究显示，AI 的结果与人类高度一致。相关系数高达 0.98，表明 AI 对人类行为有极强的模拟能力。

斯坦福大学、华盛顿大学研究：1000 个 AI 智能体预测人类行为，准确率最高可达 85%

与传统的人口统计法相比，访谈驱动的 AI 显示出显著的优势，尤其是在处理不同种族群体和政*观点的预测时更加准确，同时也能有效减少人口统计类别之间的偏差。

研究团队已将包含 1000 个 AI 模型的数据集开放至 GitHub，并建立了两层访问机制。综合性数据对研究人员完全开放，而个别参与者的详细数据则需经过特殊审批。

附数据集地址：

GPT 代理测试 4 OpenAI Go 4o 人工智能智能体 Google AI

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！