最新研究显示,GPT-4在图形推理任务上仅有33%准确率,引发了对其图形处理能力的关注。研究者使用ConceptARC数据集测试,结果显示人类在同一任务上的平均准确率为91%,远高于GPT-4。研究方法引发质疑,包括受试者招募和输入方式,突显大型语言模型在某些任务上的局限性,呼吁深入审视研究方法。
本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/22312
该文观点仅代表作者本人,平台仅提供信息存储空间服务。
[db:摘要]
最新研究显示,GPT-4在图形推理任务上仅有33%准确率,引发了对其图形处理能力的关注。研究者使用ConceptARC数据集测试,结果显示人类在同一任务上的平均准确率为91%,远高于GPT-4。研究方法引发质疑,包括受试者招募和输入方式,突显大型语言模型在某些任务上的局限性,呼吁深入审视研究方法。
本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/22312
该文观点仅代表作者本人,平台仅提供信息存储空间服务。