激光网
当前位置: 首页 > 人工智能 > 正文

消息称ChatGPT答数学题正确率从98%骤降至2%

2023-07-21 16:06:03  来源:激光网原创    

  人工智能(AI)是今年科技行业最热门的事物,不过发展似乎进入了瓶颈期,研究发现,OpenAI的ChatGPT发布的最新模型GPT-4,在某些问题上的表现,竟比在3月时还要来得差,其中在回答基础数学问题的正确率,更是从98%下降到只剩2%。

  根据斯坦福大学的1项研究发现,ChatGPT在执行某些任务的能力存在剧烈波动,该研究调查了GPT-3.5和GPT-4这2个模型,其中GPT-4在解决基础数学问题上存在明显变化。

  研究人员发现,GPT-4在3月被问到17077是否为质数的问题时,回答正确率来到97.6%,不过到了6月,同样问题的回答正确率掉到只剩2.4%。 与此同时,GPT-3.5的状况完全相反,3月时对同一问题的正确率仅为7.4%,6月时则来到86.8%。

  当研究人员要求ChatGPT写code或是进行视觉推理测试时,也出现了类似的不同结果。 3月和6月、以及2个模型的巨大差异,不仅反映出了模型在执行特定任务的准确性,也反映了模型在某一方面的变化,对其他部份产生了不可预测的影响。

  史丹佛大学计算机科学教授James Zuo表示,当我们调整大型语言模型,以提高其在某些任务上的性能时,实际上可能会产生很多意想不到的后果,这实际上可能会损害该模型在其他任务上的性能。

  James Zuo表示,模型该如何回答问题,存在各种有趣的相关依赖性,这可能导致了我们观察到的一些恶化的行为。

  由于GPT-4没有开源,James Zuo表示,因此我们也不知道模型本身、神经架构或是训练数据哪个环节,产生了怎么样的变化。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com