返回

多家大模型测不出9.11和9.9哪个大

2024-07-18内容来源第一财经

在当今这个数字化、智能化的时代,人工智能(AI)大模型的应用已经渗透到了我们生活的方方面面。从智能语音助手到自动翻译软件,再到复杂的数据分析和预测,AI大模型正以其独特的优势改变着我们的工作和生活方式。然而,近期一道看似简单的小学生数学题,却难倒了一众海内外知名的AI大模型,这不禁让人对AI的数学能力产生了疑问。

这道题目要求比较两个小数的大小:9.11和9.9,哪个更大?对于人类来说,这是一个再简单不过的数学问题,只需要一眼就能看出答案。然而,当这个问题被抛给12个不同的AI大模型时,结果却令人大跌眼镜。阿里通义千问、百度文心一言、Minimax和腾讯元宝这四个大模型正确地回答了问题,但剩下的8个大模型(ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量)却纷纷给出了错误的答案。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

电脑版

站长百科

猜你感兴趣

  • 向日葵
    向日葵
    金来沅,姜石范,韩正洙,池大韩,郑恩彪,金海淑,金秉玉,韩国电影,姜石范
  • 虾米音乐
    虾米音乐
    2021年2月5日关停,阿里巴巴
  • 八佰
    八佰
    黄志忠,欧豪,王千源,姜武,张译,杜淳,魏晨,李晨,俞灏明
  • 寄生虫
    寄生虫
    寄生上流,上流寄生族,奉俊昊,剧情电影,韩国电影,宋康昊,李善均,赵茹珍,崔宇植,朴素丹
  • 重生之门
    重生之门
    张译,王俊凯,潘粤明,张国强,冯文娟,范诗然,徐悦,兰海蒙,田小洁,尹铸胜,江柏萱,曹克难,刘岳,赵秦
  • 大家都在看

  • 回响
    回响
    宋佳,王阳,包贝尔,吴优,朱雨辰,董洁,啜妮,侯雯元,刘冠麟,刘凯,常仕欣
  • ofo小黄车
    ofo小黄车
    共享单车出行平台
  • 古田路9号
    古田路9号
    品牌创意版权保护平台
  • 中学历史教学园地
    中学历史教学园地
    全国文章总量、访问量最大的历史教学网站
  • 内蒙古广播电视台
    内蒙古广播电视台
    蒙语广播电视,内蒙古广播电视台,IMRTS,内蒙古卫视