逻辑缺陷共2篇
2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%-创奇社

2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%

日子吗? 当你在凌晨三点对着一道几何证明题抓耳挠腮、怀疑人生的时候,你可能会想:「要是有个超级大脑能
机器之心的头像-创奇社机器之心40天前
080
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭-创奇社

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,
新智元的头像-创奇社新智元40天前
080