新智元的头像-创奇社
这家伙很懒,什么都没有写...
奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek-创奇社

奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

新智元报道,o4系模型满血版o3、o4-mini及o4-mini high下周发布;OpenAI正准备开源一款强大模型。奥特曼称将开发强大开源模型回应DeepSeek,并计划在科学和软件开发领域实现重大突破。
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭-创奇社

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,
苹果AI首秀,竟然只有跑马灯是真的!长文揭秘苹果彻底搞砸AI-创奇社

苹果AI首秀,竟然只有跑马灯是真的!长文揭秘苹果彻底搞砸AI

承诺将成为iPhone的「超级大脑」。然而,仅仅九个月后,内部技术方向的反复摇摆和高管间的矛盾让这一
只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀-创奇社

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

ICLR 2025会议一篇关于'模型崩溃'的研究因未引用同年COLM会议论文而遭拒稿,作者最终成功通过rebuttal被选为亮点论文。该研究揭露了合成数据对AI模型的潜在威胁,引发学术界广泛关注...
AI奥数大奖出炉,英伟达摘桂冠!14B破解34题暴击DeepSeek R1-创奇社

AI奥数大奖出炉,英伟达摘桂冠!14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛结果出炉,英伟达团队以14B小模型破解34道题目获胜。清华团队获得第二名。比赛奖金高达211.7152万美元,英伟达团队获第一名,总奖金26.2144万美元。
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?-创奇社

AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?

一项针对百万条学生对话的分析显示,AI在编程、润色文章等方面帮助大学生学习。但学术诚信边界问题凸显,研究发现理工科学生使用Claude的比例远高于实际学士学位比例。
GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的-创奇社

GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的

1,实力究竟如何?在众多实测中,它的表现的确可圈可点,但却依然打不过Gemini 2.5 Pro和C
AI审稿首次席卷ICLR 2025,12222条建议被接受!30页技术报告公开-创奇社

AI审稿首次席卷ICLR 2025,12222条建议被接受!30页技术报告公开

ICLR 2025首次大规模引入AI参与审稿,12222条建议被采纳,提升了89%的评审质量。研究发现,AI能有效改进模糊和不具体的评论,并提高作者与审稿人的互动。
MIT惊人神作:AI独立提出哈密顿物理!0先验知识,一天破译人类百年理论-创奇社

MIT惊人神作:AI独立提出哈密顿物理!0先验知识,一天破译人类百年理论

k团队,再出重磅力作。他们发现:AI能够在没有任何先验知识的情况下,完全独立地提出哈密顿物理量,或拉
Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升-创奇社

Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升

Anthropic推出Claude两项新功能:Research可快速检索网络和内部文件,与Google Workspace集成让用户无缝调用Gmail、日历和文档信息。
谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命-创奇社

谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命

谷歌发布DolphinGemma大模型,基于30年海豚研究数据训练,能识别并预测海豚声音模式,参数仅400M,可在普通手机上运行。这是人类首次能够与动物进行实时交流的AI模型。
视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1-创奇社

视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1

港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集...