新智元-创奇社-第4页

2432311

新智元

这家伙很懒，什么都没有写...

发布73

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

新智元报道，o4系模型满血版o3、o4-mini及o4-mini high下周发布；OpenAI正准备开源一款强大模型。奥特曼称将开发强大开源模型回应DeepSeek，并计划在科学和软件开发领域实现重大突破。

行业动态 # 100万 # 通用人工智能 # Optimus Alpha

32天前

080

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

：在美国数学奥赛，顶级AI模型得分不足5%！来自ETH Zurich等机构的MathArena团队，

行业动态 # 人工智能 # 强化学习 # 数学推理

42天前

080

苹果AI首秀，竟然只有跑马灯是真的！长文揭秘苹果彻底搞砸AI

承诺将成为iPhone的「超级大脑」。然而，仅仅九个月后，内部技术方向的反复摇摆和高管间的矛盾让这一

行业动态 # Siri # AI/ML团队 # Craig Federighi

32天前

080

只因论文「碰瓷」，ICLR 2025区域主席直接拒稿！最强rebuttal，赢回荣耀

ICLR 2025会议一篇关于'模型崩溃'的研究因未引用同年COLM会议论文而遭拒稿，作者最终成功通过rebuttal被选为亮点论文。该研究揭露了合成数据对AI模型的潜在威胁，引发学术界广泛关注...

行业动态 # ICLR 2025 # 透明度 # COLM 2024

31天前

070

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛结果出炉，英伟达团队以14B小模型破解34道题目获胜。清华团队获得第二名。比赛奖金高达211.7152万美元，英伟达团队获第一名，总奖金26.2144万美元。

行业动态 # 英伟达 # 14B # 26.2144万

32天前

070

AI席卷校园：百万条对话揭秘，Claude是代码救星还是作弊工具？

一项针对百万条学生对话的分析显示，AI在编程、润色文章等方面帮助大学生学习。但学术诚信边界问题凸显，研究发现理工科学生使用Claude的比例远高于实际学士学位比例。

行业动态 # 100万 # 33.5%# 39.3%

32天前

050

GPT-4.1全网实测来袭，惨遭谷歌Gemini碾压！大佬猜测：从GPT-4.5蒸馏的

1，实力究竟如何？在众多实测中，它的表现的确可圈可点，但却依然打不过Gemini 2.5 Pro和C

行业动态 # OpenAI # GPT-4.1 # 推理速度

29天前

040

AI审稿首次席卷ICLR 2025，12222条建议被接受！30页技术报告公开

ICLR 2025首次大规模引入AI参与审稿，12222条建议被采纳，提升了89%的评审质量。研究发现，AI能有效改进模糊和不具体的评论，并提高作者与审稿人的互动。

行业动态 # ICLR 2025 # 12222条 # 80个词

29天前

040

MIT惊人神作：AI独立提出哈密顿物理！0先验知识，一天破译人类百年理论

k团队，再出重磅力作。他们发现：AI能够在没有任何先验知识的情况下，完全独立地提出哈密顿物理量，或拉

行业动态 # MASS # 一致性 # 双摆系统

29天前

030

Claude终于能Research了！打通谷歌全家桶，工作效率10倍提升

Anthropic推出Claude两项新功能：Research可快速检索网络和内部文件，与Google Workspace集成让用户无缝调用Gmail、日历和文档信息。

行业动态 # AI助手 # Anthropic # 10倍

29天前

020

谷歌AI成功破解海豚语，海洋版ChatGPT来了！掀人类跨物种交流革命

谷歌发布DolphinGemma大模型，基于30年海豚研究数据训练，能识别并预测海豚声音模式，参数仅400M，可在普通手机上运行。这是人类首次能够与动物进行实时交流的AI模型。

行业动态 # 谷歌 # 语言模型 # 400M参数

26天前

010

视频推理R1时刻，7B模型反超GPT-4o！港中文清华推出首个Video-R1

港中文和清华团队推出Video-R1模型，首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集，Video-R1在视频空间推理测试中超越了GPT-4o，并且全部代码和数据集...

行业动态 # 35.8%准确率 # 7B参数规模 # 强化学习R1范式

29天前

010

上一页 1 2 34