新智元-创奇社-第3页

2432311

新智元

这家伙很懒，什么都没有写...

发布73

浙大校友重磅革新Transformer！多token注意力让LLM开挂，错误率归0

Meta FAIR团队提出多token注意力机制（MTA），利用键-查询卷积和头混合卷积，显著提升Transformer模型的性能。通过结合不同查询和键信息，实现精准的信息处理，解决传统注意力机制在复杂信息检...

33天前

090

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta发布的新模型Llama 4引发质疑，代码能力不佳且存在作弊嫌疑。内部员工爆料称在训练过程中曾混入多个基准测试集以获得良好表现。多位AI研究人员指出Llama 4的表现远逊于SOTA模型，网友普遍对...

行业动态 # Meta # 4月底 # Qwen-QwQ-32B

33天前

090

2025 CSRankings排名出炉！上交大、清华北大、浙大霸榜全球AI TOP 10

2025年CSRankings公布，卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三，北京大学位居第五。中国高校在AI领域表现突出，包揽全球前十中的六席。

行业动态 # 清华大学 # 浙江大学 # 上海交通大学

33天前

0140

LLM幻觉，竟因知识「以大欺小」！华人团队祭出对数线性定律与CoDA策略

，揭示、预测并减少幻觉！通过实验，研究人员揭示了LLM的知识如何相互影响，总结了幻觉的对数线性定律。

行业动态 # 自然语言处理 # Coda # 伊利诺伊大学厄巴纳-香槟分校

33天前

0120

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

证了SSL在多模态任务中的潜力，证明其在扩展模型和数据规模后，能媲美甚至超越CLIP。这项研究为无语

行业动态 # David Fan # Peter Tong # Web-DINO

33天前

0110

英伟达253B开源新王登场，Llama 4三天变陪衬！直逼DeepSeek-R1成推理天花板

ma Nemotron-253B推理模型，在数学编码、科学问答中准确率登顶，甚至以一半参数媲美Dee

行业动态 # 复杂任务 # 253B模型 # Llama 3.1

34天前

0200

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

：在美国数学奥赛，顶级AI模型得分不足5%！来自ETH Zurich等机构的MathArena团队，

行业动态 # 人工智能 # 强化学习 # 数学推理

40天前

080

英伟达华人AI版《猫和老鼠》爆火全网，60秒经典泪目！仅靠Transformer新增一层

TTT打造了一分钟视频生成器，让汤姆和杰瑞的追逐战延续到全新篇章，技术与经典的完美碰撞，你准备好迎接

行业动态 # 开源代码 # 扩散模型 # TTT-MLP

32天前

08250

谷歌最强AI芯片狙击英伟达B200，性能狂飙3600倍！谷歌版MCP一统AI智能体宇宙

推理设计，性能较从初代飙升3600倍，可与英伟达B200一较高下。不仅如此，谷歌还带来了Veo 2等

行业动态 # A2A协议 # Ironwood # TPU

32天前

090

预训练还没终结！港中文清华等提出「三位一体」框架，持续自我进化

化和后训练协同，引入自生成数据闭环和结构化感知推理机制，实现模型自我进化，为大模型发展提供新思路。

行业动态 # SICOG # 多模态预训练 # 幻觉控制能力

32天前

0110

ChatGPT解锁完整记忆，奥特曼彻夜难眠！所有聊天记录黑历史AI全知道

失眠。然而，更大惊喜在后面——GPT-4.1、o3、o4系模型或许将在下周发布。昨晚，奥特曼一则预

行业动态 # OpenAI # GPT-4.1 # 记忆功能

32天前

080

AI看柯南2分钟揪真凶，商汤600B多模态MoE推理封神！交互记忆全线升级

互、长记忆能力拉满。更惊人的是，这个模型彻底了实现文本、图像和视频的原生融合，看一段几分钟柯南视频，

行业动态 # 大模型 # 机器人 # 商汤

30天前

0120

爆火全网《猫和老鼠》背后模型竟是这家国产AI！掀二创风暴GitHub破万星

新智元报道编辑：编辑部 HZN 最近英伟达等机构爆火全网的《猫和老鼠》，背后模型被扒出来了——竟是来自智谱国产大模型CogVideoX-5B！论文地址：https://test-time-training.github.io/video-d...

行业动态 # 768×1360 # CogVideoX-5B # 复杂动态场景

30天前

0110

谷歌Veo 2震撼升级，一键get好莱坞级视觉盛宴！全网实测，帧帧丝滑

谷歌Veo 2通过移除背景、插值等功能实现了视频创作的升级，展示了从海底慢动作漂浮到战场史诗旋转的各种创意场景。它能够将普通点子转化为专业级大片效果，吸引了大量用户分享实测作品。

行业动态 # Freepik AI Suite # Google Veo 2 # MayorkingAl

30天前

0130

AI代码成屎山，公司倒闭开发者崩溃！商业媒体被AI全锅端，裁掉全体编辑

发者对AI代码深恶痛绝，领导却格外喜欢，好在公司几个月后就倒闭了；艺术家表示，这是对我专业能力的侮辱

行业动态 # Midjourney # 教育 # AI CEO

30天前

0120

Claude 4六个月内发布！Anthropic联创Kaplan：AGI两三年内到来

Anthropic联合创始人兼首席科学家Jared Kaplan预测人类水平AI可能在2-3年内实现。Kaplan认为模型智能提升、上下文窗口扩展以及强化学习使AI能力快速扩展，Claude 4将在六个月内发布，DeepSeek等...

行业动态 # Anthropic # AGI # Claude 3.7

30天前

0100

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

aQuery新方法，让多模态模型瞬间解锁多模态生成能力！令人惊讶的是，这种方法竟然如此简单，就实现了

行业动态 # 语言模型 # 多模态生成 # 博士生

30天前

0100

苹果AI首秀，竟然只有跑马灯是真的！长文揭秘苹果彻底搞砸AI

承诺将成为iPhone的「超级大脑」。然而，仅仅九个月后，内部技术方向的反复摇摆和高管间的矛盾让这一

行业动态 # Siri # AI/ML团队 # Craig Federighi

30天前

080

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛结果出炉，英伟达团队以14B小模型破解34道题目获胜。清华团队获得第二名。比赛奖金高达211.7152万美元，英伟达团队获第一名，总奖金26.2144万美元。

行业动态 # 英伟达 # 14B # 26.2144万

30天前

070

吉卜力爆红背后，关键推手另有其人！GPT-4o竟封奥特曼为AGI之王

AI名流化身卡牌游戏，GPT-4o创造的AGI霸主奥特曼、吉卜力风全家福引爆网络；纽约客文章揭示背后最大功臣是亚马逊前工程师Grant Slatton。

行业动态 # 100万 # GPT-4o # AI版三国杀

30天前

090