新智元-创奇社-第4页

2432311

新智元

这家伙很懒，什么都没有写...

发布73

2025 CSRankings排名出炉！上交大、清华北大、浙大霸榜全球AI TOP 10

2025年CSRankings公布，卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三，北京大学位居第五。中国高校在AI领域表现突出，包揽全球前十中的六席。

33天前

0140

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta发布的新模型Llama 4引发质疑，代码能力不佳且存在作弊嫌疑。内部员工爆料称在训练过程中曾混入多个基准测试集以获得良好表现。多位AI研究人员指出Llama 4的表现远逊于SOTA模型，网友普遍对...

行业动态 # Meta # 4月底 # Qwen-QwQ-32B

33天前

090

浙大校友重磅革新Transformer！多token注意力让LLM开挂，错误率归0

Meta FAIR团队提出多token注意力机制（MTA），利用键-查询卷积和头混合卷积，显著提升Transformer模型的性能。通过结合不同查询和键信息，实现精准的信息处理，解决传统注意力机制在复杂信息检...

行业动态 # 880M参数 # Meta FAIR # Tianlu Wang

33天前

090

Gemini 2.5连续屠榜，谷歌突然换帅！19年老将立即卸任

谷歌AI团队调整领导层，由Google Labs负责人Josh Woodward接管Gemini团队。此举显示谷歌正重新思考其在人工智能战略布局，并可能推出新产品以对抗OpenAI。

行业动态 # 谷歌 # AI战略布局 # AI模型（Gemini）

33天前

090

DeepMind闭关修炼「我的世界」，自学成才挖钻登Nature！人类玩家瑟瑟发抖

谷歌DeepMind的DreamerV3在《我的世界》中无需人类数据自主完成钻石收集任务，标志着AI向通用人工智能（AGI）又迈进了一步。

行业动态 # 强化学习 # 通用人工智能 # DeepMind

33天前

0100

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

PERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，

行业动态 # 深度学习模型 # CUDA平台 # MI300X

33天前

0110

o3狂烧3万美金解一题，反被AGI榜单除名！试错1024次不如10岁小孩哥4分钟

OpenAI的o3推理模型成本从预估的3000美元飙升至3万美元，远超预期。尽管o3-high试图通过暴力试错生成大量文本解答问题，但被ARC-AGI系统排除在外，因为每个任务的成本高达3万美元。

行业动态 # OpenAI # o3 # 推理模型

33天前

0120

被哥大开除后，他靠AI作弊神器年入千万！血洗硅谷大厂拿遍offer成功创业

小哥，最近有新后续了：创业成功，月入22.85万美元，走上人生巅峰。与此同时，大厂的面试官们可是被

行业动态 # ChatGPT # Interview Coder # vibe coding

33天前

090

英伟达253B开源新王登场，Llama 4三天变陪衬！直逼DeepSeek-R1成推理天花板

ma Nemotron-253B推理模型，在数学编码、科学问答中准确率登顶，甚至以一半参数媲美Dee

行业动态 # 复杂任务 # 253B模型 # Llama 3.1

34天前

0200

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

enAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀

行业动态 # OpenAI # PaperBench # Claude-3.5-Sonnet

40天前

0110

75年后，图灵测试终被GPT-4.5破解！73%人类被骗过，彻底输给AI

模型，证明LLM已通过图灵测试。什么？AI竟然通过了标准的三方图灵测试，而且还是拿出了实打实证据的

行业动态 # 大型语言模型 # Eliza # 图灵测试

40天前

0100

2024 AAAS Fellow揭晓！中科大校友熊莉、清华校友林希虹等华人学者上榜

2024年度AAAS Fellow名单公布，共有471位杰出科学家入选。信息计算通信领域有3名华人学者上榜，包括腾讯原杰出科学家刘威、纽约城市学院教授田英利及埃默里大学教授熊莉等。物理学和统计学领域...

行业动态 # IAPR Fellow # IEEE Fellow # 刘威

40天前

090

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

：在美国数学奥赛，顶级AI模型得分不足5%！来自ETH Zurich等机构的MathArena团队，

行业动态 # 人工智能 # 强化学习 # 数学推理

40天前

080

上一页 1 2 34