新智元的头像-创奇社
这家伙很懒,什么都没有写...
2025 CSRankings排名出炉!上交大、清华北大、浙大霸榜全球AI TOP 10-创奇社

2025 CSRankings排名出炉!上交大、清华北大、浙大霸榜全球AI TOP 10

2025年CSRankings公布,卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三,北京大学位居第五。中国高校在AI领域表现突出,包揽全球前十中的六席。
Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅-创奇社

Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅

Meta发布的新模型Llama 4引发质疑,代码能力不佳且存在作弊嫌疑。内部员工爆料称在训练过程中曾混入多个基准测试集以获得良好表现。多位AI研究人员指出Llama 4的表现远逊于SOTA模型,网友普遍对...
浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0-创奇社

浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

Meta FAIR团队提出多token注意力机制(MTA),利用键-查询卷积和头混合卷积,显著提升Transformer模型的性能。通过结合不同查询和键信息,实现精准的信息处理,解决传统注意力机制在复杂信息检...
Gemini 2.5连续屠榜,谷歌突然换帅!19年老将立即卸任-创奇社

Gemini 2.5连续屠榜,谷歌突然换帅!19年老将立即卸任

谷歌AI团队调整领导层,由Google Labs负责人Josh Woodward接管Gemini团队。此举显示谷歌正重新思考其在人工智能战略布局,并可能推出新产品以对抗OpenAI。
DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖-创奇社

DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖

谷歌DeepMind的DreamerV3在《我的世界》中无需人类数据自主完成钻石收集任务,标志着AI向通用人工智能(AGI)又迈进了一步。
AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量-创奇社

AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量

PERT_NUMBER==256),并积极利用共享内存(5kB LDS)和寄存器(52 VGPRs,
o3狂烧3万美金解一题,反被AGI榜单除名!试错1024次不如10岁小孩哥4分钟-创奇社

o3狂烧3万美金解一题,反被AGI榜单除名!试错1024次不如10岁小孩哥4分钟

OpenAI的o3推理模型成本从预估的3000美元飙升至3万美元,远超预期。尽管o3-high试图通过暴力试错生成大量文本解答问题,但被ARC-AGI系统排除在外,因为每个任务的成本高达3万美元。
被哥大开除后,他靠AI作弊神器年入千万!血洗硅谷大厂拿遍offer成功创业-创奇社

被哥大开除后,他靠AI作弊神器年入千万!血洗硅谷大厂拿遍offer成功创业

小哥,最近有新后续了:创业成功, 月入22.85万美元,走上人生巅峰。与此同时,大厂的面试官们可是被
英伟达253B开源新王登场,Llama 4三天变陪衬!直逼DeepSeek-R1成推理天花板-创奇社

英伟达253B开源新王登场,Llama 4三天变陪衬!直逼DeepSeek-R1成推理天花板

ma Nemotron-253B推理模型,在数学编码、科学问答中准确率登顶,甚至以一半参数媲美Dee
Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子-创奇社

Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子

enAI最新框架PaperBench正为此生,让AI智能体从头开始复现ICML 2024 20篇优秀
75年后,图灵测试终被GPT-4.5破解!73%人类被骗过,彻底输给AI-创奇社

75年后,图灵测试终被GPT-4.5破解!73%人类被骗过,彻底输给AI

模型,证明LLM已通过图灵测试。 什么?AI竟然通过了标准的三方图灵测试,而且还是拿出了实打实证据的
2024 AAAS Fellow揭晓!中科大校友熊莉、清华校友林希虹等华人学者上榜-创奇社

2024 AAAS Fellow揭晓!中科大校友熊莉、清华校友林希虹等华人学者上榜

2024年度AAAS Fellow名单公布,共有471位杰出科学家入选。信息计算通信领域有3名华人学者上榜,包括腾讯原杰出科学家刘威、纽约城市学院教授田英利及埃默里大学教授熊莉等。物理学和统计学领域...
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭-创奇社

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,