DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制
乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度
关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。 大语言模型
强化学习之父当头一棒:RL版「苦涩的教训」来了!通往ASI,绝非靠人类数据
Mind强化学习副总裁David Silver对我们发出了当头棒喝:如今,人类已经由数据时代踏入经验
加州AI博士一夜失身份!谷歌OpenAI学者掀「离美潮」,38万岗位消失AI优势崩塌
有过犯罪记录,但在美国深造之路已被斩断。许多OpenAI、谷歌的顶尖学者都透露在考虑离开美国。这场A
硅谷AI初创要让60亿人失业,网友痛批人类叛徒!Jeff Dean已投
新创公司Mechanize旨在通过AI智能体全面自动化所有工作和经济,目标市场规模达60万亿美元。该公司已获多家投资,并计划用虚拟环境和强化学习训练数据来实现这一目标。然而,这一计划引发了广泛...
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型
谷歌新模型Gemini 2.5 Flash在高尔顿板测试中表现出色,击败多个AI模型。其性能超越Gemini 2.5 Pro,并被认为是对AI编码的重大突破。
诺奖得主Hassabis豪言:AI十年治愈所有疾病!哈佛教授警告AGI终结人类文明
疾病。这是谷歌DeepMind掌门人Demis Hassabis在最新采访中最大胆的预测。与此同时,
Claude竟藏着3307种「人格」?深扒70万次对话,这个AI会看人下菜碟
ude能根据场景切换人格:谈恋爱时化身情感导师,聊历史时秒变严谨学者。一些对话中,它强烈支持用户价值