Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用
i团队重磅LLM研究!简单指令:「Wait,」就能有效激发LLM显式反思,表现堪比直接告知模型存在错
强化学习之父当头一棒:RL版「苦涩的教训」来了!通往ASI,绝非靠人类数据
Mind强化学习副总裁David Silver对我们发出了当头棒喝:如今,人类已经由数据时代踏入经验
AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据
德州大学奥斯汀分校的研究团队使用Transformer和离线强化学习训练出一个宝可梦对战智能体,它能利用人类历史对战数据进行学习,并在全球排名中取得前10%的成绩。
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
加州AI博士一夜失身份!谷歌OpenAI学者掀「离美潮」,38万岗位消失AI优势崩塌
有过犯罪记录,但在美国深造之路已被斩断。许多OpenAI、谷歌的顶尖学者都透露在考虑离开美国。这场A
硅谷AI初创要让60亿人失业,网友痛批人类叛徒!Jeff Dean已投
新创公司Mechanize旨在通过AI智能体全面自动化所有工作和经济,目标市场规模达60万亿美元。该公司已获多家投资,并计划用虚拟环境和强化学习训练数据来实现这一目标。然而,这一计划引发了广泛...
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型
谷歌新模型Gemini 2.5 Flash在高尔顿板测试中表现出色,击败多个AI模型。其性能超越Gemini 2.5 Pro,并被认为是对AI编码的重大突破。
DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制
乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek