让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度
关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。 大语言模型
DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制
乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实
玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役
视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1
港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集...
Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升
Anthropic推出Claude两项新功能:Research可快速检索网络和内部文件,与Google Workspace集成让用户无缝调用Gmail、日历和文档信息。
AI审稿首次席卷ICLR 2025,12222条建议被接受!30页技术报告公开
ICLR 2025首次大规模引入AI参与审稿,12222条建议被采纳,提升了89%的评审质量。研究发现,AI能有效改进模糊和不具体的评论,并提高作者与审稿人的互动。
诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!
表示,通过AI,DeepMind团队在一年里,完成了10亿年的博士研究时间!10亿年的科学探索被压缩