排序
刚刚,谷歌最强Gemini 2.5 Pro免费了,数学碾压人类研究生,拿下全球TOP 1
刚刚,谷歌最强Gemini 2.5 Pro免费了,数学碾压人类研究生,拿下全球TOP 1 虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用...
谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍,谷歌版MCP一统AI智能体宇宙
谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍,谷歌版MCP一统AI智能体宇宙 谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌...
AI 版《猫和老鼠》刷爆外网!零剪辑自动生成,60 秒神作刷新 AI 视频天花板
伯克利、斯坦福联合英伟达的研究成功生成了长达一分钟的流畅视频,且保持一致性和故事完整性。通过引入测试时训练层提升扩散Transformer模型能力,实现了复杂的多场景故事生成。研究使用《猫和...
前阿里机器人高管创业、获数千万种子轮融资,聚焦L4级具身智能技术应用|硬氪首发
前阿里机器人高管创业、获数千万种子轮融资,聚焦L4级具身智能技术应用|硬氪首发 作者|黄楠 编辑|袁斯来 硬氪获悉,杭州影身智能技术有限公司(以下简称「影身智能」)近日连续完成数千万元...
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...
硅谷AI初创要让60亿人失业,网友痛批人类叛徒!Jeff Dean已投
新创公司Mechanize旨在通过AI智能体全面自动化所有工作和经济,目标市场规模达60万亿美元。该公司已获多家投资,并计划用虚拟环境和强化学习训练数据来实现这一目标。然而,这一计划引发了广泛...
谷歌入局AI眼镜,昔日智能眼镜鼻祖,要靠AI+AR再赢一次?
谷歌入局AI眼镜,昔日智能眼镜鼻祖,要靠AI+AR再赢一次? 2025 年的今天,AI 眼镜越发成为焦点,或许我们可以大胆地猜测,未来的 AI 助手不是藏在手机 App 里,而是戴在你脸上、看你所看、答你...
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...