排序
刚刚,谷歌最强Gemini 2.5 Pro免费了,数学碾压人类研究生,拿下全球TOP 1
刚刚,谷歌最强Gemini 2.5 Pro免费了,数学碾压人类研究生,拿下全球TOP 1 虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用...
谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍,谷歌版MCP一统AI智能体宇宙
谷歌最强AI芯片狙击英伟达B200,性能狂飙3600倍,谷歌版MCP一统AI智能体宇宙 谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌...
AI 版《猫和老鼠》刷爆外网!零剪辑自动生成,60 秒神作刷新 AI 视频天花板
伯克利、斯坦福联合英伟达的研究成功生成了长达一分钟的流畅视频,且保持一致性和故事完整性。通过引入测试时训练层提升扩散Transformer模型能力,实现了复杂的多场景故事生成。研究使用《猫和...
前阿里机器人高管创业、获数千万种子轮融资,聚焦L4级具身智能技术应用|硬氪首发
前阿里机器人高管创业、获数千万种子轮融资,聚焦L4级具身智能技术应用|硬氪首发 作者|黄楠 编辑|袁斯来 硬氪获悉,杭州影身智能技术有限公司(以下简称「影身智能」)近日连续完成数千万元...
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...
硅谷AI初创要让60亿人失业,网友痛批人类叛徒!Jeff Dean已投
新创公司Mechanize旨在通过AI智能体全面自动化所有工作和经济,目标市场规模达60万亿美元。该公司已获多家投资,并计划用虚拟环境和强化学习训练数据来实现这一目标。然而,这一计划引发了广泛...
AI大模型“淘金热”退潮,“卖铲者”狂欢
AI大模型“淘金热”退潮,“卖铲者”狂欢 当大家都去挖金矿时,卖铲子的最赚钱。 在19世纪的美国加州,无数怀揣财富梦想的人涌入金矿,却鲜有人意识到,真正赚得盆满钵满的并非矿工,而是那些贩...
长江存储获“六个核桃”生产商跨界投资16亿元,估值或超1600亿
养元饮品宣布向国产存储芯片‘龙头’长江存储的母公司长控集团投资16亿元,持股0.99%,若按照估值计算约为1616亿人民币,此举有助于公司探索股权投资模式并提升业绩水平。
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...