最新更新第469页
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
今日头条热点视频项目, AI一键成片,2分钟一条原创视频,新手也能轻松日入几张
今日头条热点视频项目, AI一键成片,2分钟一条原创视频,新手也能轻松日入几张 项目介绍: 今日头条和其他平台不一样,对创作者分成计划门槛特别低。新号没粉丝也能参加,不用实名就能开通微视...
速递|AI编程白热化,OpenAI计划30亿美元收购Windsurf,竞争自家投资的Cursor
Windsurf开发者与OpenAI洽谈收购事宜,交易金额约为30亿美元。若交易达成,OpenAI将直接竞争AI编程助手市场,并可能危及Cursor基金信誉。
UC伯克利:让推理模型少思考,准确率反而更高了!
UC伯克利研究发现,强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型,在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。
速递|GPT-5前的最后冲锋?OpenAI亮出o3与o4-mini双模型,实现“用图像思考”
OpenAI发布O3和O4-mini两款新型AI推理模型,声称在数学、编程、推理、科学及视觉理解能力测试中超越此前所有模型。
生数科技副总裁:多模态技术定将催生全新内容平台,实现完全个性化、实时可控、可交互|中国AIGC产业峰会
多模态生成技术推动AI视频创作新阶段,生数科技产品副总裁廖谦分享了其对于多模态大模型终局的看法及应用场景。视频生成领域迎来黄金发展期,预计2024年将出现重大突破。
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...
OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维
姚顺雨指出AI发展分为上半场和下半场。上半场以模型和方法为主,而下半场的重点转向如何定义现实任务并有效评估AI的表现。他强调强化学习已能泛化,并提出新的评估规则来解决当前局限性。
实现“双杀”!中国大模型竞争力排名出炉:第一名是他
阿里在2025年中国商用大模型厂商评估中连续两年被评为领导者,并在模型能力和执行能力两大核心维度上排名第一。Omdia报告显示,阿里不仅在技术层面领先,还因其生态建设和商业化优势实现全面领...
腾讯史上最大就业计划技术岗超六成,大厂加码AI人才校招
腾讯启动史上最大就业计划,加大技术类岗位招聘;字节跳动和阿里也扩大了AI人才招聘规模。多家大厂针对人工智能领域展开大规模校园招聘,期待应聘者携带相关成果或项目专利。
新赛道,deepseek+即梦AI做育儿类视频,5分钟一条,单日轻松变现多张
新赛道,deepseek+即梦AI做育儿类视频,5分钟一条,单日轻松变现多张 最近加我的人特别多,被问爆的问题就是:AI怎么用来赚钱?这方面我确实懂一些。直接带你们上手操作我的变现方法,流程简单...