但现在都直接给答案。” “AI永远‘温柔顺从’,孩子沉浸在这样的对话中,会失去处理真实矛盾的机会。”
2025-04-17 34

抖音上线了安全与信任中心网站,公开推荐算法原理、用户行为逻辑及风险识别等内容,以提升透明度回应公众质疑。
2025-04-17 39

是发生在帕西尼感知科技(深圳)有限公司的一幕。与市面上大多数追求“能走会跑”的人形机器人不同,这家位
2025-04-17 28

互联网大厂如腾讯、字节跳动和阿里正在扩大对AI技术人才的招聘力度,以应对生成式AI的兴起。
2025-04-17 32

腾讯启动史上最大就业计划,加大技术类岗位招聘;字节跳动和阿里也扩大了AI人才招聘规模。多家大厂针对人工智能领域展开大规模校园招聘,期待应聘者携带相关成果或项目专利。
2025-04-17 48

阿里在2025年中国商用大模型厂商评估中连续两年被评为领导者,并在模型能力和执行能力两大核心维度上排名第一。Omdia报告显示,阿里不仅在技术层面领先,还因其生态建设和商业化优势实现全面领先。
2025-04-17 28

姚顺雨指出AI发展分为上半场和下半场。上半场以模型和方法为主,而下半场的重点转向如何定义现实任务并有效评估AI的表现。他强调强化学习已能泛化,并提出新的评估规则来解决当前局限性。
2025-04-17 32

中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上表现不佳,最优模型仅获得62.8的CoT得分和56.7%的准确率。
2025-04-17 52

基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。 可图2.
2025-04-17 52

多模态生成技术推动AI视频创作新阶段,生数科技产品副总裁廖谦分享了其对于多模态大模型终局的看法及应用场景。视频生成领域迎来黄金发展期,预计2024年将出现重大突破。
2025-04-17 29

OpenAI发布O3和O4-mini两款新型AI推理模型,声称在数学、编程、推理、科学及视觉理解能力测试中超越此前所有模型。
2025-04-17 40

UC伯克利研究发现,强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型,在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。
2025-04-17 40

昨天,OpenAI 放出了自家最强推理模型 o3 和 o4 mini ,但这可能还不是这个月最重磅的
2025-04-17 48

Windsurf开发者与OpenAI洽谈收购事宜,交易金额约为30亿美元。若交易达成,OpenAI将直接竞争AI编程助手市场,并可能危及Cursor基金信誉。
2025-04-17 57

、姜子上、王昕奕等同学共同参与完成。 GPT - 4o、Deepseek - R1 等高级模型已展现
2025-04-17 65

UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
2025-04-17 54

近日,大连理工大学与莫纳什大学的研究团队提出VLIPP框架,通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因,并提出两阶段方法,利用视觉语言模型预测运动路径,再用细粒度的视频扩散模型生成符合物理规则的视频。
2025-04-17 46

玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役
2025-04-17 45

伯克利联合英伟达提出PS3视觉编码器,首次在4K超高分辨率下高效预训练,并引入高分辨率基准测试集4KPro。该方法显著提升了高清场景下的表现和效率。
2025-04-17 37

字节跳动发布豆包1.5·深度思考模型,采用MoE架构,参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平,具备‘边想边搜’、视觉理解等实用能力。
2025-04-17 40
没有账号?注册  忘记密码?