最新更新第158页
扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源-创奇社

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散模型通过新框架d1实现推理功能,结合监督微调与新颖策略梯度方法diffu-GRPO提升数学和逻辑推理能力。
近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结-创奇社
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源-创奇社

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

上海人工智能实验室开源生成式世界模型AETHER,首次实现大模型在真实世界中的3D空间决策与规划能力。通过「重建-预测-规划」一体化框架和几何空间建模,大幅提升模型空间推理的准确性与一致性,...
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强-创奇社

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

mba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型-创奇社

杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型

谷歌新模型Gemini 2.5 Flash在高尔顿板测试中表现出色,击败多个AI模型。其性能超越Gemini 2.5 Pro,并被认为是对AI编码的重大突破。
AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据-创奇社

AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据

德州大学奥斯汀分校的研究团队使用Transformer和离线强化学习训练出一个宝可梦对战智能体,它能利用人类历史对战数据进行学习,并在全球排名中取得前10%的成绩。
奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来-创奇社

奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来

与创造的是一项将要重塑我们整个物种命运的技术,那么你做这件事的伦理依据和权威性来源是什么?如果你搞错
AI前线的头像-创奇社AI前线24天前
0307
ICLR 2025|上海创智学院人才交流会,等您来~-创奇社

ICLR 2025|上海创智学院人才交流会,等您来~

ICLR 2025即将开幕,上海创智学院首次亮相。作为全新的高等教育科研机构,致力于培养新一代信息技术高端人才,并将举办人才交流闭门会等活动。
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙-创奇社

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强
硅谷AI初创要让60亿人失业,网友痛批人类叛徒!Jeff Dean已投-创奇社

硅谷AI初创要让60亿人失业,网友痛批人类叛徒!Jeff Dean已投

新创公司Mechanize旨在通过AI智能体全面自动化所有工作和经济,目标市场规模达60万亿美元。该公司已获多家投资,并计划用虚拟环境和强化学习训练数据来实现这一目标。然而,这一计划引发了广泛...
全球首个“人机半马”比赛刷屏,2035年人形机器人市场规模超4000亿元|-创奇社

全球首个“人机半马”比赛刷屏,2035年人形机器人市场规模超4000亿元|

亿。 据主办方19日晚公布的最新数据,在21.0975公里长的赛道上,北京人形机器人创新中心研制的天
清华张亚勤:10年后,机器人将可能比人都多-创奇社

清华张亚勤:10年后,机器人将可能比人都多

张亚勤在新书《智能涌现》中预测,未来10年后机器人可能比人都多,并进入家庭。AI技术正从“数字化3.0”升级,发展方向包括大模型、自动驾驶和生物智能。他提出了五大趋势和发展方向,强调统一...
具身空间数据技术的路线之争:合成重建VS全端生成-创奇社

具身空间数据技术的路线之争:合成重建VS全端生成

在太高,于是,合成数据的技术就显得尤为重要。 目前,具身合成数据有两条主要技术路线之争: “视频合成
清华姚班大牛,OpenAI姚顺雨:AI的下半场要像产品经理一样思考,RL算法取决于环境-创奇社

清华姚班大牛,OpenAI姚顺雨:AI的下半场要像产品经理一样思考,RL算法取决于环境

、o‑系列 模型已经把“智能”从棋盘和试卷一路卷到代码、创作甚至电脑屏幕背后的每一次点击 清华姚班出
推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确-创奇社

推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确

通过增加推理时的计算量提升性能时,加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹: 别
语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升-创奇社

语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升

最新研究提出F5R-TTS系统,通过概率化输出和GRPO优化方法成功将强化学习整合到非自回归TTS中,显著提升语音合成质量。
英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式-创奇社

英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式

英特尔在2025年推出具身智能方案,该方案基于英特尔酷睿Ultra处理器和全新软件开发套件,实现高效整合感知、交互、任务规划和运动控制等功能。
仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑-创奇社

仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑

58 2B4T,将低精度与高效能结合,开创了AI轻量化的新纪元。通过精心设计的推理框架,BitNet
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!-创奇社

OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!

riar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agnent)。除Ope
马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图-创奇社

马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图

阿里通义万相Wan2.1最新版发布,基于首尾帧技术能生成流畅、连贯的5s/720p视频。模型参数规模达到百亿级,支持在官网和多个开源平台使用。实测显示其表现优秀,具备较强的主体一致性、前后连贯...