创奇社 - AI 与 DeepSeek 前沿资讯・资源・课程平台-最新发布-第158页

最新更新第158页

更新

浏览

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

扩散模型通过新框架d1实现推理功能，结合监督微调与新颖策略梯度方法diffu-GRPO提升数学和逻辑推理能力。

机器之心24天前

0488

近40年前「拉马努金图」概率的赌局，被姚班校友黄骄阳等三位数学家用物理方法终结

20 世纪 80 年代末，在洛桑的一次会议上，两位数学家 Noga Alon 和 Peter Sa

行业动态 # Wigner普遍性猜想 # 完美扩展图 # 循环方程

机器之心24天前

04011

合成数据也能通吃真实世界？首个融合重建-预测-规划的生成式世界模型AETHER开源

上海人工智能实验室开源生成式世界模型AETHER，首次实现大模型在真实世界中的3D空间决策与规划能力。通过「重建-预测-规划」一体化框架和几何空间建模，大幅提升模型空间推理的准确性与一致性，...

行业动态 # 上海人工智能实验室 # AETHER # 三维空间决策

机器之心24天前

0498

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

mba架构，使长文本推理速度提升3倍，同时还能保持高性能，开源版本包括8B和56B尺寸。训练过程采用

行业动态 # 推理速度 # 注意力机制 # Mamba-2

新智元24天前

0446

杀疯了！Gemini 2.5狂飙「高尔顿板」测试，编码横扫所有OpenAI模型

谷歌新模型Gemini 2.5 Flash在高尔顿板测试中表现出色，击败多个AI模型。其性能超越Gemini 2.5 Pro，并被认为是对AI编码的重大突破。

行业动态 # 谷歌 # Gemini-2.5-Pro # Dayhush

新智元24天前

0369

AI版本宝可梦冲榜上全球前10%！一次性「吃掉」10年47.5万场人类对战数据

德州大学奥斯汀分校的研究团队使用Transformer和离线强化学习训练出一个宝可梦对战智能体，它能利用人类历史对战数据进行学习，并在全球排名中取得前10%的成绩。

行业动态 # Transformer # Metamon平台 # PokeShowdown回放数据集

新智元24天前

03414

奥特曼的“上帝情结”：TED创始人质疑他为何有权塑造人类未来

与创造的是一项将要重塑我们整个物种命运的技术，那么你做这件事的伦理依据和权威性来源是什么？如果你搞错

行业动态

AI前线24天前

0307

ICLR 2025｜上海创智学院人才交流会，等您来～

ICLR 2025即将开幕，上海创智学院首次亮相。作为全新的高等教育科研机构，致力于培养新一代信息技术高端人才，并将举办人才交流闭门会等活动。

行业动态 # 2.7万平方米 # 2025年4月25日 # 上海创智学院

机器之心24天前

0437

OpenAI爆出硬伤，强化学习是祸首！o3越强越「疯」，幻觉率狂飙

在一个致命问题：幻觉率高达33%，是o1的两倍。Ai2科学家直指，RL过度优化成硬伤。满血o3更强

行业动态 # OpenAI # o3模型 # RLHF

新智元24天前

0265

硅谷AI初创要让60亿人失业，网友痛批人类叛徒！Jeff Dean已投

新创公司Mechanize旨在通过AI智能体全面自动化所有工作和经济，目标市场规模达60万亿美元。该公司已获多家投资，并计划用虚拟环境和强化学习训练数据来实现这一目标。然而，这一计划引发了广泛...

行业动态 # Reinforcement Learning # Benchmark Testing # Mechanize

新智元24天前

04210

全球首个“人机半马”比赛刷屏，2035年人形机器人市场规模超4000亿元｜

亿。据主办方19日晚公布的最新数据，在21.0975公里长的赛道上，北京人形机器人创新中心研制的天

行业动态 # 人形机器人 # 市场需求 # 技术融合

钛媒体AGI24天前

03115

清华张亚勤：10年后，机器人将可能比人都多

张亚勤在新书《智能涌现》中预测，未来10年后机器人可能比人都多，并进入家庭。AI技术正从“数字化3.0”升级，发展方向包括大模型、自动驾驶和生物智能。他提出了五大趋势和发展方向，强调统一...

行业动态 # 大模型 # 生成式人工智能 # L4级别

量子位24天前

0206

具身空间数据技术的路线之争：合成重建VS全端生成

在太高，于是，合成数据的技术就显得尤为重要。目前，具身合成数据有两条主要技术路线之争： “视频合成

行业动态 # 高效学习 # 研究成果 # 交流互动

量子位24天前

0256

清华姚班大牛，OpenAI姚顺雨：AI的下半场要像产品经理一样思考，RL算法取决于环境

、o‑系列模型已经把“智能”从棋盘和试卷一路卷到代码、创作甚至电脑屏幕背后的每一次点击清华姚班出

行业动态 # 机器学习 # 姚顺雨 # 真实效用

AI寒武纪24天前

03511

推理模型其实无需「思考」？伯克利发现有时跳过思考过程会更快、更准确

通过增加推理时的计算量提升性能时，加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹：别

行业动态 # 数学推理 # 大型语言模型 # NoThinking

机器之心24天前

0509

语音合成突破：F5R-TTS首次实现非自回归模型的GRPO优化，零样本克隆性能显著提升

最新研究提出F5R-TTS系统，通过概率化输出和GRPO优化方法成功将强化学习整合到非自回归TTS中，显著提升语音合成质量。

行业动态 # 强化学习 # F5R-TTS # Text-to-Speech

机器之心24天前

0336

英特尔®具身智能大小脑融合方案发布：构建具身智能落地新范式

英特尔在2025年推出具身智能方案，该方案基于英特尔酷睿Ultra处理器和全新软件开发套件，实现高效整合感知、交互、任务规划和运动控制等功能。

行业动态 # 具身智能 # 英特尔 # AI加速框架

机器之心24天前

02114

仅需0.4GB，参数只有0和±1！微软开源首个原生1 bit模型，CPU轻松跑

58 2B4T，将低精度与高效能结合，开创了AI轻量化的新纪元。通过精心设计的推理框架，BitNet

行业动态 # 大规模语言模型 # 20亿参数 # 2B4T

新智元24天前

05112

OpenAI CFO重磅曝料：AGI近在咫尺，全球最强编程智能体已就绪！

riar探讨了通往AGI的发展路径，目前OpenAI已到达第三阶段：智能体（Agnent）。除Ope

行业动态 # 5000亿美元 # 10吉瓦 # 4亿用户

新智元24天前

0488

马斯克炫酷变身毒液！实测通义Wan2.1首尾帧视频模型，还能“拼接”经典梗图

阿里通义万相Wan2.1最新版发布，基于首尾帧技术能生成流畅、连贯的5s/720p视频。模型参数规模达到百亿级，支持在官网和多个开源平台使用。实测显示其表现优秀，具备较强的主体一致性、前后连贯...

行业动态 # 亿参数规模 # 便捷推理 # 写实风格

量子位24天前

03215

上一页 1…156 157158159 160…196 下一页跳转