量子位的头像-创奇社
这家伙很懒,什么都没有写...
无需数据标注!测试时强化学习,模型数学能力暴增 清华&上海AI Lab-创奇社

无需数据标注!测试时强化学习,模型数学能力暴增 清华&上海AI Lab

清华和上海AI Lab团队通过测试时强化学习方法,提升模型数学能力159%,在多个数据集上表现显著。
最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了-创奇社

最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了

基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。 可图2.
清华张亚勤:10年后,机器人将可能比人都多-创奇社

清华张亚勤:10年后,机器人将可能比人都多

张亚勤在新书《智能涌现》中预测,未来10年后机器人可能比人都多,并进入家庭。AI技术正从“数字化3.0”升级,发展方向包括大模型、自动驾驶和生物智能。他提出了五大趋势和发展方向,强调统一...
北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断-创奇社

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

)技术迅速崛起,正成为推动数字内容创作革新的关键力量,特别是在游戏、影视、虚拟现实和工业设计等领域表
19天前
04410
生数科技副总裁:多模态技术定将催生全新内容平台,实现完全个性化、实时可控、可交互|中国AIGC产业峰会-创奇社

生数科技副总裁:多模态技术定将催生全新内容平台,实现完全个性化、实时可控、可交互|中国AIGC产业峰会

多模态生成技术推动AI视频创作新阶段,生数科技产品副总裁廖谦分享了其对于多模态大模型终局的看法及应用场景。视频生成领域迎来黄金发展期,预计2024年将出现重大突破。
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机-创奇社

3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机

(3DGS)成为新一代高效三维建模技术,它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 202
21天前
0475
MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会-创奇社

MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会

科学领域正经历一场静默的革命。传统的特征工程、模型训练与迭代优化流程,正被智能化的研发助手所改变。
UC伯克利:让推理模型少思考,准确率反而更高了!-创奇社

UC伯克利:让推理模型少思考,准确率反而更高了!

UC伯克利研究发现,强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型,在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。
本周三15:00!🤓机器人与数字化转型应用解析,线上研讨会诚邀你来围观-创奇社

本周三15:00!🤓机器人与数字化转型应用解析,线上研讨会诚邀你来围观

本周三下午3:00,赞奇科技将在线上举办研讨会,分享企业数字化转型的具体细节。研讨内容包括行业场景调研、人才投入、硬件和软件投入策略等。研讨会邀请了服务多家企业的实战团队参加。
电视装了智能体,只凭台词就能找到剧集了-创奇社

电视装了智能体,只凭台词就能找到剧集了

酷开科技发布的新款智能体,包括影音、生活、教育、健康、创作和设备六类。其中影音智能体能帮助用户搜索电影及电视剧,生活智能体则能在大屏上完成旅行计划,并支持音乐搜索等功能;教育智能体...
突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知-创奇社

突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知

哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型'选择性失明'的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力...
21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真-创奇社

21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真

530万美元融资了呀! 21岁小哥(称他为小李)这几天公布了一则喜讯,他们初创公司Cluely获得来
智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!-创奇社

智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!

灵地上演了。 坐标上海车展,在长安马自达新车发布之际,车上的 智能座舱 竟然成了大亮点之一。 因为速
深圳又出了个智能机器人:DeepSeek加持,全球首款全域全身VLA-创奇社

深圳又出了个智能机器人:DeepSeek加持,全球首款全域全身VLA

新一代通用智能机器人AlphaBot 2在学习能力和自主执行任务方面表现出色,能够360°感知周围环境并完成多种复杂任务。智平方与华熙生物达成合作,将机器人应用于生物科技领域。
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者-创奇社

清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者

网刷屏。 Magi-1 ,首个实现顶级画质输出的 自回归视频生成模型 , 模型权重、代码100%开源
21天前
0296
质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025-创奇社

质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
飞猪AI意外出圈!邀请码被黄牛倒卖,分分钟搞定机酒预订,堪比专业定制团队-创奇社

飞猪AI意外出圈!邀请码被黄牛倒卖,分分钟搞定机酒预订,堪比专业定制团队

要又要」的旅行悖论,真要被AI解决了。这个垂直赛道终于杀出黑马! 五一这不是要到了,这几天小红书上旅
数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 中国AIGC产业峰会-创奇社

数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 中国AIGC产业峰会

降低,一个关键问题浮现在每一位企业决策者面前: 如何让AI真正成为企业的“智慧大脑”,驱动业务决策全
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!-创奇社

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾图文理解与图像生成任务,并在多个权威评测中取得领先性能表现。
纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归-创奇社

纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归

基于Transformer的自回归视觉生成模型在图像生成领域的表现受到了质疑。然而,复旦大学和字节Seed的研究者们提出了一种新方法SimpleAR,在0.5B参数规模下实现了高质量图像的生成,并通过优化训...