量子位-创奇社

3671374

量子位

这家伙很懒，什么都没有写...

发布78

字节开源新生图模型：一个模型统一所有生图任务，多主体融合效果SOTA

字节团队提出UNO模型，能处理多主体图像生成任务。该模型基于FLUX改进，解决了数据可扩展性和主体可扩展性问题，并在DINO和CLIP得分上达到SOTA水平。

32天前

09520

Kimi 16B胜GPT-4o！开源视觉推理模型：MoE架构，推理时仅激活2.8B

Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking，参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口，采用宽松的MIT许可证。

行业动态 # Kimi-VL # Kimi团队 # 2.8B激活参数

32天前

09070

“谷歌版MCP”来了！开源A2A，不同厂商Agent也能协作

谷歌推出A2A协议（Agent2Agent），允许不同生态系统中的AI Agent安全协作。通过统一界面，招聘经理可以下达任务给专业Agent寻找合适的候选人，并利用多Agent协同完成复杂工作流。

行业动态 # AI协作 # JSON格式 # Manager Controlled Platform

32天前

02230

宝马秀起汽车科技来，哪有其他汽车什么事…

人：不光有地上跑的，也有天上飞的：还有 “不归牛顿管” 的：BMW新世代驾趣概念车。科技

行业动态 # 本土化 # 宝马 # 市场

17天前

05014

粉笔CTO：大模型打破教育「不可能三角」，因材施教真正成为可能｜中国AIGC产业峰会

的垂直行业当中，开始涌现出AI落地的经典实践案例。教育领域中，专注于职业教育培训的粉笔，就是其

行业动态

24天前

05011

3D高斯泼溅算法大漏洞：数据投毒让GPU显存暴涨70GB，甚至服务器宕机

（3DGS）成为新一代高效三维建模技术，它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 202

行业动态

21天前

0475

最强o1也刚刚及格！中科大等团队测试视频CoT推理能力：多数模型不及格

中科大等团队提出VCR-Bench评估基准，用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架，覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...

行业动态 # 62.8 # CoT # VCR-Bench

24天前

0465

无需数据标注！测试时强化学习，模型数学能力暴增清华&上海AI Lab

清华和上海AI Lab团队通过测试时强化学习方法，提升模型数学能力159%，在多个数据集上表现显著。

行业动态 # 强化学习 # 上海AI实验室 # 崔淦渠

19天前

04611

亚马逊云计算Troy Cui：敦煌网飙升AppStore第二，企业如何应对激增流量是关键中国AIGC产业峰会

排名第二，面对如此泼天的流量，该用什么“姿势”来接住？在千变万化、快速发展的生成式AI时代下，如此

行业动态 # 生成式AI # 数据治理 # ETL流程

17天前

04515

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵，都重磅升级到2.0版本。可图2.

行业动态 # 人工智能 # MVL # Web和APP中的DeepSeek模型

24天前

04513

北大团队引领3D生成与对齐革新：OctGPT打破扩散模型垄断

）技术迅速崛起，正成为推动数字内容创作革新的关键力量，特别是在游戏、影视、虚拟现实和工业设计等领域表

行业动态

19天前

04410

突破AI视觉“选择性失明”，哈工大首次实现指令驱动的全景式感知

哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知，解决了传统多模态模型'选择性失明'的问题。通过引入AG-Adapter模块和设计三种专门损失函数，GiVE能灵活调整注意力...

行业动态 # 哈工大（深圳）# 图文检索 # 多模态大模型

24天前

0438

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案，在一个框架内兼顾图文理解与图像生成任务，并在多个权威评测中取得领先性能表现。

行业动态 # 复旦大学 # 美团 # UniToken

18天前

0409

天气预报精准到每条街！这家新型机构携手高校用AI驱动科研范式变革

拥有“独家预报” ——这并非科幻场景，而是上海“扶摇”气象大模型带来的突破。近日，由上海科学智能研

行业动态 # deepseek # 数据治理 # AlphaFold3

18天前

0387

《2025中国AIGC应用全景图谱报告》发布：首轮产品格局已经落定，新一轮变革蓄势待发

成。 AI智能助手领跑50+类高价值细分赛道，夸克等头部产品月访问量达到数千万甚至过亿，豆

行业动态 # 2025年 # B端应用层 # C端赛道

22天前

03811

21岁学生开发AI作弊工具被哥大停学，转身拿下530万美元融资，网友：《黑镜》成真

530万美元融资了呀！ 21岁小哥（称他为小李）这几天公布了一则喜讯，他们初创公司Cluely获得来

行业动态 # Interview Coder # 哥伦比亚大学 # 530万美元融资

21天前

03613

UC伯克利：让推理模型少思考，准确率反而更高了！

UC伯克利研究发现，强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型，在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。

行业动态 # 数学测试 # AIME 2025 # DeepSeek-R1-Distill-Qwen-32B

24天前

03514

质量无损，算力砍半！达摩院开源视觉生成新架构，出道即SOTA｜ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT，通过智能资源分配将DiT模型的推理算力削减51%，生成速度提升1.73倍，FID指标几乎无损，并且仅需3%的微调成本。

行业动态 # 清华大学 # 扩散模型 # 达摩院

18天前

03413

数势科技谭李：企业级AI应用不止ChatBI，拿到数据不等于拿到洞见中国AIGC产业峰会

降低，一个关键问题浮现在每一位企业决策者面前：如何让AI真正成为企业的“智慧大脑”，驱动业务决策全

行业动态 # 数据分析 # AI Agent # 智能分析

21天前

0348

马斯克炫酷变身毒液！实测通义Wan2.1首尾帧视频模型，还能“拼接”经典梗图

阿里通义万相Wan2.1最新版发布，基于首尾帧技术能生成流畅、连贯的5s/720p视频。模型参数规模达到百亿级，支持在官网和多个开源平台使用。实测显示其表现优秀，具备较强的主体一致性、前后连贯...

行业动态 # 亿参数规模 # 便捷推理 # 写实风格

22天前

03215

12 3 4 下一页