量子位的头像-创奇社
这家伙很懒,什么都没有写...
字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA​-创奇社

字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA​

字节团队提出UNO模型,能处理多主体图像生成任务。该模型基于FLUX改进,解决了数据可扩展性和主体可扩展性问题,并在DINO和CLIP得分上达到SOTA水平。
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B-创奇社

Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B

Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作-创奇社

“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作

谷歌推出A2A协议(Agent2Agent),允许不同生态系统中的AI Agent安全协作。通过统一界面,招聘经理可以下达任务给专业Agent寻找合适的候选人,并利用多Agent协同完成复杂工作流。
宝马秀起汽车科技来,哪有其他汽车什么事…-创奇社

宝马秀起汽车科技来,哪有其他汽车什么事…

人 : 不光有地上跑的, 也有天上飞的 : 还有 “不归牛顿管” 的:BMW新世代驾趣概念车。 科技
粉笔CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国AIGC产业峰会-创奇社

粉笔CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国AIGC产业峰会

的垂直行业当中,开始涌现出AI落地的经典实践案例。 教育领域中,专注于职业教育培训的 粉笔 ,就是其
24天前
05011
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机-创奇社

3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机

(3DGS)成为新一代高效三维建模技术,它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 202
21天前
0475
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格-创奇社

最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格

中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...
无需数据标注!测试时强化学习,模型数学能力暴增 清华&上海AI Lab-创奇社

无需数据标注!测试时强化学习,模型数学能力暴增 清华&上海AI Lab

清华和上海AI Lab团队通过测试时强化学习方法,提升模型数学能力159%,在多个数据集上表现显著。
亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 中国AIGC产业峰会-创奇社

亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 中国AIGC产业峰会

排名第二,面对如此泼天的流量,该用什么“姿势”来接住? 在千变万化、快速发展的生成式AI时代下,如此
最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了-创奇社

最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了

基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。 可图2.
北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断-创奇社

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

)技术迅速崛起,正成为推动数字内容创作革新的关键力量,特别是在游戏、影视、虚拟现实和工业设计等领域表
19天前
04410
突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知-创奇社

突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知

哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型'选择性失明'的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力...
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!-创奇社

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾图文理解与图像生成任务,并在多个权威评测中取得领先性能表现。
天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革-创奇社

天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革

拥有“独家预报” ——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。 近日,由上海科学智能研
《2025中国AIGC应用全景图谱报告》发布:首轮产品格局已经落定,新一轮变革蓄势待发-创奇社

《2025中国AIGC应用全景图谱报告》发布:首轮产品格局已经落定,新一轮变革蓄势待发

成 。 AI智能助手领跑50+类 高价值细分赛道 ,夸克等头部产品月访问量达到 数千万 甚至过亿,豆
21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真-创奇社

21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真

530万美元融资了呀! 21岁小哥(称他为小李)这几天公布了一则喜讯,他们初创公司Cluely获得来
UC伯克利:让推理模型少思考,准确率反而更高了!-创奇社

UC伯克利:让推理模型少思考,准确率反而更高了!

UC伯克利研究发现,强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型,在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。
质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025-创奇社

质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 中国AIGC产业峰会-创奇社

数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 中国AIGC产业峰会

降低,一个关键问题浮现在每一位企业决策者面前: 如何让AI真正成为企业的“智慧大脑”,驱动业务决策全
马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图-创奇社

马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图

阿里通义万相Wan2.1最新版发布,基于首尾帧技术能生成流畅、连贯的5s/720p视频。模型参数规模达到百亿级,支持在官网和多个开源平台使用。实测显示其表现优秀,具备较强的主体一致性、前后连贯...