量子位的头像-创奇社
这家伙很懒,什么都没有写...
北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断-创奇社

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

)技术迅速崛起,正成为推动数字内容创作革新的关键力量,特别是在游戏、影视、虚拟现实和工业设计等领域表
19天前
04410
心影随形创始人刘斌新:做不跟用户抢时间的AI产品丨中国AIGC产业峰会-创奇社

心影随形创始人刘斌新:做不跟用户抢时间的AI产品丨中国AIGC产业峰会

刘斌新分享了他创立的心影随形科技,通过AI技术解决游戏场景中的社交痛点,产品定位为‘陪伴’而非抢占时间。他们发现用户在玩游戏时需要朋友一起玩的需求,并希望通过AI让游戏伙伴理解玩家情绪...
MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会-创奇社

MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会

科学领域正经历一场静默的革命。传统的特征工程、模型训练与迭代优化流程,正被智能化的研发助手所改变。
电视装了智能体,只凭台词就能找到剧集了-创奇社

电视装了智能体,只凭台词就能找到剧集了

酷开科技发布的新款智能体,包括影音、生活、教育、健康、创作和设备六类。其中影音智能体能帮助用户搜索电影及电视剧,生活智能体则能在大屏上完成旅行计划,并支持音乐搜索等功能;教育智能体...
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!-创奇社

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾图文理解与图像生成任务,并在多个权威评测中取得领先性能表现。
突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知-创奇社

突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知

哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型'选择性失明'的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力...
数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 中国AIGC产业峰会-创奇社

数势科技谭李:企业级AI应用不止ChatBI,拿到数据不等于拿到洞见 中国AIGC产业峰会

降低,一个关键问题浮现在每一位企业决策者面前: 如何让AI真正成为企业的“智慧大脑”,驱动业务决策全
天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革-创奇社

天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革

拥有“独家预报” ——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。 近日,由上海科学智能研
OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维-创奇社

OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维

姚顺雨指出AI发展分为上半场和下半场。上半场以模型和方法为主,而下半场的重点转向如何定义现实任务并有效评估AI的表现。他强调强化学习已能泛化,并提出新的评估规则来解决当前局限性。
具身空间数据技术的路线之争:合成重建VS全端生成-创奇社

具身空间数据技术的路线之争:合成重建VS全端生成

在太高,于是,合成数据的技术就显得尤为重要。 目前,具身合成数据有两条主要技术路线之争: “视频合成
清华张亚勤:10年后,机器人将可能比人都多-创奇社

清华张亚勤:10年后,机器人将可能比人都多

张亚勤在新书《智能涌现》中预测,未来10年后机器人可能比人都多,并进入家庭。AI技术正从“数字化3.0”升级,发展方向包括大模型、自动驾驶和生物智能。他提出了五大趋势和发展方向,强调统一...
本周三15:00!🤓机器人与数字化转型应用解析,线上研讨会诚邀你来围观-创奇社

本周三15:00!🤓机器人与数字化转型应用解析,线上研讨会诚邀你来围观

本周三下午3:00,赞奇科技将在线上举办研讨会,分享企业数字化转型的具体细节。研讨内容包括行业场景调研、人才投入、硬件和软件投入策略等。研讨会邀请了服务多家企业的实战团队参加。
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者-创奇社

清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者

网刷屏。 Magi-1 ,首个实现顶级画质输出的 自回归视频生成模型 , 模型权重、代码100%开源
21天前
0296
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格-创奇社

最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格

中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机-创奇社

3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机

(3DGS)成为新一代高效三维建模技术,它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 202
21天前
0475