清华大学共3篇
质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025-创奇社

质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
量子位的头像-创奇社量子位18天前
03413
「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!-创奇社

「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!

越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。这是一个通过自回归预测视
机器之心的头像-创奇社机器之心21天前
0418
机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手-创奇社

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

研究团队提出ManipTrans方法,通过两阶段迁移学习实现从人类手到机械灵巧手的操作技能转移。该方法利用通用轨迹模仿器预训练模型模仿人类手部动作,并引入残差学习模块对动作进行精细调整。同时...
机器之心的头像-创奇社机器之心19天前
0277