清华大学-创奇社

质量无损，算力砍半！达摩院开源视觉生成新架构，出道即SOTA｜ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT，通过智能资源分配将DiT模型的推理算力削减51%，生成速度提升1.73倍，FID指标几乎无损，并且仅需3%的微调成本。

量子位18天前

03413

越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。这是一个通过自回归预测视

机器之心21天前

0418

研究团队提出ManipTrans方法，通过两阶段迁移学习实现从人类手到机械灵巧手的操作技能转移。该方法利用通用轨迹模仿器预训练模型模仿人类手部动作，并引入残差学习模块对动作进行精细调整。同时...

机器之心19天前

0277