扩散模型共2篇
质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025-创奇社

质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
量子位的头像-创奇社量子位18天前
03413
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架-创奇社

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

近日,大连理工大学与莫纳什大学的研究团队提出VLIPP框架,通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因,并提出两阶段方法,利用视觉语言模型...
机器之心的头像-创奇社机器之心25天前
0405