扩散模型-创奇社 - AI前沿·副业变现·资源教程！

质量无损，算力砍半！达摩院开源视觉生成新架构，出道即SOTA｜ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT，通过智能资源分配将DiT模型的推理算力削减51%，生成速度提升1.73倍，FID指标几乎无损，并且仅需3%的微调成本。

量子位1个月前

03513

近日，大连理工大学与莫纳什大学的研究团队提出VLIPP框架，通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因，并提出两阶段方法，利用视觉语言模型...

机器之心1个月前

0405