排序
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
近日,大连理工大学与莫纳什大学的研究团队提出VLIPP框架,通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因,并提出两阶段方法,利用视觉语言模型...
质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025
达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
文本到动作生成最强模型出炉!动作可精确编辑,北大AI团队CVPR 2025新论文
北京大学的研究人员提出了一种名为MotionReFit的新模型,它可以根据用户的文本指令生成逼真的人体动作。该模型通过引入MotionCutMix数据增强技术及带有动作协调器的自回归扩散模型来实现这一目...