扩散模型共4篇
英伟达华人AI版《猫和老鼠》爆火全网,60秒经典泪目!仅靠Transformer新增一层-创奇社

英伟达华人AI版《猫和老鼠》爆火全网,60秒经典泪目!仅靠Transformer新增一层

TTT打造了一分钟视频生成器,让汤姆和杰瑞的追逐战延续到全新篇章,技术与经典的完美碰撞,你准备好迎接
新智元的头像-创奇社新智元32天前
08250
文本到动作生成最强模型出炉!动作可精确编辑,北大AI团队CVPR 2025新论文-创奇社

文本到动作生成最强模型出炉!动作可精确编辑,北大AI团队CVPR 2025新论文

北京大学的研究人员提出了一种名为MotionReFit的新模型,它可以根据用户的文本指令生成逼真的人体动作。该模型通过引入MotionCutMix数据增强技术及带有动作协调器的自回归扩散模型来实现这一目...
头部科技的头像-创奇社头部科技28天前
0100
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架-创奇社

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

近日,大连理工大学与莫纳什大学的研究团队提出VLIPP框架,通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因,并提出两阶段方法,利用视觉语言模型...
机器之心的头像-创奇社机器之心24天前
0405
质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025-创奇社

质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025

达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
量子位的头像-创奇社量子位18天前
03413