排序
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾图文理解与图像生成任务,并在多个权威评测中取得领先性能表现。
多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine框架,能够处理多种条件组合的多条件可控生成任务,并在多个实验中达到SOTA。
IC-Light的视频版本来了,RelightVid:强光动态环境下的视频光照编辑神器
复旦大学等机构学者发布视频版本光照编辑成果,支持时序一致性、强光源场景下的高质量光影编辑,构建全新数据集用于评估。
ICLR 2025 Spotlight 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法
本文提出参数冗余微调范式NoRM,在LoRA基础上通过SVD分解和Sim-Search方法去除冗余参数,显著提升指令微调、数学推理和代码生成任务性能。