ImageNet-1K共1篇
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成-创奇社

视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成

V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...
量子位的头像-创奇社量子位40天前
0140