清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
网刷屏。 Magi-1 ,首个实现顶级画质输出的 自回归视频生成模型 , 模型权重、代码100%开源
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾图文理解与图像生成任务,并在多个权威评测中取得领先性能表现。
纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归
基于Transformer的自回归视觉生成模型在图像生成领域的表现受到了质疑。然而,复旦大学和字节Seed的研究者们提出了一种新方法SimpleAR,在0.5B参数规模下实现了高质量图像的生成,并通过优化训...
心影随形创始人刘斌新:做不跟用户抢时间的AI产品丨中国AIGC产业峰会
刘斌新分享了他创立的心影随形科技,通过AI技术解决游戏场景中的社交痛点,产品定位为‘陪伴’而非抢占时间。他们发现用户在玩游戏时需要朋友一起玩的需求,并希望通过AI让游戏伙伴理解玩家情绪...
天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革
拥有“独家预报” ——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。 近日,由上海科学智能研
粉笔CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国AIGC产业峰会
的垂直行业当中,开始涌现出AI落地的经典实践案例。 教育领域中,专注于职业教育培训的 粉笔 ,就是其
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...