达摩院在ICLR 2025提出了动态架构DyDiT,通过智能资源分配将DiT模型的推理算力削减51%,生成速度提升1.73倍,FID指标几乎无损,并且仅需3%的微调成本。
2025-04-24 41

研究团队提出ManipTrans方法,通过两阶段迁移学习实现从人类手到机械灵巧手的操作技能转移。该方法利用通用轨迹模仿器预训练模型模仿人类手部动作,并引入残差学习模块对动作进行精细调整。同时发布DexManipNet大规模数据集用于验证。
2025-04-24 32

越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。这是一个通过自回归预测视
2025-04-22 47

本文为清华大学提供的DeepSeek AI工具入门教程,涵盖基础功能介绍、安装配置步骤、核心操作示例及实际应用场景。通过图文详解帮助初学者快速掌握这一开源大模型工具,并附有清华大学研究团队的使用建议,适合AI开发者、学术研究者及技术爱好者学习参考。
2025-04-18 8

本文详细介绍了清华大学推荐的DeepSeek使用方法,包括基础功能、高级技巧及实际应用场景。内容涵盖安装配置、指令优化、学术研究辅助等,帮助用户快速掌握这一AI工具,提升学习与工作效率。适合学生、研究人员及技术爱好者阅读。
2025-04-18 6

近期研究者通过奖励模型增强通用奖励模型在推理阶段的可扩展性,同时使用强化学习提升LLM性能。然而,当前强化学习算法仍有改进空间,奖励稀疏性是主要难点之一。
2025-04-13 19

2025年CSRankings公布,卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三,北京大学位居第五。中国高校在AI领域表现突出,包揽全球前十中的六席。
2025-04-07 19

ATEC2025 科技精英赛由清华大学等顶尖学府联合主办,聚焦人工智能与机器人技术融合创新。赛事设置双赛道,奖金池高达21万美元,提供商业级硬件设备,并邀请专家学者评委参与验证和交流。
2025-04-03 14

北京理工大学等4大名校联合发布Mini DALL·E 3,无需额外训练即可为多数主流大模型添加文成图多模态输出能力。该系统由语言模型、路由器、适配器和图像生成模型四大模块组成,实现了用文本生成图像。
2025-04-03 19
没有账号?注册  忘记密码?