首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 蚂蚁&人大
价值观对齐训练,但其对齐效果往往会让少数群体的声音被系统性淹没。 那随之而来的问题是, 当大模型服务
2025 CSRankings排名出炉!上交大、清华北大、浙大霸榜全球AI TOP 10
2025年CSRankings公布,卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三,北京大学位居第五。中国高校在AI领域表现突出,包揽全球前十中的六席。
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新基础模型Llama 4发布后遭遇差评如潮。代码能力受质疑,尤其是经典‘氛围编程’小球测试表现不佳。竞技场排名成绩参差不齐,且存在数据泄露和版权问题的疑虑。
论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」
AI 大模型将接管大多数资料处理工作。文章介绍了心流 AI 助手的功能,包括论文精读、引文直达、知识库问答和多轮深度搜索等科研专用工具,帮助用户高效获取与沉淀知识。
Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
Meta发布AI模型Llama 4后,用户反馈编码能力不佳。尽管在基准测试中表现优异,但在实际编程任务中的效果欠佳,引发讨论。
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同,并认为这种行为可能误导开发者。
MoCha:开启自动化多轮对话电影生成新时代
本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成,首次提出面向Talking Characters任务的视频生成方法MoCha,实现仅基于语音和文本输入生成完整角色对话视频。
暴击Manus,拿下1.6亿美元融资,前百度副总裁景鲲带队推出Genspark超级智能体
景鲲发布的Genspark超级智能体采用混合代理系统,整合9个模型和多个数据集,提供快速、可靠且操控性强的AI服务。其功能包括旅行计划制定、个性化视频创作、新闻生成动画视频等。尽管订阅费用较高,但功能丰富,正成为AI agent领域的热门产品。
马斯克又秀人形机器人:擎天柱实现稳步行走
马斯克发布特斯拉人形机器人擎天柱最新视频展示类人行走能力,并介绍其采用强化学习训练方案,未来目标是年产超5万台应用于工厂场景及计划2026年登陆火星。
无人驾驶低空游览将收费,首张eVTOL商运证为何花落合肥?
广东亿航通用航空有限公司、合肥合翼航空有限公司获得民用无人驾驶航空器运营合格证,标志着持证企业可以在批准区域内进行商业运营。这一消息点燃了低空经济的热度,合肥已集聚超过200家低空经济企业,并计划打造具有国际影响力的‘低空之城’。
荣耀vivo纷纷入局具身智能,凑热闹还是寻觅新增长点?
荣耀及多家手机厂商成立具身智能相关实验室,进军机器人领域。官方招聘信息显示,荣耀已组建新产业孵化部,包括多个和具身智能相关的板块;vivo、小米等企业亦有布局。业内人士认为,具身智能机器人的研发难度较高,涉及复杂的软硬件技术集成和技术迭代。
AI论文“冷冻”6个月,DeepMind科学家被逼“大逃亡”:买下整个学术界,又把天才都困在笼里
意味着研究人员将更难对外公布成果。 为了在蓬勃发展的 AI 行业中夺取主导地位、保持竞争优势,谷歌旗
飞桨新一代框架 3.0 正式发布:减少 Llama 预训练 80% 分布式核心代码,R1 满血版单机部署吞吐量翻倍
,飞桨框架 3.0 版本不仅延续了飞桨框架 2.0 系列动静统一、训推一体的特性,更在自动并行、神经