最新更新第88页
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...
2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
Genspark超级智能体发布,能够在无需编程的情况下执行复杂任务,包括制作做饭视频和创建HTML游戏。其背后公司MainFunc由前百度高管景鲲创立,展示了从AI搜索转向智能体的新方向。
历史首次!GPT-4.5通过标准图灵测试,靠的竟是"装人设"?
UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试,其表现甚至超过真人。胜率高达73%,远高于对照组人类对手的50%。研究发现人设提示是关键因素。
近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
新加坡国立大学的研究团队提出了Impossible Videos概念,构建了包含多种不可能场景的基准IPV-BENCH,用于评测AI视频生成和理解能力。研究发现当前模型在生成和识别不可能事件方面存在挑战,并指...
2024 AAAS Fellow揭晓!中科大校友熊莉、清华校友林希虹等华人学者上榜
2024年度AAAS Fellow名单公布,共有471位杰出科学家入选。信息计算通信领域有3名华人学者上榜,包括腾讯原杰出科学家刘威、纽约城市学院教授田英利及埃默里大学教授熊莉等。物理学和统计学领域...
ICLR 2025 Oral IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文
Runway最新视频模型Gen-4上线!保真度、一致性、可控性做到最强
Runway 发布了最新 AI 视频生成模型 Gen-4,其画面真实感、动态流畅度和创作可控性取得重大进步。Gen-4 能够生成逼真运动的视频,并具备优秀的提示遵循能力和全球理解能力。
AEB失效?车门是否锁死?小米SU7致死事故多个隐忧待解
据报道,小米SU7标准版在高速公路上发生事故导致三人死亡。事发时车辆处于NOA智能辅助驾驶状态,驾驶员在系统提示后未能及时接管并制动,最终以约97km/h撞击隔离带水泥桩。此事件引发对AEB功能...