最新更新第195页
1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命!
在人工智能技术加速渗透各行各业的今天,《1小时AI公开课》系列直播课程推出,聚焦大模型、Agent、Prompt工程等前沿技术。首期课程将于4月11日晚8点开讲,由AIGC开放社区专家李扬主讲,内容涵盖...
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...
2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
Genspark超级智能体发布,能够在无需编程的情况下执行复杂任务,包括制作做饭视频和创建HTML游戏。其背后公司MainFunc由前百度高管景鲲创立,展示了从AI搜索转向智能体的新方向。
历史首次!GPT-4.5通过标准图灵测试,靠的竟是"装人设"?
UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试,其表现甚至超过真人。胜率高达73%,远高于对照组人类对手的50%。研究发现人设提示是关键因素。
近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
新加坡国立大学的研究团队提出了Impossible Videos概念,构建了包含多种不可能场景的基准IPV-BENCH,用于评测AI视频生成和理解能力。研究发现当前模型在生成和识别不可能事件方面存在挑战,并指...
2024 AAAS Fellow揭晓!中科大校友熊莉、清华校友林希虹等华人学者上榜
2024年度AAAS Fellow名单公布,共有471位杰出科学家入选。信息计算通信领域有3名华人学者上榜,包括腾讯原杰出科学家刘威、纽约城市学院教授田英利及埃默里大学教授熊莉等。物理学和统计学领域...
ICLR 2025 Oral IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
京大学、香港科技大学(广州)联合团队提出的 ChartMoE 成功入选 Oral (口头报告) 论文