最新更新第75页
为大模型添加多模态能力——Mini DALL·E 3
北京理工大学等4大名校联合发布Mini DALL·E 3,无需额外训练即可为多数主流大模型添加文成图多模态输出能力。该系统由语言模型、路由器、适配器和图像生成模型四大模块组成,实现了用文本生成...
1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命!
在人工智能技术加速渗透各行各业的今天,《1小时AI公开课》系列直播课程推出,聚焦大模型、Agent、Prompt工程等前沿技术。首期课程将于4月11日晚8点开讲,由AIGC开放社区专家李扬主讲,内容涵盖...
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...
2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
Genspark超级智能体发布,能够在无需编程的情况下执行复杂任务,包括制作做饭视频和创建HTML游戏。其背后公司MainFunc由前百度高管景鲲创立,展示了从AI搜索转向智能体的新方向。
AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一
PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为...
视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知
研究者提出了一种新的视觉自监督学习模型Web-SSL,它能够在不依赖语言监督的情况下,在大规模数据集上与CLIP模型媲美,并在多种视觉问题解答任务中表现出色。
为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持
ATEC2025 科技精英赛由清华大学等顶尖学府联合主办,聚焦人工智能与机器人技术融合创新。赛事设置双赛道,奖金池高达21万美元,提供商业级硬件设备,并邀请专家学者评委参与验证和交流。
DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖
谷歌DeepMind的DreamerV3在《我的世界》中无需人类数据自主完成钻石收集任务,标志着AI向通用人工智能(AGI)又迈进了一步。
ICLR 2025 Spotlight 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法
本文提出参数冗余微调范式NoRM,在LoRA基础上通过SVD分解和Sim-Search方法去除冗余参数,显著提升指令微调、数学推理和代码生成任务性能。
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作
V-Droid使用验证器驱动架构在移动GUI任务自动化中实现了高成功率和低延迟。通过解析UI界面提取基本操作,并利用精细训练的验证器评估候选动作,V-Droid在多个基准测试中的任务成功率显著提高,...
速递|“AI教育卡位战”Anthropic发布"学习模式"Claude,教育版套餐能否实现2025年收入翻倍
Anthropic推出Claude教育版套餐以回应OpenAI ChatGPT计划,该套餐包括学习模式帮助学生批判性思考,并能分析招生趋势和自动化处理咨询。
让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA
论文提出MoTCoder模型,通过模块化思维显著提升大语言模型在复杂编程任务中的准确率与可维护性。团队已开源代码、模型和数据集供在线体验。