首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 蚂蚁&人大
价值观对齐训练,但其对齐效果往往会让少数群体的声音被系统性淹没。 那随之而来的问题是, 当大模型服务
AI优化芯片布局,设计阶段即考虑最终性能,中科大华为诺亚新方法入选ICLR 2025 Oral
中科大王杰教授团队、华为诺亚实验室和天津大学提出了一种新的芯片宏单元布局优化方法LaMPlace,能够在布局阶段就考虑最终性能指标如WNS和TNS,从而缩短设计流程并提高效率。
谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算
谷歌发布新款TPU v7芯片,峰值算力达4614TFlops,支持大规模并行处理和高效的内存访问。TPU v7在高带宽内存、低延迟ICN网络方面都有显著提升,并配备增强版SparseCore以支持高级排序和推荐工作...
“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作
谷歌推出A2A协议(Agent2Agent),允许不同生态系统中的AI Agent安全协作。通过统一界面,招聘经理可以下达任务给专业Agent寻找合适的候选人,并利用多Agent协同完成复杂工作流。
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
在最新访谈中,OpenAI CEO奥特曼分享了对AI和创业的看法。他指出大多数改变世界的公司都是从传统领域转型而来,并强调当编程成本下降时,全球软件需求会呈指数级增长。奥特曼认为当前世界正处于...
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
中科大MIRA实验室提出KG-SFT框架,通过结合知识图谱和LLMs提升特定领域性能,显著提高常识问答准确率。
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作
V-Droid使用验证器驱动架构在移动GUI任务自动化中实现了高成功率和低延迟。通过解析UI界面提取基本操作,并利用精细训练的验证器评估候选动作,V-Droid在多个基准测试中的任务成功率显著提高,...
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...