排序
DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文
DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文 近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里,研究人员推出了许多改进...
AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一
PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为...
Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
Meta发布AI模型Llama 4后,用户反馈编码能力不佳。尽管在基准测试中表现优异,但在实际编程任务中的效果欠佳,引发讨论。
又一个“天选打工人”来了!擎朗智能发布首款人形机器人 XMAN-R1:基于真实数据打造,为服务而生
擎朗智能发布人形具身服务机器人XMAN-R1,旨在满足服务行业的复杂需求,并通过数据积淀打造多形态协作生态。
99天,全球AI企业融资超4300亿,80%流向这24家公司
99天,全球AI企业融资超4300亿,80%流向这24家公司 智东西(公众号:zhidxcom) 作者 | 程茜 编辑 | 心缘 超4300亿元融资“砸”向AI行业! 智东西4月9日报道,根据全球市研机构Crunchbase的数据...
OpenAI,Google和阿里们都“认”了的MCP,究竟给开发者带来啥实惠了
Google DeepMind与Google Cloud纷纷支持MCP协议,加速其向主流标准转变。MCP旨在让大型语言模型无缝连接各种外部数据源和工具,推动AI应用开发标准化。通过标准化接口,AI能够更高效地与现实应...
再见,GPT-4将退出ChatGPT舞台
再见,GPT-4将退出ChatGPT舞台 【TechWeb】近日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。 自2025年4月30日起,GPT-4将在ChatGPT中退役,并完全被GPT-4o取代。GPT-4 仍将在API...
喝点VC|a16z对话明星邮件服务公司CEO:Agent将成为主要执行者,产品设计将从“用户体验”走向“Agent体验”
设计需要从以人为本的 UX (用户体验)转向面向 Agent 的 GX ( Agent Experi
专注工业无人机领域,傲势完成近2亿元C轮融资
专注工业无人机领域,傲势完成近2亿元C轮融资 投资界4月16日消息,近日,国内工业无人机企业傲势已完成近两亿元人民币C轮融资。本轮融资由策源资本、科创海特、元禾原点等投资机构联合参与,将...
陈立武挥刀高层,英特尔重生计划曝光!技术团队直通华人CEO
新智元报道 编辑:桃子 新CEO上任一个月后,英特尔正改头换貌。陈立武通过扁平化管理、强化技术导向,誓言重振这家硅谷传奇。他任命Sachin Katti为AI与技术双料首席,肩负对抗英伟达的重任。
微软上线两款新模型:增强RAG和AI Agent
微软在官网宣布上线了Cohere的Embed 4和Command A两款新模型,主要用于增强RAG以及AI Agent。Embed 4是一个多模态嵌入模型,支持超过100种语言。Command A是Cohere最新发布的旗舰大模型,专为企...
具身智能资本盛宴:3个月37笔融资,北上深争锋BAT下场,人形机器人最火
具身智能资本盛宴:3个月37笔融资,北上深争锋BAT下场,人形机器人最火 智东西4月21日报道,据智东西不完全统计,截至3月31日,今年第一季度国内人形机器人赛道的相关融资事件共37笔,涉及33家...
开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab
上海AI实验室提出GraphGen,通过知识图谱引导和双模型协同机制提升垂域大模型训练中的问答数据质量。研究团队在OpenXLab平台上推出Web应用,方便用户生成适应LLaMA-Factory和XTuner的高质量训练...