最新更新第88页
字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?
字节最新研发的Seed-Thinking-v1.5模型在数学、代码推理任务中表现优异,参数规模较小。该模型通过创新的数据处理方法、强化学习算法及基础设施优化提升了性能,并与其他领先模型进行了对比分析...
盖茨预警:AI解放人类速度惊人,医生和教师最先被取代,一周只要2天上班
盖茨预警:AI解放人类速度惊人,医生和教师最先被取代,一周只要2天上班 比尔·盖茨近期重磅预测:十年内,人类每周只需工作两天!而让这成为可能的,正是AI的快速发展。但与此同时,医生、教师...
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交...
Anthropic工程师教你怎么做AI Agent:不做全场景、保持简单,像Agent一样思考
Anthropic 工程师 Barry Zhang 提出 'Don't build agents for everything' 的观点,强调构建有效 Agent 需要明智选择应用场景、保持系统简单以及像 Agent 一样思考。
速递|Zoom前CFO加盟Canva,对话式AI设计320亿美元估值,进入IPO倒计时
Canva公司推出基于对话的AI工具,以吸引企业客户。这些工具可编辑照片、生成幻灯片和设计代码,并已在洛杉矶活动上发布。该公司计划在近期进行首次公开募股(IPO),并已签订2000多份企业合同。
开源的风吹到人形机器人硬件,“让用户拼乐高积木式地搭建”
傅利叶发布首款开源人形机器人Fourier N1,旨在降低开发门槛吸引开发者与科研机构参与。N1身高1.3米、重量38公斤,拥有23个自由度,可实现多种复杂动作,如高稳定奔跑、斜坡通行和楼梯攀爬等。...
RL for LLMs,强化学习的 Scaling Law 才刚刚起步?
近期研究者通过奖励模型增强通用奖励模型在推理阶段的可扩展性,同时使用强化学习提升LLM性能。然而,当前强化学习算法仍有改进空间,奖励稀疏性是主要难点之一。
海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗
海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗 神奇!人类和海豚真的能实现跨物种交流了?! 当地时间4月14日(也是世界海豚日),谷歌CEO皮猜激动官宣: 隆重推出Dolph...
媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
著名模型DeepCoder-14B-Preview开源,参数虽少但表现优异。该模型在LiveCodeBench测试中得分为60.6%,高于OpenAI的o1模型,接近o3-mini水平。Together AI不仅开源模型权重和训练数据集,还优化...
谷歌版MCP来了:Agent2Agent协议,实现跨平台AI Agent互联
谷歌推出A2A协议,让AI Agent在不同生态系统间安全协作。该协议支持通信、任务管理等能力,并已在50多家技术合作伙伴中得到应用。
连续完成A及A+轮融资,星尘智能获锦秋基金、蚂蚁集团等领投
连续完成A及A+轮融资,星尘智能获锦秋基金、蚂蚁集团等领投 近日,星尘智能连续完成A轮及A+轮融资数亿元,由锦秋基金、蚂蚁集团领投,云启资本、道彤资本等老股东跟投,华兴资本担任独家财务顾...
Nature重磅:DeepMind AI又一重大突破,1次配置解决150种多任务
Nature重磅:DeepMind AI又一重大突破,1次配置解决150种多任务 只需使用一种通用算法,就可以解决来自各个应用领域的各种任务,一直是人工智能(AI)行业的基本挑战之一。 如今,Google DeepMi...
智谱开源最快大模型
智谱发布新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,并遵循MIT License。推理模型GLM-Z1-Air/AirX-0414模型推理速度最高可达200 Tokens/秒,价格仅是DeepSeek-R1的1/30...
刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
今天凌晨 1点, OpenAI开源了一个全新的 AI Agent评测基准—— PaperBench。 该基准主要考核智能体的搜索、整合、执行等能力。