最新更新第88页
字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?-创奇社

字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?

字节最新研发的Seed-Thinking-v1.5模型在数学、代码推理任务中表现优异,参数规模较小。该模型通过创新的数据处理方法、强化学习算法及基础设施优化提升了性能,并与其他领先模型进行了对比分析...
盖茨预警:AI解放人类速度惊人,医生和教师最先被取代,一周只要2天上班-创奇社

盖茨预警:AI解放人类速度惊人,医生和教师最先被取代,一周只要2天上班

盖茨预警:AI解放人类速度惊人,医生和教师最先被取代,一周只要2天上班 比尔·盖茨近期重磅预测:十年内,人类每周只需工作两天!而让这成为可能的,正是AI的快速发展。但与此同时,医生、教师...
创奇社的头像-创奇社年费会员创奇社40天前
0110
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?-创奇社

大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?

一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交...
OpenAI大幅削减o3大模型的安全测试时间-创奇社

OpenAI大幅削减o3大模型的安全测试时间

OpenAI大幅缩短了对新模型的安全测试时间,仅几天而非几个月,引发业界担忧其安全性问题。
财联社AI daily的头像-创奇社财联社AI daily31天前
0110
Anthropic工程师教你怎么做AI Agent:不做全场景、保持简单,像Agent一样思考-创奇社

Anthropic工程师教你怎么做AI Agent:不做全场景、保持简单,像Agent一样思考

Anthropic 工程师 Barry Zhang 提出 'Don't build agents for everything' 的观点,强调构建有效 Agent 需要明智选择应用场景、保持系统简单以及像 Agent 一样思考。
速递|Zoom前CFO加盟Canva,对话式AI设计320亿美元估值,进入IPO倒计时-创奇社

速递|Zoom前CFO加盟Canva,对话式AI设计320亿美元估值,进入IPO倒计时

Canva公司推出基于对话的AI工具,以吸引企业客户。这些工具可编辑照片、生成幻灯片和设计代码,并已在洛杉矶活动上发布。该公司计划在近期进行首次公开募股(IPO),并已签订2000多份企业合同。
喝点VC|a16z对话心理健康公司Slingshot AI创始人:通过AI扩大心理健康服务的可及性-创奇社

喝点VC|a16z对话心理健康公司Slingshot AI创始人:通过AI扩大心理健康服务的可及性

齐。 我们使用自有数据集进行预训练,这一点非常关键,而很多公司并不具备这样的能力。然后,我们用专家手
Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子-创奇社

Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子

enAI最新框架PaperBench正为此生,让AI智能体从头开始复现ICML 2024 20篇优秀
开源的风吹到人形机器人硬件,“让用户拼乐高积木式地搭建”-创奇社

开源的风吹到人形机器人硬件,“让用户拼乐高积木式地搭建”

傅利叶发布首款开源人形机器人Fourier N1,旨在降低开发门槛吸引开发者与科研机构参与。N1身高1.3米、重量38公斤,拥有23个自由度,可实现多种复杂动作,如高稳定奔跑、斜坡通行和楼梯攀爬等。...
RL for LLMs,强化学习的 Scaling Law 才刚刚起步?-创奇社

RL for LLMs,强化学习的 Scaling Law 才刚刚起步?

近期研究者通过奖励模型增强通用奖励模型在推理阶段的可扩展性,同时使用强化学习提升LLM性能。然而,当前强化学习算法仍有改进空间,奖励稀疏性是主要难点之一。
海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗-创奇社

海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗

海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗 神奇!人类和海豚真的能实现跨物种交流了?! 当地时间4月14日(也是世界海豚日),谷歌CEO皮猜激动官宣: 隆重推出Dolph...
创奇社的头像-创奇社年费会员创奇社28天前
0100
媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开-创奇社

媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开

著名模型DeepCoder-14B-Preview开源,参数虽少但表现优异。该模型在LiveCodeBench测试中得分为60.6%,高于OpenAI的o1模型,接近o3-mini水平。Together AI不仅开源模型权重和训练数据集,还优化...
谷歌版MCP来了:Agent2Agent协议,实现跨平台AI Agent互联-创奇社

谷歌版MCP来了:Agent2Agent协议,实现跨平台AI Agent互联

谷歌推出A2A协议,让AI Agent在不同生态系统间安全协作。该协议支持通信、任务管理等能力,并已在50多家技术合作伙伴中得到应用。
连续完成A及A+轮融资,星尘智能获锦秋基金、蚂蚁集团等领投-创奇社

连续完成A及A+轮融资,星尘智能获锦秋基金、蚂蚁集团等领投

连续完成A及A+轮融资,星尘智能获锦秋基金、蚂蚁集团等领投 近日,星尘智能连续完成A轮及A+轮融资数亿元,由锦秋基金、蚂蚁集团领投,云启资本、道彤资本等老股东跟投,华兴资本担任独家财务顾...
创奇社的头像-创奇社年费会员创奇社32天前
0100
Nature重磅:DeepMind AI又一重大突破,1次配置解决150种多任务-创奇社

Nature重磅:DeepMind AI又一重大突破,1次配置解决150种多任务

Nature重磅:DeepMind AI又一重大突破,1次配置解决150种多任务 只需使用一种通用算法,就可以解决来自各个应用领域的各种任务,一直是人工智能(AI)行业的基本挑战之一。 如今,Google DeepMi...
创奇社的头像-创奇社年费会员创奇社40天前
0100
DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型-创奇社

DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型

真实网络环境中通过强化学习训练的 AI 研究模型 。 随着大型语言模型(LLMs)推理能力的飞速发展
福布斯2025 AI 50榜单:AI Agent全面崛起,应用层才是2025真正的主战场-创奇社

福布斯2025 AI 50榜单:AI Agent全面崛起,应用层才是2025真正的主战场

ech Capital 联合制作。 一句话总结趋势: AI Agents Move Beyond C
下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此-创奇社

下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此

全?这里有全球顶尖防御方案。 想了解AI如何让普通人一键创作音乐? …… 一天时间,带你看尽如何 「
智谱开源最快大模型-创奇社

智谱开源最快大模型

智谱发布新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,并遵循MIT License。推理模型GLM-Z1-Air/AirX-0414模型推理速度最高可达200 Tokens/秒,价格仅是DeepSeek-R1的1/30...
刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测-创奇社

刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测

今天凌晨 1点, OpenAI开源了一个全新的 AI Agent评测基准—— PaperBench。 该基准主要考核智能体的搜索、整合、执行等能力。