OpenAI 第2页
让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?-创奇社

让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?

之前思考更长时间而训练。 这些推理模型首次实现了自主调用并整合 ChatGPT 内的全量工具:包括网
AI前线的头像-创奇社AI前线24天前
0299
刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测-创奇社

刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测

今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,OpenAI自己的模型准确率只有0.6%和0.9%,但最新发布的Agent模型Deep Research准确率达...
AIGC开放社区的头像-创奇社AIGC开放社区32天前
0110
刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元-创奇社

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

OpenAI 推出 gpt-image-1 API,允许开发者轻松集成高质量图像生成功能。此模型具备准确、多样的视觉风格等特性,支持通过文本提示生成图像,并按 token 进行定价。
机器之心的头像-创奇社机器之心19天前
0249
Ilya新公司估值320亿美元,没有任何产品-创奇社

Ilya新公司估值320亿美元,没有任何产品

SSI (Safe Superintelligence) has raised $2 billion and is valued at $32 billion, with plans to focus on safety and innovation rather than immediate products or cycles.
AIGC开放社区的头像-创奇社AIGC开放社区28天前
0110
刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型-创奇社

刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型

OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型,训练参数公开,开发者可以分析和微调以执行特定任务。
机器之心的头像-创奇社机器之心40天前
080
OpenAI深夜发布满血o3和o4mini: 两个没想到-创奇社

OpenAI深夜发布满血o3和o4mini: 两个没想到

OpenAI发布o3和o4-mini模型,具备连续调用超过600次工具的能力,超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。
AI寒武纪的头像-创奇社AI寒武纪24天前
0408
ChatGPT更新功能:全局记忆,另一个scaling laws?-创奇社

ChatGPT更新功能:全局记忆,另一个scaling laws?

ChatGPT新增全局记忆功能,可调用用户历史对话提供个性化回复。Sam Altman称此为‘AI界的终身学习伴侣’。
AI寒武纪的头像-创奇社AI寒武纪32天前
0110
重磅!微软上线GPT-image-1模型,支持高级功能定制-创奇社

重磅!微软上线GPT-image-1模型,支持高级功能定制

OpenAI发布GPT-image-1模型,微软Azure云服务同步上线。该模型支持深度定制和全网爆火功能,提升图像生成效率和质量。适用于教育、出版和游戏等行业,确保内容合规性和伦理规范。
AIGC开放社区的头像-创奇社AIGC开放社区19天前
05013
OpenAI推出首个Nano模型:GPT-4.1 ,百万上下文、代码能力大幅超越GPT4.5-创奇社

OpenAI推出首个Nano模型:GPT-4.1 ,百万上下文、代码能力大幅超越GPT4.5

OpenAI发布GPT-4.1系列新模型,包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力,尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进,以及强大的视...
AI寒武纪的头像-创奇社AI寒武纪28天前
0130
刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测-创奇社

刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测

今天凌晨 1点, OpenAI开源了一个全新的 AI Agent评测基准—— PaperBench。 该基准主要考核智能体的搜索、整合、执行等能力。
AIGC开放社区的头像-创奇社AIGC开放社区40天前
0100
OpenAI正以30亿美元洽谈收购Windsurf,加码Agent赛道-创奇社

OpenAI正以30亿美元洽谈收购Windsurf,加码Agent赛道

OpenAI正洽谈以30亿美元收购AI编程平台Windsurf,显示其对Agent赛道的决心。Windsurf前身为Codeium,曾获得6500万美元和1.5亿美元融资,估值暴涨至12.5亿美元。Cascade是Windsurf的一大亮点,提...
AIGC开放社区的头像-创奇社AIGC开放社区24天前
03215
ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制-创奇社

ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制

ChatGPT新增功能可参考过往对话内容生成个性化回复,并支持记忆和引用之前的信息。OpenAI表示这标志着LLM交互范式的转变,用户可以询问AI关于自己之前的提问。不过也有负面反馈指出记忆的稳定性...
量子位的头像-创奇社量子位32天前
0110
刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦-创奇社

刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

今天凌晨,1点30分,OpenAI发布了全新图像模型GPT-image-1,并已向全球开发者开放使用。该模型可通过API控制生成图像的多个参数,支持全网爆火的吉卜力模式等特性。目前已有Adobe、Figma、HeyGe...
AIGC开放社区的头像-创奇社AIGC开放社区19天前
0319
刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文-创奇社

刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文

今天凌晨 1点,OpenAI发布了最新模型——GPT-4.1。支持100万 tokens 上下文,提升多模态处理、代码能力、指令遵循等性能,已上线Azure OpenAI。
AIGC开放社区的头像-创奇社AIGC开放社区28天前
090
OpenAI官方基准测试:承认Claude遥遥领先(狗头)-创奇社

OpenAI官方基准测试:承认Claude遥遥领先(狗头)

OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
量子位的头像-创奇社量子位40天前
0140
接近“天才水平”?!OpenAI新模型o3和o4-mini称霸Aider排行榜,附赠开源编码工具-创奇社

接近“天才水平”?!OpenAI新模型o3和o4-mini称霸Aider排行榜,附赠开源编码工具

纱。 今天,OpenAI 联合创始人 Greg Brockman带队开播进行了产品介绍,开发人员称
头部科技的头像-创奇社头部科技24天前
0487
ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道-创奇社

ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道

失眠。然而,更大惊喜在后面——GPT-4.1、o3、o4系模型或许将在下周发布。 昨晚,奥特曼一则预
新智元的头像-创奇社新智元32天前
080
估价200亿美元?!谷歌面临反垄断强拆,OpenAI欲趁机拿下Chrome浏览器发力AI搜索-创奇社

估价200亿美元?!谷歌面临反垄断强拆,OpenAI欲趁机拿下Chrome浏览器发力AI搜索

OpenAI计划收购谷歌Chrome浏览器,但面临司法部反垄断调查。目前,ChatGPT已崛起为欧洲主要搜索引擎之一,尽管市场份额仍较小。OpenAI正在秘密招募前谷歌开发人员以研发与Chrome竞争的浏览器。...
头部科技的头像-创奇社头部科技19天前
0329
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比-创奇社

GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比

OpenAI发布了GPT-4.1系列模型,相比前代GPT-4.5有显著提升。新版本包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,主打长上下文处理能力和性价比。
量子位的头像-创奇社量子位28天前
0120
Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子-创奇社

Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子

enAI最新框架PaperBench正为此生,让AI智能体从头开始复现ICML 2024 20篇优秀
新智元的头像-创奇社新智元40天前
0110