排序
让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?
之前思考更长时间而训练。 这些推理模型首次实现了自主调用并整合 ChatGPT 内的全量工具:包括网
刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测
今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,OpenAI自己的模型准确率只有0.6%和0.9%,但最新发布的Agent模型Deep Research准确率达...
刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元
OpenAI 推出 gpt-image-1 API,允许开发者轻松集成高质量图像生成功能。此模型具备准确、多样的视觉风格等特性,支持通过文本提示生成图像,并按 token 进行定价。
Ilya新公司估值320亿美元,没有任何产品
SSI (Safe Superintelligence) has raised $2 billion and is valued at $32 billion, with plans to focus on safety and innovation rather than immediate products or cycles.
OpenAI深夜发布满血o3和o4mini: 两个没想到
OpenAI发布o3和o4-mini模型,具备连续调用超过600次工具的能力,超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。
重磅!微软上线GPT-image-1模型,支持高级功能定制
OpenAI发布GPT-image-1模型,微软Azure云服务同步上线。该模型支持深度定制和全网爆火功能,提升图像生成效率和质量。适用于教育、出版和游戏等行业,确保内容合规性和伦理规范。
OpenAI推出首个Nano模型:GPT-4.1 ,百万上下文、代码能力大幅超越GPT4.5
OpenAI发布GPT-4.1系列新模型,包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力,尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进,以及强大的视...
刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
今天凌晨 1点, OpenAI开源了一个全新的 AI Agent评测基准—— PaperBench。 该基准主要考核智能体的搜索、整合、执行等能力。
OpenAI正以30亿美元洽谈收购Windsurf,加码Agent赛道
OpenAI正洽谈以30亿美元收购AI编程平台Windsurf,显示其对Agent赛道的决心。Windsurf前身为Codeium,曾获得6500万美元和1.5亿美元融资,估值暴涨至12.5亿美元。Cascade是Windsurf的一大亮点,提...
ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制
ChatGPT新增功能可参考过往对话内容生成个性化回复,并支持记忆和引用之前的信息。OpenAI表示这标志着LLM交互范式的转变,用户可以询问AI关于自己之前的提问。不过也有负面反馈指出记忆的稳定性...
刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦
今天凌晨,1点30分,OpenAI发布了全新图像模型GPT-image-1,并已向全球开发者开放使用。该模型可通过API控制生成图像的多个参数,支持全网爆火的吉卜力模式等特性。目前已有Adobe、Figma、HeyGe...
刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文
今天凌晨 1点,OpenAI发布了最新模型——GPT-4.1。支持100万 tokens 上下文,提升多模态处理、代码能力、指令遵循等性能,已上线Azure OpenAI。
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
估价200亿美元?!谷歌面临反垄断强拆,OpenAI欲趁机拿下Chrome浏览器发力AI搜索
OpenAI计划收购谷歌Chrome浏览器,但面临司法部反垄断调查。目前,ChatGPT已崛起为欧洲主要搜索引擎之一,尽管市场份额仍较小。OpenAI正在秘密招募前谷歌开发人员以研发与Chrome竞争的浏览器。...
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
OpenAI发布了GPT-4.1系列模型,相比前代GPT-4.5有显著提升。新版本包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,主打长上下文处理能力和性价比。