排序
刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文
今天凌晨 1点,OpenAI发布了最新模型——GPT-4.1。支持100万 tokens 上下文,提升多模态处理、代码能力、指令遵循等性能,已上线Azure OpenAI。
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
估价200亿美元?!谷歌面临反垄断强拆,OpenAI欲趁机拿下Chrome浏览器发力AI搜索
OpenAI计划收购谷歌Chrome浏览器,但面临司法部反垄断调查。目前,ChatGPT已崛起为欧洲主要搜索引擎之一,尽管市场份额仍较小。OpenAI正在秘密招募前谷歌开发人员以研发与Chrome竞争的浏览器。...
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
OpenAI发布了GPT-4.1系列模型,相比前代GPT-4.5有显著提升。新版本包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,主打长上下文处理能力和性价比。
速递|GPT-5前的最后冲锋?OpenAI亮出o3与o4-mini双模型,实现“用图像思考”
OpenAI发布O3和O4-mini两款新型AI推理模型,声称在数学、编程、推理、科学及视觉理解能力测试中超越此前所有模型。
OpenAI更新:ChatGPT有了完整记忆,可以参考过去所有聊天记录,提供更加个性化回复
ChatGPT新增记忆功能可参考过往聊天记录提供个性化回复,目前已向所有Plus和Pro用户开放。新功能引发热议及实测反馈,既有积极评价也有局限性讨论。OpenAI计划下周发布包括GPT-4.1在内的多款全...
OpenAI发布GPT-4.1:百万token上下文,全方位碾压4o并且价格更低,GPT-4.5三个月后下线
,分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅通过 API
o3狂烧3万美金解一题,反被AGI榜单除名!试错1024次不如10岁小孩哥4分钟
OpenAI的o3推理模型成本从预估的3000美元飙升至3万美元,远超预期。尽管o3-high试图通过暴力试错生成大量文本解答问题,但被ARC-AGI系统排除在外,因为每个任务的成本高达3万美元。
智商136,o3王者归来!变身福尔摩斯「AI查房」,一张图秒定坐标
OpenAI的o3模型在门萨智商测试中得分高达136,能够识别照片拍摄位置并进行复杂图像分析。尽管存在一些视觉推理问题上的不稳定性,但其强大的工程能力和顶尖基础性能使其有望解决这些问题。
OpenAI悄悄蓄力!ChatGPT改进记忆功能,AI将会了解你的一生,还有一批新模型在路上
OpenAI近期发布更新,ChatGPT现在可以参考用户的所有对话。然而,数据安全和隐私问题引发了争议。新版本的推出可能带来更高级别的上下文窗口和音乐生成模型。
OpenAI图像生成API上线!最贵1.4元生成一张图
OpenAI发布新模型GPT-image-1,支持生成和编辑图像。与GPT-4o相关功能新增指定质量、大小、格式等功能,支持透明背景等自定义输出。价格方面,文本输入5美元100万token;图像输入10美元100万tok...
AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一
PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为...
速递|OpenAI技术落地流媒体?Netflix澳新地区测试AI搜索,交互式搜索重塑内容发现
Netflix CEO Greg Peters announced the development of a new search experience using AI to enhance content discovery, with a Q1 revenue growth of 12.5% to $10.54 billion.
速递|OpenAI预测2030年收入突破1740亿美元,2029年实现正向现金流
OpenAI预计到2029年,其AI Agent及其他新产品将超越热门聊天机器人ChatGPT,总销售额达到1250亿美元。预测表明新收入来源有助于抵消成本,模型训练和运行费用等将放缓增长。OpenAI的毛利润预计...