博士水平 - 创奇社 - AI 与 DeepSeek 前沿资讯・资源・课程平台

刚刚，OpenAI开源PaperBench，重塑顶级AI Agent评测

刚刚，OpenAI开源PaperBench，重塑顶级AI Agent评测

今天凌晨 1点， OpenAI开源了一个全新的 AI Agent评测基准—— PaperBench。该基准主要考核智能体的搜索、整合、执行等能力。

2025-04-03 40

在线客服
升级VIP
繁简切换
返回顶部