Agent模型共1篇
刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测-创奇社

刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测

今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,OpenAI自己的模型准确率只有0.6%和0.9%,但最新发布的Agent模型Deep Research准确率达...
AIGC开放社区的头像-创奇社AIGC开放社区32天前
0110