在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强
2025-04-20 30

OpenAI的o3模型在门萨智商测试中得分高达136,能够识别照片拍摄位置并进行复杂图像分析。尽管存在一些视觉推理问题上的不稳定性,但其强大的工程能力和顶尖基础性能使其有望解决这些问题。
2025-04-18 52

玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役
2025-04-17 44
没有账号?注册  忘记密码?