数学测试共2篇
豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1-创奇社

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

字节跳动发布豆包1.5·深度思考模型,采用MoE架构,参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平,具备‘边想边搜’、视觉理解等实用能力。
智东西的头像-创奇社智东西24天前
0347
UC伯克利:让推理模型少思考,准确率反而更高了!-创奇社

UC伯克利:让推理模型少思考,准确率反而更高了!

UC伯克利研究发现,强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型,在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。
量子位的头像-创奇社量子位24天前
03514