CruxEval-i共1篇
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用-创奇社 - AI前沿·副业变现·资源教程!

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

i团队重磅LLM研究!简单指令:「Wait,」就能有效激发LLM显式反思,表现堪比直接告知模型存在错
新智元的头像-创奇社 - AI前沿·副业变现·资源教程!新智元1个月前
02115