TriviaQA共1篇
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用-创奇社

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

i团队重磅LLM研究!简单指令:「Wait,」就能有效激发LLM显式反思,表现堪比直接告知模型存在错
新智元的头像-创奇社新智元20天前
02115