LLMが自分で賢くなる2/トレーニング不要「Training-Free GRPO」 こんにちはmakokonです。 今日紹介するのは、LLMのインコンテキスト学習を突き詰めた、強化学習不要で自ら経験から学び賢くなる「Training-Free GRPO」です。昨日投稿したLLMが自分で賢く ...