今年初めに公開されたオープン人工知能(AI:artificial intelligence)モデルDeepSeek-R1における大規模推論モデルの訓練手法を報告する論文が、今週のNature にオープンアクセスで掲載される。大規模言語モデル(LLM:large language model)の推論能力は純粋な強化学習 ...