KVzap論文の深掘り説明この論文は、arXivで公開された「KVzap: Fast, Adaptive, and Faithful KV Cache Pruning」というタイトルで、著者はNVIDIAのSimon JégouとMaximilian Jeblickです。2026年1月の最新論文で、大規模言語モデル(LLM、例えばChatGPTのようなAI)の推論(応答生成)時の ...