「データが足りないなら増やす。多すぎるなら減らす。」 シンプルに言えば、それがサンプリングの発想です。 特に分類問題などで、片方のクラスだけが極端に少ない(例えば「異常」や「不良品」など)とき、モデルは多数派ばかりを学習してしまい ...
SMOTE(Synthetic Minority Over-sampling Technique)は、不均衡なデータセットの問題に対処するために開発されたオーバーサンプリングの手法です。オーバーサンプリングの主な目的は少数クラスのサンプル数を増加させることにより、クラス間のバランスを改善し ...