end0tknr's kipple - web写経開発

太宰府天満宮の狛犬って、妙にカワイイ

交差検証 ( Cross-Validation )におけるデータ分割

理解していなかったので、メモ。

参考url

https://www.codexa.net/cross_validation/

交差検証における3種のデータ

データ種 内容
訓練データ モデルの学習に使用
検証データ モデルのハイパーパラメータ調整に使用 (※1)
テストデータ モデル評価に使用

※1 モデルの重みの他にハイパーパラメータを持つ モデル(例:SVM、Random Forest)は、訓練データだけでは 最適化できない為

交差検証におけるデータ分割イメージ

┌───────────────────┬──┐     ┌──┐
│              訓練                    │検証│モデル1│テスト │
└───────────────────┴──┘     └──┘
┌────────────────┬──┬──┐     ┌──┐
│              訓練              │検証│訓練│モデル2│テスト │
└────────────────┴──┴──┘     └──┘
                 :                                     :
┌──┬───────────────────┐     ┌──┐
│検証│        訓練                          │モデルN│テスト │
└──┴───────────────────┘     └──┘