理解していなかったので、メモ。
参考url
https://www.codexa.net/cross_validation/
交差検証における3種のデータ
データ種 | 内容 |
---|---|
訓練データ | モデルの学習に使用 |
検証データ | モデルのハイパーパラメータ調整に使用 (※1) |
テストデータ | モデル評価に使用 |
※1 モデルの重みの他にハイパーパラメータを持つ モデル(例:SVM、Random Forest)は、訓練データだけでは 最適化できない為
交差検証におけるデータ分割イメージ
┌───────────────────┬──┐ ┌──┐ │ 訓練 │検証│モデル1│テスト │ └───────────────────┴──┘ └──┘ ┌────────────────┬──┬──┐ ┌──┐ │ 訓練 │検証│訓練│モデル2│テスト │ └────────────────┴──┴──┘ └──┘ : : ┌──┬───────────────────┐ ┌──┐ │検証│ 訓練 │モデルN│テスト │ └──┴───────────────────┘ └──┘