脳画像解析における交差検証と精度誤差について

最終更新日: 2020年4月22日

Step1. 交差検証(Cross Validation, CV)とは?

未知のデータを予測するためには汎化性能が重要となります。訓練用のデータから評価用に分割して見ないようにすることで、未知のデータへの当てはまりを評価することが出来ます。 一般的には、評価用のデータを繰り返し変更して汎化性能を評価します。これを「交差検証」といいます。

fig2.png

K-fold CV(scikit-learn documents より引用)

1.交差検証の例

手法 分け方 評価回数
K-fold CV 全てのサンプルをK個に分割し、それぞれ1回ずつ評価用とする。 K 回
Leave-One-Out CV 全てのサンプルを一回ずつ評価用とする。 サンプル数 回
Shuffle Split 全てのサンプルから、ある割合でランダムに評価用とする。 任意 回

2.分割の注意点

  • バイアス・バリアンスのトレードオフ

    評価用のサンプル数が小さい場合、モデルのバリアンス(複雑さ)が低下します。逆に大きい場合、訓練用のサンプルが小さくなり、モデルのバイアス(適合度)が低下します。つまり、評価用のサンプル数が小さいと overfitting しやすく、大きいと underfitting しやすくなります

手法 バイアス(モデルの適合度) バリアンス(モデルの複雑さ)
K-fold CV
Leave-One-Out CV
Shuffle Split
  • 階層的データ構造の維持

    クラスや日付などのデータの性質を均一にして分割する必要があります。NeuroImagingでは、Session, Subject を単位として分割するとよいです。

3.Nested Cross Validation

ハイパーパラメータ調節のためにネストしたループを作り、内ループでハイパーパラメータの最適化、外ループで精度評価を行う方法。

Step2. 精度誤差について

精度(Accuracy) は、分類問題において正答数の割合として得られます。Gaël Varoquaux et al., 2017 では、fMRIを中心とした NeuroImaging 実験の2クラス分類における精度誤差を調査しています。以下の図1がその結果です。Nested Cross Validation を行い、外ループの精度と内ループの精度の差を比較しています。

fig1.jpg

図1(Gaël Varoquaux et al., 2017 より引用)

Leave-One-Sumple-Out CV (最上段)では、精度の差が大きくなっていることがわかります。K-fold CV(中段)や、Shuffle Split(最下段)では、その差が小さくなっていて、ばらつきも抑えられています。以上の経験的な結果から、NeuroImagingでは、Session, Subject を単位として Shuffle Split を繰り返し行うことが精度誤差を減らすことに繋がると思われます。

Q. なぜ Leave-One-Sumple-Out CV が良くないのか。

これは、サンプル同士が独立ではないからです。脳実験データは時系列データであるため、時系列的な相関がサンプル間に生じやすいです。さらに、被験者に特有な脳活動のために、被験者内のサンプル同士の相関が高くなりやすいです。

Step3. 精度誤差を減らすために

サンプル数を多くする・モデルの複雑さを低くすることで、バイアスを減らすことが重要となります。 Gaël Varoquaux, 2018 では、蓄積された大規模な公開データの利用を推奨しています。

Q. 精度誤差を評価するためには?

Permutation Test のようなノンパラメトリックな手法で基準値を算出し、精度誤差を評価することができます。


Reference

  • scikit-learn: Cross-validatoin
  • Varoquaux, Gaël, Pradeep Reddy Raamana, Denis A. Engemann, Andrés Hoyos-Idrobo, Yannick Schwartz, and Bertrand Thirion. “Assessing and Tuning Brain Decoders: Cross-Validation, Caveats, and Guidelines.” NeuroImage, Individual Subject Prediction, 145 (January 2017): 166–79. url.
  • Varoquaux, Gaël. “Cross-Validation Failure: Small Sample Sizes Lead to Large Error Bars.” NeuroImage, New advances in encoding and decoding of brain signals, 180 (October 2018): 68–77. url.