fMRI解析の基礎 (6):多重比較問題

最終更新日: 2020年5月27日

Statistical Parametric Map から、タスクに敏感なボクセルの閾値をどのように決めますか?

各ボクセルに対しては、標準正規分布から偽陽性率が基準と一致する閾値を決定することができます。しかし、全脳の約10万ボクセルに偽陽性率5%をそのまま当てはめると、約5000ボクセルに偽陽性が発生してしまいます。そうすると、死んだサケのfMRI画像に検定を行っても有意なボクセルが検出されたりします(The Story Behind the Atlantic Salmon)。

これが多重比較問題です。解決策としては、「経験的な偽陽性率」を利用して閾値を補正します

1. Sidak and Bonferroni Corrections

全ての検定が独立であるという仮定の下では、各検定における偽陽性率 αt\alpha_t を以下のように決めると「全ての検定における偽陽性率の少なくとも1つは αE\alpha_E」となります。つまり、偽陽性率の最大値が αE\alpha_E となります1

  1. Sidak Correction
αt=1(1αE)1N\alpha_t=1-(1-\alpha_E)^{\frac{1}{N}}
  1. Bonferroni Correction
αt=αEN\alpha_t=\frac{\alpha_E}{N}

2は1の近似となっていて高速に計算できます。ヒトfMRIにおいて Sidak Correction の閾値は大きすぎるため、真の信号も棄却する可能性が高いです。これを防ぐために、検定するボクセル数を制限する・ボクセルサイズを大きくすることが考えられます。

fMRIデータ上では全ての検定が独立であるという仮定は成立していません。そのため、これらの補正は非常に大きい閾値となってしまいます

さらに、SN比が低いため少しの閾値変化が深刻な問題となります。これらの問題は現在の手法でも完全には解決できていません。

2. ガウス型確率場(Gaussian Random Fields)

ガウス型確率場(GRF)では、確率場内の変数が正規分布に従います。統計マップを GRF としてモデル化すると、空間的な相関関係をよく近似できます

帰無仮説が全てのボクセルで真となるとき、以下の式を満たします。

αE=P(max1iNvziT)\alpha_E = P\left(\max_{1 \leq i \leq N_v}z_i \geq T\right)

これを使用するには、GRF で統計マップの最大値の確率分布を決める必要があります。しかし、空間構造の正しい答えは無く、任意の GRF から最大値の分布を求める方法も無いので、モデルの適合性の指標がないという問題があります。

GRFの適用方法:

  1. 脳ボリュームと同じ格子に、統計マップのz分布から抽出したサンプルを配置する。
  2. 前処理と同様にスムージングをかける。→ 空間的な相関関係が現れる。

この閾値は、空間的な相関のために Bonferroni Correction より保守的でないです2

オイラー標数 χT\chi_T を利用すると、上の偽陽性率を近似できます。この補正方法はSPMに実装されています。

αEP(χT>1)=E(χT)d=03Rd(ROI)fd(T)\alpha_E \simeq P(\chi_T>1)= \mathbb{E}(\chi_T) \simeq \sum_{d=0}^3R_d(ROI)f_d(T)

RdR_d はROIのd次元空間解像度、fdf_d は閾値 T のd次元空間解像度におけるオイラー標数です。

オイラー標数は、確率場における「最大値の分布の裾確率」を「ある閾値以上の集合が空集合である確率」で近似する方法です。 参考:正規確率場の最大値の分布


3. クラスターレベルのガウス型確率場

クラスターに基づいて有意性の判断をする方法もあります。これには、

  • クラスター内のボクセル数に閾値を設ける方法
  • クラスターの範囲やクラスター内の最大値に閾値を設ける方法

があります。

クラスタリングでは、ある閾値以上の連続したボクセルをまとめます。閾値によっては、クラスターサイズが大きくなりすぎて偽陽性率が高くなることがあります。適切な閾値設定が必要です

NcN_c個のクラスターが同定できた場合、それらが独立と仮定すると全体の偽陽性率は以下のようになります。

αE=1(1αt)Nc\alpha_E=1-(1-\alpha_t)^{N_c}

ただし、各クラスター内のボクセル数は確率変数なので一貫性がなくなるといった問題があります。GRFに基づくと、以下のような偽陽性率が得られます。

αE=1eμαt\alpha_E=1-e^{-\mu\alpha_t}

4. 順列検定

ノンパラメトリックな順列検定は多重比較問題にも適用できます。統計量を出す時点までは他の方法に従い、p値を算出する時に順列検定を使用します。空間的相関を変化させずに分布を推定できる利点があります。

多数のサンプルで多重比較の検証を行ったところ、順列検定が最も正確だったようです(Eklund et al. (2016))。クラスター + GRF 法は、クラスタリングの初期値に大きく依存していました。また、空間構造の推定が大雑把すぎることもわかりました。

5. 誤検出率(False Discovery Rate)

偽陽性率をコントロールする代わりに、誤検出率(FDR)を評価する方法が考えられました。つまり、信号のないボクセルで帰無仮説が誤って棄却される割合を評価します3

FDR={E(VR)(R>0)0(R=0)FDR= \left\{ \begin{array}{ll} \mathbb{E}\left( \frac{V}{R}\right) & (R \gt 0) \\ 0 & (R=0) \end{array} \right.

全ての検定でFDRqFDR\leq qとなるように閾値を決めます。p値を並べ替え、k番目の p値が pk<qk/Np_k \lt qk/N となるようにします(Benjamini and Hochberg., 1995)。 定義上、偽陽性率をコントロールするよりは多くの偽陽性を出してしまいますが、多くの真陽性を検出できます。

6. 見せかけの高い相関(Voodoo Correlation)

偽陽性の増加以外にも、見せかけの高い相関(Voodoo Correlation)による検出の誤りの問題があります。サンプル数が多くなると、ノイズも理想的な動きをする可能性が高くなってしまいます。

たとえば、行動学的な相関がfMRIのノイズの相関にも現れることがあります。これは、ボクセル選択と相関検定の両方が同じ基準であるために起きます。


Reference

  • Ashby, F. G. (2019). Statistical analysis of fMRI data. MIT press. url
  • The Story Behind the Atlantic Salmon. url
  • 川口 淳, 脳 MRI データの統計解析, 計量生物学, 2012-2013, 33 巻, 2 号, p. 145-174, 公開日 2013/03/07, Online ISSN 2185-6494, Print ISSN 0918-4430, url
  • Eklund, A., Nichols, T. E., & Knutsson, H. (2016). Cluster failure: Why fMRI inferences for spatial extent have inflated false-positive rates. Proceedings of the national academy of sciences, 113(28), 7900-7905. url

  1. 全てのボクセルごとに間違って神経活動を認めてしまう割合があって、その「最大値」だけを見て、基準値を超えないように制御しようという話。
  2. ボンフェローニ補正より甘い基準となる。
  3. 全てのボクセルごとに間違って神経活動を見出してしまう割合があって、その「最大値」だけを見て、基準値を超えないように制御しようという話。