sn42
R&D Job in Japan.
Topics
My Twitter
0. はじめに
1. BOLD反応
2. 実験デザイン
3. 前処理
4. GLMの理論
5. GLMと検定
6. 多重比較問題
7. 集団解析
8. 接続性解析
9. コヒーレンス解析
10. 主成分分析
11. 独立成分分析
12. デコーディング
13. エンコーディング
14. 動的因果モデリング
15. 表現類似性分析
Statistical Parametric Map から、タスクに敏感なボクセルの閾値をどのように決めますか?
各ボクセルに対しては、標準正規分布から偽陽性率が基準と一致する閾値を決定することができます。しかし、全脳の約10万ボクセルに偽陽性率5%をそのまま当てはめると、約5000ボクセルに偽陽性が発生してしまいます。そうすると、死んだサケのfMRI画像に検定を行っても有意なボクセルが検出されたりします(The Story Behind the Atlantic Salmon)。
これが多重比較問題です。解決策としては、「経験的な偽陽性率」を利用して閾値を補正します。
全ての検定が独立であるという仮定の下では、各検定における偽陽性率 を以下のように決めると「全ての検定における偽陽性率の少なくとも1つは 」となります。つまり、偽陽性率の最大値が となります1。
2は1の近似となっていて高速に計算できます。ヒトfMRIにおいて Sidak Correction の閾値は大きすぎるため、真の信号も棄却する可能性が高いです。これを防ぐために、検定するボクセル数を制限する・ボクセルサイズを大きくすることが考えられます。
fMRIデータ上では全ての検定が独立であるという仮定は成立していません。そのため、これらの補正は非常に大きい閾値となってしまいます。
さらに、SN比が低いため少しの閾値変化が深刻な問題となります。これらの問題は現在の手法でも完全には解決できていません。
ガウス型確率場(GRF)では、確率場内の変数が正規分布に従います。統計マップを GRF としてモデル化すると、空間的な相関関係をよく近似できます。
帰無仮説が全てのボクセルで真となるとき、以下の式を満たします。
これを使用するには、GRF で統計マップの最大値の確率分布を決める必要があります。しかし、空間構造の正しい答えは無く、任意の GRF から最大値の分布を求める方法も無いので、モデルの適合性の指標がないという問題があります。
GRFの適用方法:
この閾値は、空間的な相関のために Bonferroni Correction より保守的でないです2。
オイラー標数 を利用すると、上の偽陽性率を近似できます。この補正方法はSPMに実装されています。
はROIのd次元空間解像度、 は閾値 T のd次元空間解像度におけるオイラー標数です。
オイラー標数は、確率場における「最大値の分布の裾確率」を「ある閾値以上の集合が空集合である確率」で近似する方法です。 参考:正規確率場の最大値の分布
クラスターに基づいて有意性の判断をする方法もあります。これには、
があります。
クラスタリングでは、ある閾値以上の連続したボクセルをまとめます。閾値によっては、クラスターサイズが大きくなりすぎて偽陽性率が高くなることがあります。適切な閾値設定が必要です。
個のクラスターが同定できた場合、それらが独立と仮定すると全体の偽陽性率は以下のようになります。
ただし、各クラスター内のボクセル数は確率変数なので一貫性がなくなるといった問題があります。GRFに基づくと、以下のような偽陽性率が得られます。
ノンパラメトリックな順列検定は多重比較問題にも適用できます。統計量を出す時点までは他の方法に従い、p値を算出する時に順列検定を使用します。空間的相関を変化させずに分布を推定できる利点があります。
多数のサンプルで多重比較の検証を行ったところ、順列検定が最も正確だったようです(Eklund et al. (2016))。クラスター + GRF 法は、クラスタリングの初期値に大きく依存していました。また、空間構造の推定が大雑把すぎることもわかりました。
偽陽性率をコントロールする代わりに、誤検出率(FDR)を評価する方法が考えられました。つまり、信号のないボクセルで帰無仮説が誤って棄却される割合を評価します3。
全ての検定でとなるように閾値を決めます。p値を並べ替え、k番目の p値が となるようにします(Benjamini and Hochberg., 1995)。 定義上、偽陽性率をコントロールするよりは多くの偽陽性を出してしまいますが、多くの真陽性を検出できます。
偽陽性の増加以外にも、見せかけの高い相関(Voodoo Correlation)による検出の誤りの問題があります。サンプル数が多くなると、ノイズも理想的な動きをする可能性が高くなってしまいます。
たとえば、行動学的な相関がfMRIのノイズの相関にも現れることがあります。これは、ボクセル選択と相関検定の両方が同じ基準であるために起きます。