fMRI解析の基礎 (7):集団解析

最終更新日: 2020年5月27日

GLMによる集団解析には、2段階の分析が必要となります

  1. 個人ごとのGLM
  2. 統計マップの集合に対するGLM

1. 個人差

被験者のサンプルから母集団について推定するには、母集団の正確なモデル化が必要となります。そのためには、「構造的な個人差」と「機能的な個人差」を取り除かなければならないです

「構造的な個人差」を取り除くためには、前処理の正規化(標準脳への変換)が重要となります。正規化により、全員のボクセルの位置する脳領域が揃えられます。

しかし、正規化によって「機能的な個人差」は取り除けません。Miller et al., (2009) では、被験者間の機能のばらつきは被験者内の機能のばらつきよりはるかに大きいことが分かりました。さらに、「異なるタスクの被験者内の活動パターン」は、「同じタスクの被験者間の活動パターン」より類似度が高くなりました。

そのため、前提として定性的な「機能的な個人差」が無いような集団内で解析をする必要があります

2. 固定効果分析

固定効果分析では、個人解析において異なるタスクに適用する時と同様に集団解析を行います。そのため、サンプル内の分散はノイズのみに依存し、その時間相関は考慮できません。

yi=Xiβi+εii:subject i, εiN(0,σW2I)y_i=X_i\beta_i+\varepsilon_i \\[0.5em] i:\mathrm{subject \ i},\ \varepsilon_i \sim N(0,\sigma_W^2I)

帰無仮説は、平均回帰係数 βG=E(βi)\beta_G=\mathbb{E}(\beta_i) を用いて H0: ctβG=0\mathrm{H_0:}\ c^t\beta_G=0となります。例えば、H0:β1Gβ2G=0\mathrm{H_0}:\beta_{1G}-\beta_{2G}=0 を検定します。

ノイズの分散には、各被験者のGLMの結果を平均して用いることができます。そのため、自由度Ns(NTRr)N_s(N_{\mathrm{TR}}-r)の t 分布に従う t 統計量を以下のように算出できます。

σ^W2=1Nsi=1Nsσ^i2tFX=cTβ^Gσ^W2NscTi=1Ns(XiTXi)1c\hat{\sigma}_W^2 = \frac{1}{N_s}\sum_{i=1}^{N_s} \hat{\sigma}_i^2 \\[1em] t_{FX}=\frac{c^T\hat{\beta}_G}{\frac{\hat{\sigma}_W^2}{N_s}\sqrt{c^T\sum_{i=1}^{N_s}(X_i^TX_i)^{-1}c}}

3. 変量効果分析

変量効果分析では、被験者間の分散も推定します。被験者間分散は被験者内分散より大きいので t 統計量は低くなり、取得サンプルへの比重は固定効果のときより低下します。

yi=XiβG+XiεGi+εii:subject i, εiN(0,σW2I), εGiN(0,σG2I)y_i=X_i\beta_G+X_i\varepsilon_{G_i} +\varepsilon_i \\ i:\mathrm{subject \ i},\ \varepsilon_i \sim N(0,\sigma_W^2I),\ \varepsilon_{G_i} \sim N(0,\sigma_G^2I)

このようなモデルは、混合効果モデルと呼ばれます。このモデルにおいても、帰無仮説は H0: ctβG=0\mathrm{H_0:}\ c^t\beta_G=0となります。以下のように t 統計量を算出します。ScTβ^iS_{c^T\hat{\beta}_i}は各被験者の分散です。

t=cTβ^GScTβ^i/Nst=\frac{c^T\hat{\beta}_G}{\sqrt{S_{c^T\hat{\beta}_i}/N_s}}

変量効果分析において、GLMの回帰係数は以下のようにモデル化されています。

βi=βG+εGi\beta_i=\beta_G+\varepsilon_{G_i}

このモデルでは、「被験者がランダムに抽出されているため、その効果は正規分布に従う」という強い仮定が存在することになります。正規性が無い場合には貧弱なモデルとなりやすいでしょう。

4. モデルの比較

GLMにおける母集団推定では、個人差は変量因子と仮定すると良いです。つまり、実験を繰り返した時の個人差は、ランダムに現れるとします

一方、神経疾患グループなど固定効果の影響が大きい場合は、固定因子でモデル化するほうが適切です

集団解析の手順まとめ

1. 個人ごとにGLMをする。
2. 個人ごとに統計量を計算して、統計マップを作成する。
3. 固定効果モデルや変量効果モデルを用いて、複数の統計マップから1つの統計マップを作成する。
4. 多重比較問題を考慮して閾値を設定し、有意なボクセルを決定する。

固定効果モデルと変量効果モデルでは、統計量を計算するときの分母が違います。変量効果モデルでは大きな被験者間分散が分母に影響する場合があります。これを避けるためには「TR数を少なく」「被験者数を多く」といった工夫が必要です。

また、分布の自由度が違います。変量効果モデルのほうが自由度は高いですが、有意性の閾値も厳しくなります。

5. 多因子分析

流れは同じで、個人のGLM→集団のANOVAとします。SPMやFSLで行うためには、適切なANOVAの設計が必要です。このようなアプリケーションでは、group×subjectのmulti-factor repeated-ANOVAがなされます。球面性の仮定がしばしば問題となります。

参考:私のための統計処理 - 2要因で分類される多群の検定

6. Power Analysis

検出力の推定のために Power Analysis を行うことが重要です1

検出力は「1 - 偽陰性率(Type 2 Error)= 1β1-\beta」で定義されます。検出力を求めるためには、t 分布の棄却域の面積を求めます。これには、偽陽性率α\alpha、分布の偏りδ\delta、自由度(サンプル数)が必要になります。δ\deltaのパラメータであるKは、一般的には1β=0.801-\beta=0.80以上となるように選択します。

Desmond and Glover (2002) が示すところによると、多重比較の問題によりα\alphaを非常に小さく制限する場合、検出力を補うのに少なくとも38人の被験者が必要となります被験者内の分散σW\sigma_Wも検出力に大きく影響するため、できるだけノイズを減らすことが重要となります。また、固定効果モデルではさらに高い検出力が必要とされます。

7. Meta-Analysis

fMRI実験はコストが高いので、検出力の低いサンプル数のデータセットが多くなります。一方、長年の研究によって多くの類似するfMRI実験データが存在します。これを利用して、単一の実験よりも検出力の高い推定を行う方法を Meta-Analysis と呼びます

効果量を組み合わせる統計モデルが中心ですが、領域を元にした Coordinate-Based Meta-Analysis もあります。

以前の研究では、固定効果モデルを用いて、より強い固定効果を検出するのが主流であったようです。しかし現在は、固定量はタスクが同じでも実験によって変化するため、変量効果モデルを用いるのが適切とされているようです。変量効果モデルでは、大きなデータセットに比重をかけすぎないように分析できます。

Multilevel Kernel Density Analysis

  1. 使用するデータを決めて、それらの座標マップを取得する。
  2. 座標マップを、比較指標 Ci(k)C_i(k) の統計マップ に変換する。
  3. NMN_M個のマップから、活性化した割合 Q(k)Q(k) を計算する。
Q(k)=1i=1NMwii=1NMwiCi(k)Q(k)=\frac{1}{\sum_{i=1}^{N_M}w_i}\sum_{i=1}^{N_M}w_iC_i(k)
  1. Q(k)Q(k) から有意性を決定する。

Reference

  • Ashby, F. G. (2019). Statistical analysis of fMRI data. MIT press. url
  • Miller, M. B., Donovan, C. L., Van Horn, J. D., German, E., Sokol-Hessner, P., & Wolford, G. L. (2009). Unique and persistent individual patterns of brain activity across different memory retrieval tasks. Neuroimage, 48(3), 625-635. url
  • Desmond, J. E., & Glover, G. H. (2002). Estimating sample size in functional MRI (fMRI) neuroimaging studies: statistical power analyses. Journal of neuroscience methods, 118(2), 115-128. url

  1. Power Analysisは実験・分析後にすることはできません。実験・分析前に行って検出力を推定しておく必要があります。