fMRI解析の基礎 (5):GLMと検定

最終更新日: 2020年5月27日

1. ANOVA

例として、2つの要因A,BA,BによるANOVAを行います

yijk=μ+αi+βj+αβij+εijki:level ofA, j:level ofB, k:subjecty_{ijk} = \mu + \alpha_i + \beta_j + \alpha\beta_{ij} + \varepsilon_{ijk} \\[0.5em] i:\mathrm{level \ of} A, \ j: \mathrm{level \ of} B, \ k:\mathrm{subject}

これも設計行列と回帰係数を用いて行列表示できるため、GLMのひとつと考えられます。

y=Xβ+εy = X\beta + \varepsilon

ノイズ同士の相関がほぼ無く、等分散の場合には、ガウス-マルコフ定理を用いてパラメータ推定ができます。

Gauss-Markov theorem:二乗和誤差を最小化するβ\betaが最適値(最良線形不偏推定量)となります (wiki)。

β^=(XTX)1XTy\hat{\beta}=(X^T X)^{-1}X^Ty

2. パラメータ推定

β\betaを一意に定めるために、XTXX^T Xは正則である必要があります1。そのためにも「Jittering」によって共線性を低くします。

ノイズの分散σε2\sigma_{\varepsilon}^2の推定値は、以下の式で評価できます。

σε2=1dfE(yXβ^)T(yXβ^)\sigma_{\varepsilon}^2 = \frac{1}{df_E}(y-X\hat{\beta})^T(y-X\hat{\beta})

ノイズには時間相関がある場合もあります。これを修正する方法には、「hrfで時間軸に沿ったスムージング」や「Prewhitening」などがあります。Prewhitening では、ノイズに自己回帰過程(AR過程)を用いることで時間相関を除外します。

また、ノイズの時間相関をGLMに取り入れてしまう例もあります(一般線形モデル)。具体的には、ノイズの共分散行列を対角要素以外も考慮してモデル化します。この場合、推論は難しくなります。

3. 仮説検定

帰無仮説検定に使用する帰無仮説は、コントラストベクトル cc' を用いて表現できます

H0:cβ=0\mathrm{H_0}:c'\beta=0

(例)H0:β1=0\mathrm{H_0}:\beta_1=0 の場合、c=(1,0,0,0), β=(β1,β2,B0,Δ)Tc'=(1,0,0,0), \ \beta = (\beta_1,\beta_2, B_0, \Delta)^T とする。

XTXX^T Xが正則である限り全ての帰無仮説が検定できます。

t検定

t=cTβ^c0σε2^cT(XTX)1ct=\frac{c^T\hat{\beta}-c_0}{\sqrt{\hat{\sigma_{\varepsilon}^2}c^T(X^T X)^{-1}c}}

帰無仮説 H0:cTβ=c0\mathrm{H_0:}c^T\beta=c_0 の下で、上の t 値は自由度 NTRrN_{TR}-r の t 分布に従います。TRはふつう数百あるので、 t 分布は標準正規分布に近づきます。全てのボクセルに対して t 値を算出した結果を、Statistical Parametric Map と呼びます。

以下のような注意点があります。

  • 第一の誤り(偽陽性)を減らすようにする(多重比較問題)。
  • 設計行列の共線性を低くする(cT(XTX)1cc^T(X^T X)^{-1}cが小さくなるように設計する)。

多重検定:one way ANOVA

3つのイベントに対して、帰無仮説は H0:Qβ=q0\mathrm{H_0:}Q\beta=q_0 と表現できます。

  • 例)QβQ\beta を次のように設計します。
    Qβ=[110001010001100][β1β2β3B0Δ]=[β1β2β1β3β2β3]\begin{alignedat}{2} Q\beta &= \begin{bmatrix} 1 & -1 & 0 & 0 & 0 \\ 1 & 0 & -1 & 0 & 0 \\ 0 & 1 & -1 & 0 & 0 \\ \end{bmatrix} \begin{bmatrix} \beta_1 \\ \beta_2 \\ \beta_3 \\ B_0 \\ \Delta \end{bmatrix} \\ &= \begin{bmatrix} \beta_1 - \beta_2 \\ \beta_1 - \beta_3 \\ \beta_2 - \beta_3 \end{bmatrix} \end{alignedat}
    帰無仮説が、H0:Qβ=q0=O\mathrm{H_0:}Q\beta=q_0=\mathbb{O} のとき、対立仮説 H1\mathrm{H_1}は「β1β2\beta_1 \neq \beta_2 または β1β3\beta_1 \neq \beta_3 または β2β3\beta_2 \neq \beta_3」となります。

帰無仮説検定の指標となる F 値は以下のように算出します。帰無仮説が正しい場合、F 値は m 次の F 分布に従います。

F=(Qβ^q0)T[Q(XTX)QT]1(Qβ^q0)mσε2^F=\frac{(Q\hat{\beta}-q_0)^T[Q(X^TX)Q^T]^{-1}(Q\hat{\beta}-q_0)}{m\hat{\sigma_{\varepsilon}^2}}

FBR model の場合:カイ二乗検定

1つのイベントに対して複数のβ\betaがあるため、帰無仮説は H0:i=1Mβi2=0\mathrm{H_0:}\sum_{i=1}^M\beta_i^2=0 となります。

この場合、以下のカイ二乗値を評価します。帰無仮設が正しい場合、カイ二乗値は M 次のカイ二乗分布に従います。

χ2=β^T[A(XTX)AT]β^σε2^\chi^2=\frac{\hat{\beta}^T[A(X^TX)A^T]\hat{\beta}}{\hat{\sigma_{\varepsilon}^2}}

4. 多変量GLM

単変量解析では、それぞれのボクセルの独立性を仮定していました。ここでは、2つ以上のボクセルを同時に解析することで空間的な相関関係を考慮します。

今までのGLMを、D 個のボクセルに拡張したときの行列表示は以下のようになります。

Y=XB+EY=XB+E

多変量GLMでは、時間的な独立性のみを前提とします。誤差項EEは全てのTRで同じものとします。

この最適解は単変量GLMと同様に正規方程式で与えられます。

B^=(XTX)1XTY\hat{B}=(X^TX)^{-1}X^TY

誤差項はE=YXB^E=Y-X\hat{B}となります。誤差の分散共分散行列Σ^s\hat{\Sigma}_sを推定しましょう。

Σ^s=1NTRrank(X)(YXB^)T(YXB^)\hat{\Sigma}_s=\frac{1}{N_{\mathrm{TR}}-\mathrm{rank}(X)}(Y-X\hat{B})^T(Y-X\hat{B})

5. ノンパラメトリック法

以上のGLMは、生のBOLD反応が正規分布に従い、神経活動と時系列相関があるという仮定の下で成立します

分布の仮定を弱めるために、ノンパラメトリック手法であるブートストラップ法が使われることもあります。

  1. 元データの統計量を算出する。
  2. TRをシャッフルして、統計量を算出するのをM回繰り返す。
  3. 求めた全統計量内における元データの統計量以上の割合を、帰無仮説検定の p 値とする。

7. Percent Signal Change

BOLD値は、以降の解析のために Percent Signal Change という統計量に変換することがあります。

Taskの効果量のみをパーセント指標で表現しましょう。Task と Rest がある場合、以下のように求めます。

yˉR=1NRi=1NRyR(i)yˉT=1NTi=1NTyT(i)QT=(yˉTyˉRyˉR)×100%\bar{y}_R=\frac{1}{N_R}\sum_{i=1}^{N_R}y_R(i) \\ \bar{y}_T=\frac{1}{N_T}\sum_{i=1}^{N_T}y_T(i) \\ Q_T = \left(\frac{\bar{y}_T-\bar{y}_R}{\bar{y}_R}\right) \times 100 \%

Rapid Event-Related Desgin では Rest が定義しにくいので、実験全体の平均BOLDをyˉR\bar{y}_Rとすることがあります。しかし、この方法は過大評価する傾向があります。

GLMを用いてNuisance 変数の回帰係数を計算し、それを用いて Rest の平均BOLDを推定することもできます。

QT=1NTR(i=1NTR[β^1x1(TRi)+β^2x2(TRi)]B^0+12(NTR+1)Δ^)×100%Q_T = \frac{1}{N_{TR}}\left(\frac{\sum_{i=1}^{N_{TR}} [\hat{\beta}_1x_1(TR_i)+\hat{\beta}_2x_2(TR_i)]}{\hat{B}_0 + \frac{1}{2}(N_{TR}+1)\hat{\Delta}}\right) \times 100 \%

この方法は Task-related BOLDの最大値を過小評価してしまうため、ボックスカーを元にした以下の推定値が利用されているようです。

QT=(β^B^0+12(NTR+1)Δ^)×100%Q_T = \left(\frac{\hat{\beta}}{\hat{B}_0 + \frac{1}{2}(N_{TR}+1)\hat{\Delta}}\right) \times 100 \%

Reference

  • Ashby, F. G. (2019). Statistical analysis of fMRI data. MIT press. url

  1. XTXX^TXが非正則またはそれに近い場合、逆行列(XTX)1(X^T X)^{-1}の計算が不安定になってしまいます。