1. ANOVA
例として、2つの要因A,BによるANOVAを行います。
yijk=μ+αi+βj+αβij+εijki:level ofA, j:level ofB, k:subject
これも設計行列と回帰係数を用いて行列表示できるため、GLMのひとつと考えられます。
y=Xβ+ε
ノイズ同士の相関がほぼ無く、等分散の場合には、ガウス-マルコフ定理を用いてパラメータ推定ができます。
Gauss-Markov theorem:二乗和誤差を最小化するβが最適値(最良線形不偏推定量)となります (wiki)。
β^=(XTX)−1XTy
2. パラメータ推定
βを一意に定めるために、XTXは正則である必要があります。そのためにも「Jittering」によって共線性を低くします。
ノイズの分散σε2の推定値は、以下の式で評価できます。
σε2=dfE1(y−Xβ^)T(y−Xβ^)
ノイズには時間相関がある場合もあります。これを修正する方法には、「hrfで時間軸に沿ったスムージング」や「Prewhitening」などがあります。Prewhitening では、ノイズに自己回帰過程(AR過程)を用いることで時間相関を除外します。
また、ノイズの時間相関をGLMに取り入れてしまう例もあります(一般化線形モデル)。具体的には、ノイズの共分散行列を対角要素以外も考慮してモデル化します。この場合、推論は難しくなります。
3. 仮説検定
帰無仮説検定に使用する帰無仮説は、コントラストベクトル c′ を用いて表現できます。
H0:c′β=0
(例)H0:β1=0 の場合、c′=(1,0,0,0), β=(β1,β2,B0,Δ)T とする。
XTXが正則である限り全ての帰無仮説が検定できます。
t検定
t=σε2^cT(XTX)−1ccTβ^−c0
帰無仮説 H0:cTβ=c0 の下で、上の t 値は自由度 NTR−r の t 分布に従います。TRはふつう数百あるので、 t 分布は標準正規分布に近づきます。全てのボクセルに対して t 値を算出した結果を、Statistical Parametric Map と呼びます。
以下のような注意点があります。
- 第一の誤り(偽陽性)を減らすようにする(多重比較問題)。
- 設計行列の共線性を低くする(cT(XTX)−1cが小さくなるように設計する)。
多重検定:one way ANOVA
3つのイベントに対して、帰無仮説は H0:Qβ=q0 と表現できます。
- 例)Qβ を次のように設計します。
Qβ=⎣⎡110−1010−1−1000000⎦⎤⎣⎡β1β2β3B0Δ⎦⎤=⎣⎡β1−β2β1−β3β2−β3⎦⎤
帰無仮説が、H0:Qβ=q0=O のとき、対立仮説 H1は「β1=β2 または β1=β3 または β2=β3」となります。
帰無仮説検定の指標となる F 値は以下のように算出します。帰無仮説が正しい場合、F 値は m 次の F 分布に従います。
F=mσε2^(Qβ^−q0)T[Q(XTX)QT]−1(Qβ^−q0)
FBR model の場合:カイ二乗検定
1つのイベントに対して複数のβがあるため、帰無仮説は H0:∑i=1Mβi2=0 となります。
この場合、以下のカイ二乗値を評価します。帰無仮設が正しい場合、カイ二乗値は M 次のカイ二乗分布に従います。
χ2=σε2^β^T[A(XTX)AT]β^
4. 多変量GLM
単変量解析では、それぞれのボクセルの独立性を仮定していました。ここでは、2つ以上のボクセルを同時に解析することで空間的な相関関係を考慮します。
今までのGLMを、D 個のボクセルに拡張したときの行列表示は以下のようになります。
多変量GLMでは、時間的な独立性のみを前提とします。誤差項Eは全てのTRで同じものとします。
この最適解は単変量GLMと同様に正規方程式で与えられます。
B^=(XTX)−1XTY
誤差項はE=Y−XB^となります。誤差の分散共分散行列Σ^sを推定しましょう。
Σ^s=NTR−rank(X)1(Y−XB^)T(Y−XB^)
5. ノンパラメトリック法
以上のGLMは、生のBOLD反応が正規分布に従い、神経活動と時系列相関があるという仮定の下で成立します。
分布の仮定を弱めるために、ノンパラメトリック手法であるブートストラップ法が使われることもあります。
- 元データの統計量を算出する。
- TRをシャッフルして、統計量を算出するのをM回繰り返す。
- 求めた全統計量内における元データの統計量以上の割合を、帰無仮説検定の p 値とする。
7. Percent Signal Change
BOLD値は、以降の解析のために Percent Signal Change という統計量に変換することがあります。
Taskの効果量のみをパーセント指標で表現しましょう。Task と Rest がある場合、以下のように求めます。
yˉR=NR1i=1∑NRyR(i)yˉT=NT1i=1∑NTyT(i)QT=(yˉRyˉT−yˉR)×100%
Rapid Event-Related Desgin では Rest が定義しにくいので、実験全体の平均BOLDをyˉRとすることがあります。しかし、この方法は過大評価する傾向があります。
GLMを用いてNuisance 変数の回帰係数を計算し、それを用いて Rest の平均BOLDを推定することもできます。
QT=NTR1(B^0+21(NTR+1)Δ^∑i=1NTR[β^1x1(TRi)+β^2x2(TRi)])×100%
この方法は Task-related BOLDの最大値を過小評価してしまうため、ボックスカーを元にした以下の推定値が利用されているようです。
QT=(B^0+21(NTR+1)Δ^β^)×100%
Reference
- Ashby, F. G. (2019). Statistical analysis of fMRI data. MIT press. url