🗺️

非線形含む固定効果モデルについて

に公開

固定効果モデル

固定効果(Fixed-Effects, FE)モデルは、パネルデータに対して適用され、時間不変かつ観測されない個人間異質性を制御できる強力な手法です。疫学で用いられることはあまり多くありませんが、計量経済学では多用されます。

パネルデータとは、複数の個体(個人、企業、地域など)を複数の時点にわたって観測したデータです。固定効果モデルは、各個体に固有の時間不変な特性が結果変数に与える影響を制御しながら、時間変動する説明変数の効果を推定することを可能にします。

モデルの定式化

標準的な固定効果モデルは以下のように定式化されます。

y_{it} = X_{it}\beta + \alpha_i + \epsilon_{it}

ここで、

  • y_{it} :個体単位iの時点tにおける被説明変数(アウトカム変数)
  • X_{it} :時間変動する独立変数(説明変数)のベクトル
  • \beta :独立変数の係数ベクトル
  • \alpha_i :観測されない、時間不変の個人特有の効果(個人固定効果)
  • \epsilon_{it} :個体特有の誤差項であり、個体と時間の両方で変動

固定効果モデルの重要な仮定は、観測されない個人効果 \alpha_i が説明変数 X_{it} と相関する可能性があるということです。通常のOLS(最小二乗法)では、この相関がある場合バイアスとなります。

推定

ここでの目標は、X_{it}\alpha_i の間の相関によってバイアスを受けることなく \beta を推定することです。これを達成するにはいくつかの方法があり、すべて方程式から固定効果 \alpha_i を除去することに焦点を当てています。

1. Within変換(Demeaning)

これは最も一般的な方法です。各個人について、各変数の時間平均を対応する変数から差し引きます。
まず、各個人iについて式を時間で平均します。

\bar{y}_i = \bar{X}_i\beta + \alpha_i + \bar{\epsilon}_i

ここで、\bar{y}_i = \frac{1}{T}\sum_{t=1}^T y_{it}\bar{X}_i = \frac{1}{T}\sum_{t=1}^T X_{it}、そして \bar{\epsilon}_i = \frac{1}{T}\sum_{t=1}^T \epsilon_{it} です。\alpha_i は時間を通じて一定なので変わらないことに注意。

次に、この時間平均された式を元の式から差し引きます。

(y_{it} - \bar{y}_i) = (X_{it} - \bar{X}_i)\beta + (\alpha_i - \alpha_i) + (\epsilon_{it} - \bar{\epsilon}_i)

これが「Within変換された」または「平均除去された(demeaned)」方程式です。固定効果 \alpha_i は除去されました。この変換された方程式にOLSを適用することで、\beta を推定できます。結果として得られる推定量は、「Within推定量」または「固定効果推定量」と呼ばれます。

2. 最小二乗ダミー変数(LSDV)法

他のモデル的に等価な方法として、回帰に各個体単位のダミー変数を含める方法があります。モデルは次のようになります。

y_{it} = X_{it}\beta + \sum_{j=1}^{N} d_{ij}\alpha_j + \epsilon_{it}

ここで、d_{ij}i=j の場合に1、それ以外の場合に0となるダミー変数です。これらのダミーの係数 \alpha_j は、各個体の推定された固定効果です。

このモデルはOLSで推定できます。LSDVモデルから得られる \beta の推定値は、Within変換から得られるものと同一になります。ただし、個体数(N)が非常に大きい場合、LSDVアプローチは計算量が多くなる可能性があります。

固定効果モデルの利点と欠点

利点:

  • 時間不変の全ての異質性を制御できる:観測されているか否かに関わらず、時間を通じて一定な個人特有の要因を制御できます。
  • 内生性への頑健性:説明変数と個人効果の相関が許容されるため、多くの状況で因果推論に有用です。

欠点:

  • 時間不変な変数の効果を推定できない:個人について時間を通じて変化しない変数(例:性別、人種、出生年など)は、個人の固定効果と完全に多重共線性を持つため、推定から除外されます。
  • 効率性の低下:個人効果と説明変数の相関を仮定しないランダム効果モデルなどと比較すると、仮定が成り立つ場合、その推定値よりも効率性が低くなります。
  • 測定誤差への脆弱性:Within変換により測定誤差バイアスを悪化させる可能性があります。
  • 時間変動が少ない変数の推定精度:Within変換は個人内の変動のみを利用するため、時間を通じてあまり変化しない変数の係数推定の精度が低くなります。

固定効果モデルは、Rでは以下のパッケージで実装できます。

  • plmパッケージ:plm(y ~ x, data = data, index = c("id", "time"), model = "within")
  • fixestパッケージ:feols(y ~ x | id, data = data)

パネルデータ分析では、固定効果モデルの他にランダム効果(Random-Effects, RE)モデルもよく用いられます。両者の主な違いは、個人効果\alpha_iと説明変数X_{it}の相関に関する仮定です。

固定効果モデル:

  • \alpha_iX_{it}の相関を許容する
  • Within変換により\alpha_iを除去して推定
  • 時間不変な変数の効果は推定できない

ランダム効果モデル:

  • \alpha_iX_{it}が無相関であることを仮定
  • より効率的な推定が可能
  • 時間不変な変数の効果も推定できる

どちらのモデルを選択すべきかを判断するために、Hausman検定がよく用いられます。この検定は、固定効果推定量とランダム効果推定量の差が統計的に有意かどうかを検証します。

  • 帰無仮説\alpha_iX_{it}は無相関(ランダム効果モデルが適切)
  • 対立仮説\alpha_iX_{it}は相関している(固定効果モデルが適切)

帰無仮説が棄却される場合、固定効果モデルを選択すべきです。ただし、理論的な考察や研究の文脈も考慮することが重要です。

固定効果ロジットモデル

基本的な固定効果モデルは以上の通りですが、目的変数が0/1データやカウントデータである場合、OLSではなくロジスティック回帰やポアソン回帰を適用したい場合が多々あります。この場合、\alpha_iの影響を取り除きながら\betaを推定するために、条件付き最尤法を用います。

基本的な固定効果モデルにおいては、Demeaningによって固定効果\alpha_iを除去することができますが、これはあくまで加法的な個人効果を取り除く操作になります。Logistic回帰やPoisson回帰ではP(Y_{it}=1)=\frac{\exp(X_{it}\beta + \alpha_i)}{1+\exp(X_{it}\beta + \alpha_i)}E[Y_{it}] = \exp(X_{it}\beta+\alpha_i)といったように\alpha_iが非線形な形で含まれるため、Demeaningでは\betaの正確な推定ができません。

非線形モデルであっても個人のダミー変数を含めることで固定効果を取り除くことはできますが、個人数Nが時間数Tに対して大きくなると、含める変数が非常に多くなり、かつ推定量の一致性が保たれません。

そこで、個人効果\alpha_iの十分統計量を考えます。\alpha_iの十分統計量s_iの値で条件づけたY_iの同時確率は\alpha_iには依存しなくなります。

L_{c,i}=P(Y_i|s_i, X_i)

これを個人iの条件付き尤度と呼びます。これを用いて全個人の条件付き対数尤度を最大化することで\betaを推定します。この推定法を条件付き最尤推定(Conditional Maximum Likelihood, CML)と呼びます。

\hat{\beta}_{CML}=\text{argmax}_{\beta}\sum_{i=1}^{N}\log(L_{c,i}(\beta))

以下では、ロジスティック回帰の場合について、具体的な導出を示します。

具体例:固定効果ロジットモデル

P(Y_{it}=1)=\frac{\exp(X_{it}\beta + \alpha_i)}{1+\exp(X_{it}\beta + \alpha_i)}

このモデルにおいて、個人iの同時尤度P(Y_i)は以下のようになります。

P(Y_i)=\prod_{t=1}^{T}P(Y_{it})=\prod_{t=1}^{T}\left(\frac{\exp(X_{it}\beta + \alpha_i)}{1+\exp(X_{it}\beta + \alpha_i)}\right)^{y_{it}}\left(\frac{1}{1+\exp(X_{it}\beta + \alpha_i)} \right)^{1-y_{it}}

これをさらに整理すると以下の通りになります。

P(Y_i)=\frac{\prod_t \exp(y_{it}(X_{it}\beta+\alpha_i))}{\prod_t(1 + \exp(X_{it}\beta+\alpha_i))}=\frac{\exp(\alpha_i\sum_ty_{it})\exp(\beta\sum_ty_{it}X_{it})}{\prod_t(1 + \exp(X_{it}\beta+\alpha_i))}

ここでs_i=\sum_ty_{it}とし、これで条件づけた尤度を考えます。c_i(\alpha_i,\beta)=\prod_t(1+\exp(X_{it}\beta+\alpha_i))と置くと、同時尤度は以下のように書けます。

P(Y_i,s_i)=\frac{\exp(\alpha_i s_i)\exp(\beta\sum_ty_{it}X_{it})}{c_i(\alpha_i,\beta)}

s_iで条件づけたY_iの同時確率はL_{c,i}(\beta)=P(Y_i| s_i)=P(Y_i, s_i)/P(s_i)となるので、この分母を計算します。これはY_{i}の合計がs_iになる全パターンY^*について、P(Y^*)を合計したものです。

P(s_i)=\sum_{Y^*|\sum y_{it}^*=s_i}P(Y^*)=\sum_{Y^*|\sum y_{it}^*=s_i}\left(\frac{\exp(\alpha_i s_i)\exp(\beta\sum_ty_{it}^*X_{it})}{c_i(\alpha_i,\beta)} \right)=\frac{\exp(\alpha_i s_i)}{c_i(\alpha_i,\beta)}\left(\sum_{Y^*|\sum y_{it}^*=s_i}\exp(\beta\sum_ty_{it}^*X_{it}) \right)

以上より、条件付き尤度L_{c,i}(\beta)=P(Y_i| s_i)=P(Y_i,s_i)/P(s_i)を計算すると、

L_{c,i}(\beta)=\frac{ \frac{\exp(\alpha_i s_i)\exp(\beta\sum_ty_{it}X_{it})}{c_i(\alpha_i,\beta)} } { \frac{\exp(\alpha_i s_i)}{c_i(\alpha_i,\beta)}\left(\sum_{Y^*|\sum y_{it}^*=s_i}\exp(\beta\sum_ty_{it}^*X_{it}) \right) }=\frac{\exp(\beta\sum_ty_{it}X_{it})}{\sum_{Y^*|\sum y_{it}^*=s_i}\exp(\beta\sum_ty_{it}^*X_{it})}

この最終的な条件付き尤度は、\betaとデータ(X_i, Y_i)にのみ依存し、\alpha_iは消えていることがわかります。

全個人について条件付き対数尤度の和を最大化することで、\betaを推定します。

\hat{\beta}_{CML}=\text{argmax}_{\beta}\sum_{i=1}^{N}\log(L_{c,i}(\beta))

なお、s_i=0 または s_i=Tの場合、L_{c,i}(\beta)=1となり、\log(L_{c,i}(\beta))=0となります。これは固定効果モデルが個人内での変動をもとに推定を行うためです。観察期間を通してアウトカムの変化がない個人は、推定に寄与しません。

まとめ

固定効果ロジットモデルは、以下の特徴を持ちます:

  • 個人固定効果\alpha_iを推定せずに\betaを推定できる:条件付き最尤法により、\alpha_iを消去した尤度関数を構築できます。
  • 時間不変の異質性を制御:観測されない個人特有の時間不変な要因の影響を除去できます。
  • 個人内変動のみを利用:観察期間中にアウトカムが変化しない個人(s_i=0 or T)は推定に寄与しません。
  • 計算効率:個人ダミーを直接含める方法(LSDV)と異なり、個人数Nが大きい場合でも効率的に推定できます。

固定効果ロジットモデルは、以下のRパッケージで実装されています:

  • survivalパッケージ:clogit(y ~ x + strata(id), data = data)

参考文献

  1. 山本勲 (2015). 『実証分析のための計量経済学』. 中央経済社.

  2. Allison, P. D. (2009). Fixed Effects Regression Models. SAGE Publications.

  3. Chamberlain, G. (1980). Analysis of covariance with qualitative data. The Review of Economic Studies, 47(1), 225-238.

Discussion