📊

論文紹介:Difference-in-Differences Designs: A Practitioner's Guide Part3

に公開

はじめに

https://zenn.dev/dmmdata/articles/d1b45bafcb78bc
こちらのブログの続きとなります。
本記事では、Staggered treatmentにおけるDID分析の理論と実践について解説します。

1. Staggered treatment adoption (G×T)

Staggered treatmentとは

従来の2×2 DID分析では、単一の時点で一部のユニットが処置を受けるという単純な設定を想定していました。しかし、現実の施策導入では、異なるグループが異なるタイミングで処置を開始することが一般的です。
Staggered treatmentでは以下のように表記を用います。

  • Y_{i,t}(g):ユニットiが時刻gに処置を開始した場合の時刻tにおける潜在的アウトカム
  • Y_{i,t}(\infty):never-treated(一度も処置を受けない)場合の潜在的アウトカム
  • G_i:ユニットiの処置開始時期
  • \mathcal{G}:すべての処置時期の集合

観測されるアウトカムは以下のように表現できます:

Y_{i,t} = \sum_{g \in \mathcal{G}} Y_{i,t}(g)\mathbb{1}\{G_i = g\}

この式は、観測されるアウトカムが、実際の処置タイミングに対応する潜在的アウトカムであることを示しています。最終的に処置を受けるすべてのユニットiとすべての処置前期間tについて、Y_{i,t}(g) = Y_{i,t}(\infty)が成立することを仮定します。

Staggered DIDでは「never-treated」グループが必要です。もしすべてのユニットが最終的に処置を受ける場合は、最後のコホートが処置を受ける時点以降のデータを削除し、最後のコホートを「never-treated」として扱います。

例:メディケイド拡大


図5は、メディケイド拡大のタイミング別に郡の死亡率トレンドを示しています。

2. Building block parameters with staggered adoption

グループ・時間別ATTパラメータ

Staggered treatmentは、処置の定義が変わるため、DID分析の構造に影響を与えます。
従来の2×2 DID設計では1つのターゲットパラメータ(ATT(2))のみを推定すれば十分でした。これが2×T DID設計になると、T-1個のパラメータが必要になります。具体的には、T-(g-1)個の処置後パラメータATT(t), t \geq gと、g-2個の事前トレンドパラメータです。

さらにStaggered DID設計では、処置日gで定義される各処置グループ(コホート)が、それぞれ独自のT-1個のイベントスタディパラメータのセットを持つことになります。

Staggered DID設計では、処置日gで定義される各処置グループ(コホート)には、独自のT-1個のイベントスタディパラメータのセットがあります。これらをGroup-Time Average Treatment Effectsと呼びます:

ATT(g,t) = \mathbb{E}_\omega[Y_{i,t}(g) - Y_{i,t}(\infty)|G_i = g]

ATT(g,t)の解釈

ATT(g,t)は以下を表します:

  • 期間gに処置を開始するコントロール群との比較
  • 期間gに実際に処置を開始したユニット間での効果
  • 期間tにおける平均処置効果

これは単に処置タイミングがgのイベントスタディパラメータです。

パラメータの具体例

図6は、各メディケイド拡大グループのイベントスタディ結果を示しています。
課題は次の3点です。サンプルサイズの大きな違い(2014年グループが80%を占める一方、2016年グループはわずか2%)により推定精度に差が生じること、2016年グループの事前トレンドに懸念があり平行トレンド仮定の検証が必要なこと、そして観察期間の違いにより早期採用グループでは長期効果を、後期採用グループでは短期効果のみしか観察できないことです。

3. Identification with staggered designs

ATT(g,t)の識別は、グループ固有のイベントスタディとして機能します。:

  • 処置後期間t \geq g):平行トレンド仮定により処置効果を識別
  • 処置前期間t < g):DID比較により事前トレンドの違いを検証(平行トレンド仮定のテスト)

Staggered DIDの最も重要な変更点は、異なる処置開始日を持つ複数の処置グループにアクセスできることで、代替的な比較グループのセットを使用できることです。どの比較グループを使用してATT(g,t)を識別するかは、どの形の平行トレンドが成立するかによります。

3つの平行トレンド仮定

以下の3つの仮定は、それぞれ異なる比較グループの選択と仮定の強さを持っています:

PT-GT-Nev(Never-treated)

仮定:すべての最終的に処置されるグループgと処置後期間t \geq gについて:

\mathbb{E}_\omega[Y_{i,t}(\infty) - Y_{i,t-1}(\infty)|G_i = g] = \mathbb{E}_\omega[Y_{i,t}(\infty) - Y_{i,t-1}(\infty)|G_i = \infty]

特徴

  • Never-treatedユニットを、最終的に処置されるすべてのユニットの比較グループとして使用
  • 処置後期間でのみ平行トレンドを課す
  • t = g-1はベースライン

識別結果

ATT(g,t) = \mathbb{E}_\omega[Y_{i,t} - Y_{i,t=g-1}|G_i = g] - \mathbb{E}_\omega[Y_{i,t} - Y_{i,t=g-1}|G_i = \infty]

これは本質的に2×2設計と同じです。2つの期間(tg-1)と2つのグループ(G_i = gG_i = \infty)のデータのみを使用しています。

PT-GT-NYT(Not-Yet-Treated)

仮定:最終的に処置されるグループg、まだ処置されていないグループg'g' > t)について:

\mathbb{E}_\omega[Y_{i,t}(\infty) - Y_{i,t-1}(\infty)|G_i = g] = \mathbb{E}_\omega[Y_{i,t}(\infty) - Y_{i,t-1}(\infty)|G_i = g']

特徴

  • 時間tまでにまだ処置されていないすべてのユニットを使用可能
  • Never-treatedユニットも含む
  • より多くの比較ユニットを活用できる

識別結果

ATT(g,t) = \mathbb{E}_\omega[Y_{i,t} - Y_{i,t=g-1}|G_i = g] - \mathbb{E}_\omega[Y_{i,t} - Y_{i,t=g-1}|G_i > \max\{g,t\}]

PT-GT-all(全期間・全グループ)

仮定:すべてのグループと時間期間で平行トレンドが成立:

\mathbb{E}_\omega[Y_{i,t}(\infty) - Y_{i,t-1}(\infty)|G_i = g] = \mathbb{E}_\omega[Y_{i,t}(\infty) - Y_{i,t-1}(\infty)|G_i = g']

特徴

  • 任意の処置前期間をベースラインとして使用可能
  • 任意のnot-yet-treatedグループを比較として使用可能
  • 最も多くのデータを活用

識別結果

ATT(g,t) = \mathbb{E}_\omega[Y_{i,t} - \bar{Y}_{i,t \leq g-1}|G_i = g] - \mathbb{E}_\omega[Y_{i,t} - \bar{Y}_{i,t \leq g-1}|G_i > \max\{g,t\}]

ここで、\bar{Y}_{i,t \leq g-1} = \sum_{s=1}^{g-1} Y_{i,s}/(g-1)は処置前期間の平均です。

仮定の選択基準

どの平行トレンド仮定を選ぶべきかは研究の文脈に大きく依存すると思います。メディケイド応用において、著者らはPT-GT-NYTを採用していますが、その理由は他の2つの仮定が持つ問題点を避けるためです。

PT-GT-allの問題点は、すべてのグループが2009年から2014年という長期間にわたって完全に平行なトレンドを持つという非常に強い仮定を要求することです。実際には、各州の経済状況、医療施策、人口構成の違いにより、長期間の完全な平行性は非現実的と考えられるからだと思います。

PT-GT-Nevの問題点は、2024年時点でもメディケイドを拡大していない州のみをコントロール群とすると、これらの州は拡大州と比べてより保守的な政治環境や異なる人口構成を持つため、適切な反実仮想として機能するか疑問が残ることです。

PT-GT-NYTの利点は、これらの問題を回避できることです。各時点でまだ処置されていないすべてのグループを比較群として活用できるため、統計的精度が向上します(例:2014年拡大の効果推定時に2015年、2016年、2019年拡大群と非拡大群すべてを比較群として使用)。同時に、長期間の事前トレンドを課さない現実的な仮定に留まります。

4. Estimators for staggered designs without covariates

次は実際のデータからATT(g,t)を推定する方法について見ていきましょう。基本的な考え方は、前節で導出した識別結果に基づいて、理論的な母集団期待値を実際のデータから計算した値で置き換えることです。原理は従来の2×2 DIDと同じですが、複数のグループとタイミングに対応するよう拡張されています。

PT-GT-NYT推定量

\widehat{ATT}_{nyt}(g,t) = \frac{\sum_{i=1}^{n} \mathbb{1}\{G_i = g\}\omega_i(Y_{i,t} - Y_{i,t=g-1})}{\sum_{i=1}^{n} \mathbb{1}\{G_i = g\}\omega_i} - \frac{\sum_{i=1}^{n} \mathbb{1}\{G_i > t\}\omega_i(Y_{i,t} - Y_{i,t=g-1})}{\sum_{i=1}^{n} \mathbb{1}\{G_i > t\}\omega_i}

PT-GT-Nev推定量

\widehat{ATT}_{never}(g,t) = \frac{\sum_{i=1}^{n} \mathbb{1}\{G_i = g\}\omega_i(Y_{i,t} - Y_{i,t=g-1})}{\sum_{i=1}^{n} \mathbb{1}\{G_i = g\}\omega_i} - \frac{\sum_{i=1}^{n} \mathbb{1}\{G_i = \infty\}\omega_i(Y_{i,t} - Y_{i,t=g-1})}{\sum_{i=1}^{n} \mathbb{1}\{G_i = \infty\}\omega_i}

PT-GT-NYTとの違い

  • 比較グループがG_i > tからG_i = \inftyに変更
  • Never-treatedグループのみをコントロール群として使用

回帰ベースの推定

Sun and Abraham (2021)の完全飽和回帰モデル

Y_{i,t} = \theta_t + \eta_i + \sum_{g \neq \infty}\sum_{e \neq -1} \beta_{g,e}^{SA}\mathbb{1}\{G_i = g\}\mathbb{1}\{G_i + e = t\} + \epsilon_{i,t}

モデルの構成要素

  • \theta_t:時間固定効果
  • \eta_i:ユニット固定効果
  • e = t - g:イベント時間
  • \beta_{g,e}^{SA}:グループgのイベント時間eにおける処置効果

重要な除外

  • g = \infty:Never-treatedグループ(基準グループ)
  • e = -1:処置直前期(基準時点)

PT-GT-all推定量

より多くの処置前データを使用:

\widehat{ATT}_{avg}(g,t) = \frac{\sum_{i=1}^{n} \mathbb{1}\{G_i = g\}\omega_i(Y_{i,t} - \bar{Y}_{i,t \leq g-1})}{\sum_{i=1}^{n} \mathbb{1}\{G_i = g\}\omega_i} - \frac{\sum_{i=1}^{n} \mathbb{1}\{G_i > t\}\omega_i(Y_{i,t} - \bar{Y}_{i,t \leq g-1})}{\sum_{i=1}^{n} \mathbb{1}\{G_i > t\}\omega_i}

特徴

  • \bar{Y}_{i,t \leq g-1}:処置前期間すべての平均を使用

Wooldridge (2021)の拡張TWFE

Y_{i,t} = \theta_t + \eta_i + \sum_{g \neq \infty}\sum_{s=g}^{T} \beta_{g,t}^{W}\mathbb{1}\{G_i = g\}\mathbb{1}\{s = t\} + \epsilon_{i,t}

5. Aggregating group-time average treatment effects

Staggeredデザインにおける集計には以下の要素が含まれます:

  1. 時間の概念
  • カレンダー時間t:特定の年の効果
  • イベント時間e = t - g:処置開始からの経過時間
  1. 時間の長さ:どれだけの期間にわたって集計するか

  2. グループウェイト

一般的な集計式:

ATT_{aggte} = \sum_{g,t} w_{\omega,g,t} ATT(g,t)

ここで、w_{\omega,g,t}は非負のウェイトで、合計が1になります。

イベント時間での集計

施策評価では、「処置開始から何年後に効果が現れるか」が重要になることがあります。カレンダー時間ではなくイベント時間で集計することで、異なるタイミングで処置を受けたグループを統一的に評価できます。

イベント時間eでの平均処置効果:

ATT_{es}(e) = \mathbb{E}_\omega \left[ ATT(G, G + e) \mid G + e \in [1, T], G \leq T \right]
= \sum_{g < \infty} w_{g,e}^{es} ATT(g, g + e)

ここで、ウェイトw_{g,e}^{es}は:

w_{g,e}^{es} = \mathbb{1}\{g + e \leq T\}P_\omega(G = g|G + e \leq T, G \leq T)
  • ATT_{es}(e)e期間処置にさらされたユニット間の平均処置効果
  • G \leq T:処置を受けたことを意味する
  • G + e \in [1,T]:その期間のデータが利用可能

実証例

図7は、各拡大グループの処置効果をイベント時間で整理したものです。:
イベント時間0:処置開始時ではすべてのグループが観察可能ですが、効果はグループ間で異なります。処置前期間では後期処置グループほど長い観察期間を持ち平行トレンドの検証に活用でき、処置後期間では早期処置グループほど長期効果を観察できます(2019年グループは処置開始時点のみ)。グループ別の特徴として、2015年グループは処置後に顕著な上昇傾向を示し、2016年グループは処置前に大きな変動がある一方、他のグループは比較的安定した推移を示しています。

図8は、すべてのグループを集計したイベントスタディの結果を示しています:
メディケイド拡大の死亡率に対する処置効果の推定値は0.03(標準誤差1.91、95%信頼区間[-3.72, 3.78])となり、統計的に有意な効果は検出されませんでした。
事前トレンドの検証では、処置前期間(-5~-1年)で推定値がゼロ周辺で安定しており、平行トレンド仮定をある程度支持しているといえます。処置後の動的効果も全期間でゼロ周辺を推移し、持続的な効果は観察されませんでした。

「イベント時間での不均衡」問題

標準的な集計では、すべてのイベント時間で同じグループのセットを使用しません:

  • 2019年グループはe = 0にのみ寄与
  • 2014年グループはe = -4からe = 5まですべてに寄与

この処置群の構成の変化が結果に影響を与える可能性があります。そこで、以下のようなATTを考えます。

ATT_{es,bal,[\underbar{e},\bar{e}]}(e) = \mathbb{E} \left[ ATT(G, G + e) \mid G + \bar{e} \in [1, T], G + \underbar{e} \in [1, T], G \leq T \right]
= \sum_{g \in \mathcal{G}_{treat}} w_{g,[\underbar{e},\bar{e}]}^{es,bal} ATT(g, g + e)
w_{g,[\underbar{e},\bar{e}]}^{es,bal} = \mathbb{1}\{g + \bar{e} \leq T\}\mathbb{1}\{g + \underbar{e} \geq 1\}P_\omega(G = g|G + \bar{e} \in [1, T], G + \underbar{e} \in [1, T], G \leq T)
  • イベント時間\underbar{e}から\bar{e}まですべて観察可能なグループのみを使用
  • 分析に含まれるグループの構成(組み合わせ)が時間とともに変化することで生じる見かけ上の効果を回避

ATT_{es,bal,[\underbar{e},\bar{e}]}(e)は、イベント時間がeに等しく、少なくとも\bar{e}期間処置に参加することが観察され、少なくとも\underbar{e}個の利用可能な処置前期間があるユニット間のグループ時間平均処置効果の平均です。

6. Estimators for staggered designs with covariates

これまでのDIDと同様に、Staggered DIDでも異なるタイミングで処置を受けるグループ間で重要な特性が異なる可能性があるため、共変量を調整することがあります。
Staggered DIDでも従来のDIDと同様に、回帰調整(RA)、逆確率重み付け(IPW)、二重頑健(DR)の3つの共変量調整アプローチが利用可能です。基本的な枠組みはこれまでと同じため、詳細は省略します。
以下に含めるべき共変量と避けるべき共変量をまとめました。

含めるべき共変量

  1. 処置タイミングの決定要因:選択バイアスをコントロール
  2. アウトカムのトレンド決定要因:時系列パターンや季節性をコントロール

避けるべき共変量

  1. 処置後測定変数、処置によって影響される変数:処置効果の一部を誤って制御する危険
  2. 処置状態と完全相関する変数:推定を不安定化

重要原則:すべての共変量は処置前時点で測定された変数である必要があります。

共変量を含む実証結果

7. Limitations of TWFE regressions

従来のTWFE回帰は、Staggered DIDで最も一般的に使用されてきた手法です:

Y_{i,t} = \theta_t + \eta_i + \beta^{twfe}D_{i,t} + e_{i,t}

ここで:

  • \theta_t: 時間固定効果
  • \eta_i: ユニット固定効果
  • D_{i,t}: 処置ダミー変数
  • \beta^{twfe}: 推定したい処置効果

TWFE回帰の根本的問題

\beta^{twfe}の問題は、TWFEが暗黙的にすでに処置を受けた群をコントロール群として使用することです。平行トレンド仮定がすべてのグループおよびすべての期間で成立する場合でも、結果として得られる推定値は特定のATT(g,t)パラメータに負の重みを付けることがあります。

2期間3グループのデータがあるとします。第1期に処置を受けるグループ(G_i = 1)、第2期に処置を受けるグループ(G_i = 2)、そして未処置グループ(G_i = \infty)です。グループ1とグループ2は異なる時点で処置を受けますが、期間が2つしかないため、TWFE仕様を以下のように書き直すことができます:

\Delta Y_{i,2} = \Delta \theta_t + \beta^{twfe}\Delta D_{i,2} + \Delta e_{i,2}

\Delta D_{i,2}は処置状態が増加するユニット(G_i = 2)では1の値を取り、処置状態が変化しないユニット(G_i = 1およびG_i = \infty)では0の値を取ります。TWFE推定値は以下の単純な平均の比較です:

\beta^{twfe} = \mathbb{E}[\Delta Y_{i,2}|\Delta D_{i,2} = 1] - \mathbb{E}[\Delta Y_{i,2}|\Delta D_{i,2} = 0]

この推定量は、既処置ユニットまたは未処置ユニットを比較として使用する2つのDID項の重み付き平均として表現されます:

= \left(\mathbb{E}[\Delta Y_{i,2}|G_i = 2] - \mathbb{E}[\Delta Y_{i,2}|G_i = \infty]\right)(1-w_1) + \left(\mathbb{E}[\Delta Y_{i,2}|G_i = 2] - \mathbb{E}[\Delta Y_{i,2}|G_i = 1]\right)w_1

ここで、w_1 = \frac{p_1}{p_1+p_2}であり、p_g = P(G = g)はグループgの構成比です。

第1項:未処置群(G_i = \infty)を比較群とするDID推定値
第2項:既処置群(G_i = 1)を比較群とするDID推定値

既に処置を受けた群と比較することによる問題

\beta^{twfe}の第2項\mathbb{E}[\Delta Y_{i,2}|G_i = 2] - \mathbb{E}[\Delta Y_{i,2}|G_i = 1]の詳細な分析を行います。

\mathbb{E}[\Delta Y_{i,2}|G_i = 2] - \mathbb{E}[\Delta Y_{i,2}|G_i = 1] = \mathbb{E}[Y_{i,2}|G_i = 2] - \mathbb{E}[Y_{i,1}|G_i = 2]
- \left(\mathbb{E}[Y_{i,2}|G_i = 1] - \mathbb{E}[Y_{i,1}|G_i = 1]\right)

各グループの処置状態:

  • グループ2: 期間1は未処置、期間2は処置開始
  • グループ1: 期間1は処置開始、期間2は処置継続

となるので、以下のように整理できると思います。

= \mathbb{E}[Y_{i,2}(2)|G_i = 2] - \mathbb{E}[Y_{i,1}(\infty)|G_i = 2] - \left(\mathbb{E}[Y_{i,2}(1)|G_i = 1] - \mathbb{E}[Y_{i,1}(1)|G_i = 1]\right)

グループ2の項\mathbb{E}[Y_{i,2}(2)|G_i = 2] - \mathbb{E}[Y_{i,1}(\infty)|G_i = 2]で反実仮想結果Y_{i,2}(\infty)を加減すると、

= \mathbb{E}[Y_{i,2}(2) - Y_{i,2}(\infty)|G_i = 2] + \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 2]
= ATT(2,2) + \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 2]

グループ1の項\mathbb{E}[Y_{i,2}(1)|G_i = 1] - \mathbb{E}[Y_{i,1}(1)|G_i = 1]を分解すると、

= \mathbb{E}[Y_{i,2}(1) - Y_{i,2}(\infty)|G_i = 1] - \mathbb{E}[Y_{i,1}(1) - Y_{i,1}(\infty)|G_i = 1]
+ \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 1]
= ATT(1,2) - ATT(1,1) + \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 1]

上で求めたグループ2とグループ1の項をまとめると、

= ATT(2,2) + \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 2]
- \left(ATT(1,2) - ATT(1,1) + \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 1]\right)
= ATT(2,2) - \left(ATT(1,2) - ATT(1,1)\right)
+ \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 2] - \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 1]

となる。

平行トレンド仮定下では:

\mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 2] = \mathbb{E}[Y_{i,2}(\infty) - Y_{i,1}(\infty)|G_i = 1]

したがって:

= ATT(2,2) - \left(ATT(1,2) - ATT(1,1)\right)

既に処置を受けた群を用いたDID推定値を含む全体のTWFE推定量は:

\beta^{twfe} = ATT(2,2)(1-w_1) + \left[ATT(2,2) - \left(ATT(1,2) - ATT(1,1)\right)\right]w_1
= ATT(2,2) + ATT(1,1)w_1 - ATT(1,2)w_1

負の重みの問題

ATT(1,2)構成要素は、処置効果が期間を通して同じ場合(ATT(1,1) = ATT(1,2))を除いて、全体のTWFE推定量において負の重みを受けます。
ATT(1,2) > ATT(1,1)(処置効果が時間とともに増加)の場合、TWFE推定量は真の平均処置効果よりも小さくなってしまいます。極端な場合、すべての処置効果が正でもTWFE推定量が負になる可能性があります。
さらに、OLSの「分散重み付け」特性により、ATT(g,t) = ATT(g)の場合でも、\beta^{twfe}は非直感的重み(non-intuitive weights)を持ちます。

DID研究のためのフォワードエンジニアリング・アプローチ

複雑なStaggered DID手法を見てきましたが、著者らはこれらの手法を適切に活用するための体系的なアプローチを提案しています。
このアプローチの核心は「統計手法から研究設計を逆算するのではなく、研究問題から適切な手法を考える」というところにあります。

Step 1. 目標パラメータの定義

研究で答えたい因果効果を明確に定義します。個別の効果から全体の要約効果まで、研究目的に応じたパラメータを選択します。

Step 2. 識別仮定の明示

平行トレンド仮定、no-anticipation仮定、overlap条件など、必要な仮定を明確に述べます。処置前差分トレンドなどで仮定の妥当性を検証します。

Step 3. 推定方法の決定

単純な平均比較か、回帰調整・逆確率重み付け・二重頑健手順などの計量経済学的技法か、研究設計に応じて適切な手法を選択します。

Step 4. 不確実性の議論

推定結果の不確実性がどこから生じるかを明確にします。モデルのどの変数が固定でどの変数が変動するかを整理し、それに適合した推論技法を使用する必要があります。

Step 5. 推定の実行

ステップ1-4で設計した枠組みに従って、データから因果効果を推定します。

Step 6. 感度分析の実施

主要な仮定が妥当な範囲で違反された場合に、結果がどの程度変化するかを検証します。

Step 7. 異質性分析の実施

全体の平均効果だけでなく、時間別・グループ別・処置種類別などの異質な効果を分析します。

Step 8. 学習の継続

仮定が非現実的または結果が非頑健な場合は、異なる研究設計を検討します。既存手法で解決できない問題には新しいアプローチを開発します。

最後に

本記事では、異なるタイミングで処置が段階的に導入される状況におけるDID分析、Staggered DIDについて解説しました。
特に重要なのは、著者らが提案する8つのステップからなるフォワードエンジニアリング・アプローチの「手法ありき」ではなく「研究問題ありき」で分析設計をするということだと思います。これはDIDに限らず、実証研究・実務での分析でついつい勉強した分析手法やなんかすごそうな分析手法を試したくなることもありますが、まず解決すべき問題を明確に定義し、適切な仮定を検討してから手法を選択するという基本原則を忘れてはいけないなと論文を読み改めて思いました。

本記事をもって、"Difference-in-Differences Designs: A Practitioner's Guide"の論文紹介シリーズはおしまいとなります。

DMM Data Blog

Discussion