書籍「原因と結果」の経済学 データから真実を見抜く思考法 読書メモ
概要
「原因と結果」の経済学 データから真実を見抜く思考法 を読みました。
原因と結果に因果関係があることをどのように証明したらいいか をテーマとした本です。
「原因と結果」の経済学―――データから真実を見抜く思考法
この本から学びたいこと
社内のデータアナリストの方に、
因果推論の考え方を身につけるための入門書としてオススメされました。
因果推論という言葉が何かを説明できる状態を目指して読みました。
読了時間
メモを取りながら2時間程度で読み切りました。
技術書と違って手を動かすことがなかったので気軽に読めました。
感想、この本から学べたこと
因果関係を証明する因果推論について概要を説明できる状態になったのでよかったです。
グラフや表が多く使われており、理論の理解はしやすかったです。
非常に読みやすく、教科書のような構成の本でした。
結果として、因果推論について体系的な知識を身につけられたと思います。
これまで業務において、
交絡因子が複数あっても排除せずに因果をこじつけて説明してしまう場面が多くあったなと読みながら感じました。
その場では因果を示すことがゴールとなっていたので、交絡因子を無視してしまっていたと思います。
例としては、業務成果を説明する際、
「これを実施したからこういう効果が得られた」とむりくりこじつけてしまうなど。。
次同様の場面に出くわしたら、交絡因子を考慮した証明をしたいと思います。
データ分析や日々の業務の中で実践的に利用することは難しいかもしれませんが、
場面を見つけて本の内容を実利用していきます。
この本をおすすめしたい人
データアナリストのようなレベルではなくても、
管理職のようなちょっとしたデータ分析するようなにつく人にとっても
データの捉え方を身につけられる本だと感じました。
以下、内容メモ
因果推論とは
2つの変数の関係が因果関係にあるのかどうかを明らかにすること
因果関係を証明する方法とは
因果関係にあるのかどうか確認するためには、以下の3つを証明する必要がある。
- 偶然ではない
- 地球温暖化が進むと海賊が減る → 相関関係があるだけ
- 逆の因果関係がない
- 警察官が多いから犯罪件数が多い → 順序が逆
- 第3の変数がない
- 体力がある子供は学力が高い → 親が教育熱心で色々習わせるのが要因
この3つが存在していないことないことを証明するために必要なのが反事実
- 体力がある子供は学力が高い → 親が教育熱心で色々習わせるのが要因
反事実
逆にxxしていなかったらどうなっていた という別パターンの事実を反事実という。
反事実を考えて事実の結果と見比べることで、因果関係を証明する。
反事実の証明
タイムマシンはないので反事実はだいたい証明することが難しい。
でもどうにか反事実を証明したい。
そのために、
「比較可能なグループを作り出し、反事実をもっともらしいデータで置き換える」
という方法を取る。
置き換え先のエビデンスは精度別に4種類の方法で作ることができる。
- メタアナリシス → 複数のランダム化比較試験を統合して結果を考えること
- ランダム化比較試験 → 条件を揃えてグループピングして結果を比較すること 例:ABテスト
- 自然実験/類似実験
3.1 自然実験 → 意図的にグルーピングせずに、結果としてグルーピングされていたグループの結果を比較すること
観察データと外生的ショックを利用して、
あたかもランダム化比較試験を行ったかのような状況を見出す
3.2 類似実験
3.2.1 差の差分析
介入群と対照群についての介入前後でのそれぞれの差の差を比較すること
四象限の表がわかりやすい
利用できる条件:介入群と対照群で介入前のトレンドが平行であること
介入中にトレンドに変化を与える別の要因がないこと
3.2.2 操作変数法 よくわからなかった
3.2.3 回帰不連続デザイン
3.2.4 マッチング法
共変量をいくつか定義して、介入群と対照群でマッチングし、
結果を比較することで因果を証明する方法
共変量がただしいかどうかの評価が難しそうだなと思った - 回帰分析
これらの方法を利用して反事実をもっともらしいデータで置き換えることで、
結果的に事実の因果関係を証明する。
因果関係を読み解く5ステップ
- 「原因」は何か
- 「結果」は何か
- 3つのチェックポイントを確認しよう
- 反事実を作り出そう
- 比較可能になるよう調整しよう
補論2にある5ステップがこの本のサマリ
その具体方法を本内で話している。
Discussion