一般化線形モデル(特にロジスティック回帰)
このスクラップは?
一般化線形モデルのお勉強ノート。
主に、以下の書籍で学んだ内容をまとめて行く予定:
A. J. Dobson(田中 豊、森川 敏彦、山中 竹春、冨田 誠 翻訳)、一般化線形モデル入門 原著第2版(共立出版、2008)
一般化線形モデルの最尤推定
問題設定
観測値
各サンプルは独立同時な過程により生成され、説明変数
ここで、説明変数
Logistic 回帰の場合
Logistic 回帰の場合、
これは
と書き換えられ、
に対応する。
このとき、尤度を最大化するパラメータ
ただし、対数尤度は以下のように定義する:
パラメータ最尤推定量の数値的な求め方
対数尤度
ただし、
式(1)の導出
となる
ここで
を代入すると、上記の式は以下のように書き改めることができる:
このとき、
をその期待値
で置き換えられるものとし、さらに
という関係を用いると、
のように書き換えることができる。
これをもとに、
一般化線形モデルの最尤推定その2: 重み付き最小二乗法による別表現
一般化線形モデルにおいて、対数尤度
ここで、説明変数
なお、この時、
すると、式(1)は以下のように表すことができる:
ただし、
なお、
以下、これを示す。
導出
式(1)のうち、
について式変形を行う。
なお、以降では、
と表すことにする。
まず、
と表すことができる。
なぜなら、
が成り立つからである。
式(4)の導出
したがって、
が成り立つ。
式(5) の導出
以下のような
この両辺を
ここで、両辺の
一方で
より
が成り立つので、これを式(6)に代入することで
が得られる。
さらに、式(6)の分散については、以下のように表すことができる:
ここで、式(7)の両辺を
となるので
が成り立つ。
これを式(8)に代入することで、
が成り立つことから
が成り立つ。
以上から、式(7)、(9)合わせて、
が成り立ち、これに
したがって、
と表すことができる。
さらにこれを用いることで、
と表すことができる。
ただし、
ここで
これらを用いると、
と書き直すことができる。
したがって
と置くことで
が言えるので、
Logistic 回帰と最尤推定
これまでの内容の例として、Logistic 回帰に当てはめて考えてみる。
モデル設定
Logistic 回帰の場合、
ただし、
であり、以下のように表される:
なお、上記は式変形すると
と表せるので、
に相当する。
最尤推定
対数尤度とその微分
ロジスティック回帰において、対数尤度
ここで、
従って、以下が成り立つ:
最尤推定量を数値的に求める方法
対数尤度
ただし、
式(1)の別表現
すると、式(\ref{1}) は以下のように書き表すことができる:
導出
よって、式(1) は以下のように書き換えられる:
なお、式(2)は