Closed2021/03/16にクローズ5計算グラフ:クロスエントロピーnabeyang2021/03/16に更新クロスエントロピーの定義 z=−1N∑i,jti,jlogyi,j z = -\frac{1}{N} \sum_{i,j} t_{i,j} \log y_{i,j} z=−N1i,j∑ti,jlogyi,j ti,jt_{i,j}ti,j はラベルをone-hot表現したもの。 ∑jti,j=1 \sum_{j} t_{i, j} = 1 j∑ti,j=1 クロスエントロピーを計算グラフで書くとこんな感じ。赤字の微分の結果は今まで作ってきたルールからただちに書き下せる。 nabeyang2021/03/16に更新∂L∂vi,j=∂L∂vi=∂L∂w=λ∂L∂z \begin{aligned} \frac{\partial L}{\partial v_{i,j}} = \frac{\partial L}{\partial v_{i}} = \frac{\partial L}{\partial w} = \lambda \frac{\partial L}{\partial z} \end{aligned} ∂vi,j∂L=∂vi∂L=∂w∂L=λ∂z∂L nabeyang2021/03/16∂L∂ui,j=ti,j∂L∂vi,j=λti,j∂L∂z \begin{aligned} \frac{\partial L}{\partial u_{i,j}} = t_{i,j} \frac{\partial L}{\partial v_{i,j}} = \lambda t_{i,j} \frac{\partial L}{\partial z} \end{aligned} ∂ui,j∂L=ti,j∂vi,j∂L=λti,j∂z∂L nabeyang2021/03/16∂L∂yi,j=1yi,j∂L∂ui,j=λti,jyi,j∂L∂z=−1Nti,jyi,j∂L∂z \begin{aligned} \frac{\partial L}{\partial y_{i,j}} = \frac{1}{y_{i,j}} \frac{\partial L}{\partial u_{i,j}} = \lambda \frac{t_{i,j}}{y_{i,j}} \frac{\partial L}{\partial z} = -\frac{1}{N} \frac{t_{i,j}}{y_{i,j}} \frac{\partial L}{\partial z} \end{aligned} ∂yi,j∂L=yi,j1∂ui,j∂L=λyi,jti,j∂z∂L=−N1yi,jti,j∂z∂L nabeyang2021/03/16に更新ルールとしては、次のように書ける。 このスクラップは2021/03/16にクローズされました作成者以外のコメントは許可されていません
nabeyang2021/03/16に更新クロスエントロピーの定義 z=−1N∑i,jti,jlogyi,j z = -\frac{1}{N} \sum_{i,j} t_{i,j} \log y_{i,j} z=−N1i,j∑ti,jlogyi,j ti,jt_{i,j}ti,j はラベルをone-hot表現したもの。 ∑jti,j=1 \sum_{j} t_{i, j} = 1 j∑ti,j=1 クロスエントロピーを計算グラフで書くとこんな感じ。赤字の微分の結果は今まで作ってきたルールからただちに書き下せる。
nabeyang2021/03/16に更新∂L∂vi,j=∂L∂vi=∂L∂w=λ∂L∂z \begin{aligned} \frac{\partial L}{\partial v_{i,j}} = \frac{\partial L}{\partial v_{i}} = \frac{\partial L}{\partial w} = \lambda \frac{\partial L}{\partial z} \end{aligned} ∂vi,j∂L=∂vi∂L=∂w∂L=λ∂z∂L
nabeyang2021/03/16∂L∂ui,j=ti,j∂L∂vi,j=λti,j∂L∂z \begin{aligned} \frac{\partial L}{\partial u_{i,j}} = t_{i,j} \frac{\partial L}{\partial v_{i,j}} = \lambda t_{i,j} \frac{\partial L}{\partial z} \end{aligned} ∂ui,j∂L=ti,j∂vi,j∂L=λti,j∂z∂L
nabeyang2021/03/16∂L∂yi,j=1yi,j∂L∂ui,j=λti,jyi,j∂L∂z=−1Nti,jyi,j∂L∂z \begin{aligned} \frac{\partial L}{\partial y_{i,j}} = \frac{1}{y_{i,j}} \frac{\partial L}{\partial u_{i,j}} = \lambda \frac{t_{i,j}}{y_{i,j}} \frac{\partial L}{\partial z} = -\frac{1}{N} \frac{t_{i,j}}{y_{i,j}} \frac{\partial L}{\partial z} \end{aligned} ∂yi,j∂L=yi,j1∂ui,j∂L=λyi,jti,j∂z∂L=−N1yi,jti,j∂z∂L