Open1

optimizer.zero_grad()の意義

のなかのなか

optimizer.zero_grad()って何しているのか

いまさらだけどこれに引っかかった
学習のたびに0にしていたら学習進まないのでは

結論

重みと勾配を混同していた
重みは別に初期化していない
勾配法を使うために勾配を0にして初期値を0にしている

参考

https://euske.github.io/introdl/lec3/index.html#learn-optim

https://teratail.com/questions/209355

https://ohke.hateblo.jp/entry/2019/12/07/230000