numpyでDropoutを実装

import numpy as np

class Dropout:
    def __init__(self, dropout_ratio=0.5):
        self.dropout_ratio = dropout_ratio
        self.mask = None

    def foward(self, x, train_flag=True):
        #訓練時
        if train_flag:
            self.mask = np.random.rand(*x.shape) > self.dropout_ratio
            return x*self.mask
       #予測時 
　　else:
　　　#予測時は1ードロップアウト比率で計算する＝残る確率。
            return x*(1-self.dropout_ratio)
    
    def backward(self, dout):
        return dout * self.mask

3×3の行列xを作る

[in]
x = np.random.rand(3,3)
x

[out]
array([[0.26329059, 0.12489402, 0.05607279],
       [0.85869877, 0.76627507, 0.40834017],
       [0.9754227 , 0.69723063, 0.06930745]])

xと同じshapeで、各要素が0〜1になるような行列をつくり、各要素が0.5（dropout_ratio)を上回っている場合は1(True)を、そうでない場合は0(False)を返し、変数maskに格納する

[in]
mask = np.random.rand(*x.shape) > 0.5
mask

[out]
array([[ True,  True, False],
       [False,  True, False],
       [ True,  True, False]])

xにmaskを乗じる。
dropout_ratioを上回る要素だけが残る。

[in]
x*mask

[out]
array([[0.26329059, 0.12489402, 0.        ],
       [0.        , 0.76627507, 0.        ],
       [0.9754227 , 0.69723063, 0.        ]])

時間ステップ	指し手の選び方
t = 1, .......U-1	SL方策ネットワーク
t = U	ランダム
t = U+1, ......T	RL方策ネットワーク

バッチ正規化とレイヤー正規化

バッチ正規化

レイヤー正規化

最適化アルゴリズム

SGD

モーメンタム

ネステロフのモーメンタム

畳み込みの手法別のパラメータ数

通常の畳み込み

デプスワイズ畳み込み

ポイントワイズ畳み込み

通常の畳み込み

デプスワイズ畳み込み

ポイントワイズ畳み込み

LSTM構造

DQN

学習を安定させるための工夫

体験再生

利点① 計算量の大きいエピソードの進行量を抑えることができる

利点② 更新の分散を軽減できる

利点③ パラメータの振動・発散を避けることができる

目標Qネットワークの固定

報酬クリッピング

AlphaGoのパラメータ更新

第1ステージ：SL（教師あり学習）方策ネットワーク

第2ステージ：RL（強化学習）方策ネットワーク

第3ステージ：価値ネットワーク

目標出力z（データ集合）を作るための対戦

方策勾配定理

ベルヌーイ分布

尤度関数は確率変数の総乗

負の対数尤度

マルチヌーイ分布

尤度関数

負の対数尤度関数

等分散正規分布

最尤推定は二乗和誤差の最小化問題と同じになる（負の対数尤度を求めても、二乗和誤差の頭はマイナスにならないので注意）

確率密度関数

対数尤度関数

情報量

平均情報量

交差エントロピー

ベルヌーイ分布のときの交差エントロピー

カルバックライブラー・ダイバージェンス

KLダイバージェンスの別の表記

ResNet

GoogleNet

inceptionモジュール

auxililary loss

R-CNN

Mask R-CNN

Rol Align

SegNet

Resnet

残差学習

Bottleneckブロック（ボトルネックブロック）

Heの初期化

WideResNet

残差学習における性能改善 残差ブロックの幅を広げる

ドロップアウト

EfficientNet

ネットワークの深さ・幅・解像度をバランスよく

Compound Coefficient

FCOS Fully Convolution One-Stage Object Deteciton

アンカーボックスの課題

Center-ness ブランチ

VQ-VAE (Vector Quantised-Variational AutoEncorder)

GAN

GANの最適化問題は、

学習

生成器（G)：

識別器（D)：

DCGAN (Deep Convolution GAN)

生成器（G)

識別器（D)

共通

Transformer

Attention is you need

Attention

Encorderのマルチヘッドアテンション

残差学習における性能改善　残差ブロックの幅を広げる

Goodfellow のCNNの定義　＝相互相関関数