【論文5分まとめ】ArcFace
概要
顔認識のための高い識別性を持つ損失関数Additive Angular Margin Loss(ArcFace, ArcMargin Loss)を提案。 超球面上の明確な幾何的解釈が可能であり、訓練も安定する。
書誌情報
- Deng, Jiankang, et al. "ArcFace: Additive Angular Margin Loss for Deep Face Recognition. In 2019 IEEE." CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2018.
- https://arxiv.org/abs/1801.07698
ポイント
Additive Angular Margin Loss
画像分類における通常のSoftmax損失は以下のように書くことができる。
これに対し、本研究が提案しているArcFaceは以下のように書ける。
Softmax損失との違いは、以下の2点である。
-
の代わりにW_{j}^{T} x_{i}+b_{j} が使用されているs \cos \theta_{j} -
に関してのみj=y_i のようにマージンs\cos (\theta_{y_{i}}+m) が使用されているm
算出過程は以下の図のとおりである。
マージンの存在により、クラス内のサンプルがその範囲内に収まるように促す効果が生まれる。また、適切なクラスから少し離れたとしてもそのクラスに分類されるように訓練が進むため、クラス間の識別性を上げるように訓練が進む。
8クラスという少ないクラスで、softmaxおよびArcFaceを用いた訓練してみて結果を確認すると、ArcFaceの効果がよくわかる。
Softmaxの他に、SphereFace、CosFaceといった既存の顔認識手法で使われている損失関数について、2値分類の場合にどのような決定境界が現れるのかを模式的に表したのが以下の図である。ArcFaceは、超球上でマージンをとって分割するということがわかる。
SphereFace, ArcFace, CosFaceのマージンを
また、クラス内の差異を小さくし、クラス間の差異を大きくするためのいくつかの手法も追加で試しているが、こちらの場合もシンプルにArcFaceのみを使用した場合に最も高精度になったという実験結果が得られている。
実験
省略
Discussion