【物体検出】アンカーボックスって?(アンカーベースとアンカーフリー)【図解】
アンカーボックスとは?
物体検出タスクは、写真や映像の中から「物体が何か?」と「物体がどこにあるか?」を見つける技術です。ここで「アンカーボックス」というのは、物体の位置を推測するための「参照ボックス」として考えることができます。
具体例で考えてみましょう。
例えば、道路の写真に車や自転車、歩行者が写っているとします。
アンカーボックスとは?
物体検出とは?
アンカーボックスは、この写真上のあらゆる場所に小さな四角いボックスをいくつか置いて、それぞれのボックスが物体を含むかどうかを推測します。そして、もし物体を含んでいると判断されたら、そのボックスの位置や大きさを調整して、物体を正確に囲むようにします。
アンカーボックスの種類は1つではありません。縦長や横長、小さい、大きいなど、1つの画像にたくさんのアンカーボックスが隠れているイメージです。
いろんなアンカーボックスがたくさんある
例えば、小さな犬と大きな車が同じ写真の中に写っている場合、小さなアンカーボックスは犬を、大きなアンカーボックスは車を検出するのに役立ちます。
これが、アンカーボックスという考え方です。
アンカーベース vs. アンカーフリー
アンカーボックスを使って物体検出をする手法を、アンカーベースと呼びます。そして、その対比となるアンカーフリーという手法についても押えておきましょう。
アンカーベース
アンカーベース
- アンカーベースとは、前述した通り、アンカーボックスを基本にして動く手法です。
- 写真の中の各位置に複数のアンカーボックスを置き、それぞれのボックスが物体をどれだけ含んでいるかを評価します。
- 最終的に、物体がありそうなボックスを見つけ、その位置や大きさを調整して、物体を正確に囲むようにします。
アンカーフリー
アンカーフリー
- アンカーフリーとは、アンカーボックスのような参照ボックスを使わずに、物体の中心や大きさを直接推測する手法です。
- つまり、写真の中から「ここに犬の中心がある!」や「この範囲に車がある!」といった情報を直接探し出します。
- アンカーボックスは使いません。
まとめ
アンカーボックスは、写真の中の物体を見つけるための「ヒント」のようなものです。
アンカーベースの手法は、これらのボックスを使って物体を検出しますが、アンカーフリーの手法は直接物体の位置や大きさを推測します。どちらの手法も、物体検出のタスクやその要件に応じて選択されます。
機械学習をもっと詳しく
ねこアレルギーの AI
普段は YouTube で機械学習について発信しています。お時間ある方は覗いていただけると喜びます。
Created by NekoAllergy
Discussion