COCO Format カスタマイズ(MMDetection)

2023/07/31に公開
3

本家?で作ったデータが正常に読み込まれない

coco format json file is not load from it correctly

症状

Synptom En/Cn

coco formatの基本的な情報

  • images: 画像のリスト。各画像には以下の情報が含まれます:
  • id: 画像の ID
  • width: 画像の幅
  • height: 画像の高さ
  • file_name: 画像ファイルの名前
  • license: ライセンスの ID
  • date_captured: 画像が撮影された日付
  • annotations: アノテーションのリスト。各アノテーションには以下の情報が含まれます:
  • id: アノテーションの ID
  • image_id: アノテーションが関連付けられている画像の ID
  • category_id: アノテーションが関連付けられているカテゴリの ID
  • segmentation: オブジェクトのセグメンテーション情報
  • area: セグメンテーションの面積
  • bbox: バウンディングボックスの座標([x,y,width,height])
  • iscrowd: 画像中に複数のオブジェクトが含まれているか(シングルは0,複数は1)
  • categories: カテゴリのリスト。各カテゴリには以下の情報が含まれます:
  • id: カテゴリの ID
  • name: カテゴリの名前
  • supercategory: 上位カテゴリの名前

https://mmdetection.readthedocs.io/en/dev-3.x/advanced_guides/customize_dataset.html

COCO annotator Outputチェック

  • チェックしてみた結果

フォーマットを公式通りにしてみる

data correction by original tool for jupyter notebook

  • 結果を見られるようにJupyter notebook形式(ipynb)でツールを作ってみました。
  • 構造の変更を行った後にその結果がしっかり動いているかを実際の画像にBounding Boxをかけていきます。

https://github.com/mi-kaneyon/coco-data/tree/main/coco-corrector

日本語ではこちら

https://github.com/mi-kaneyon/coco-data/blob/main/coco-corrector/JP.md

まだ膨大なデータのアノテーションを一人でしていまして大変です

  • 皆様のお役に立てれば
  • Hope your help

Qiitaに記事を分散させてしまったので、続きはZennで

https://qiita.com/Manyan3/items/df894499d30da9220fc7

Discussion

cafealcafeal

iscrowd: クラウドソーシングのアノテーションに関するフラグ

iscrowdは、確かにcrowdsourcingのcrowdですが、ここでは画像中に多数のオブジェクトが含まれているかどうかという意味だと思います

公式 によると、

The segmentation format depends on whether the instance represents a single object (iscrowd=0 in which case polygons are used) or a collection of objects (iscrowd=1 in which case RLE is used). Note that a single object (iscrowd=0) may require multiple polygons, for example if occluded. Crowd annotations (iscrowd=1) are used to label large groups of objects (e.g. a crowd of people). In addition, an enclosing bounding box is provided for each object (box coordinates are measured from the top left image corner and are 0-indexed).

だそうです

Manyan3Manyan3

cafealさん、アドバイスありがとうございます。
公式英文の方で理解不足でした。しっかり読み込みして直してみます。

Manyan3Manyan3

読む公式間違えてました・・・COCO の公式Data formatですね。
しっかり確認次第修正します。