画像処理分野でよく使われる画像とその問題
はじめに
画像処理や画像を用いた機械学習の分野では、研究・検証・デモの際に「定番」と呼ばれる画像が頻繁に使用されます。これらの画像は、多くの研究者・エンジニアの間で広く共有され、比較実験やアルゴリズムの説明に役立てられています。
本記事では、代表的な画像とその背景について簡単にまとめます。
1. Lena (レナ)
スウェーデンのモデル Lena Söderberg さんの画像で、1972年の『Playboy』誌に掲載された写真の一部が切り抜かれたものです。周波数フィルタにかけられ、高周波と低周波に分解されたこの画像を何度見たことか。
この画像は1973年に南カリフォルニア大学の信号画像処理研究所によって初めて使用され、広まったそうです。参考:Hutchison, Jamie (2001). “Culture, Communication, and an Information Age Madonna”. IEEE Professional Communication Society Newsletter 45 (3): 1, 5–7.
しかしながら、現在では倫理的観点から使用を控え、代替画像の使用を推奨します。そもそも著作権的にNGであることに加え、ドキュメンタリー『Losing Lena』において、Lena自身が画像の使用をやめてほしいと主張しています。こうした動きもあり、著名なジャーナルはLenaの画像を使用した投稿は受け付けないことを表明しています(Nature : A note on the Lena image, IEEE : Improve Your Graphics)
こうした経緯を考慮し、本記事でもLenaの画像は掲載しません。画像処理分野で広く親しまれてきた存在であり、個人的にも少し名残惜しい気持ちはありますが、使用は控えましょう。
2. Baboon (マンドリル)
マンドリル画像は、鮮やかな顔の縞模様を持つマンドリル(オナガザル科の一種)の写真です。少しぎょっとしてしまう鮮やかさと複雑な模様が、圧縮やノイズ除去アルゴリズムの性能検証によく適していいます。ガビガビになったマンドリルをよく見比べさせられる。
こちらは調べた限り出典不明です。所感としては、こちらも著作権的にアウトな気がしますが、少なくとも撮影者が訴えない限りは使用可能ではないでしょうか。
Standard Image Data-BAse (SIDBA)とは
上記のような有名な画像は、画像処理研究者間で画像を共有するための画像データベース「Standard Image Data-BAse (SIDBA)」として共有され、使用されてきたそうです。現在ではどこが大元かは分からず、各研究機関が保存しているものを公開しているみたいです。
- 南カリフォルニア大学のThe USC-SIPI Image Database
- 神奈川工科大学の標準画像/サンプルデータ
出典:http://www.ess.ic.kanagawa-it.ac.jp/app_images_j.html
しかし、こうした画像は出典不明のものが大半であり、著作権を侵害している可能性が高いため、現在は使用を控えたほうが良いでしょう。
現在使用するべき画像データセット
近年、画像を用いた機械学習では、「著作権」「倫理」を重視した公的データセットの利用が強く推奨されています。ちょっとしたフィルタ処理のサンプルを見せたい場合でも、出典が明確そうなデータセットから一枚使うのが良いのではないでしょうか。
おわりに
RenaやMandrillといった「定番画像」は残念ながら使用を避けたほうが良いかもしれません。データセット単位で検証が行われる現在において、単一の画像が有名にならないのは少し寂しいものがありますね。
Discussion