😽

Comicolorization: Semi-Automatic Manga Colorization

2020/09/30に公開

ディープラーニング

論文まとめ

自動着色

tech

Comicolorization: Semi-Automatic Manga Colorization

どんなもの？

漫画に特化した着色作業の自動化。
白黒漫画と参照画像を入力として、多層畳み込みニューラルネットワークによるカラー漫画半自動生成を実現した。

詳細

主に4つの工程がある。

自動コマ分割

2値化を行った後、コマ認識及び分割アルゴリズム(A Study on Control Parameters of Frame Decomposition Method for Comic Images)でコマの分割を行う。

参照画像を用いた半自動着色

ネットワークは先に登場した飯塚らのものに基づいて構築されている。
追加点は①参照画像から色彩特徴量を用いたこと、②キャラクターおよび作品のラベルを予測する分類タスクを行うこと、③Loss関数に敵対的損失を加えたことである。
ここで色彩特徴量（パレット）とは何ぞやというと参照画像の $256^3$ 次元のカラーヒストグラムを $6^3$ まで圧縮し、各色が1か0かで表現されたベクトルにしたものである。
パレットは結合層で統合したあと着色ネットワークに入力される。飯塚らのネットワークモデルの結合層と同様、28×28にブロードキャストして局所特徴ベクトルとている。

着色結果修正

先の2つだけで基本的には着色結果を得ることができる。しかしユーザーの意図しない結果が出た際修正できるようにしている。
大域的な修正にはヒストグラム、局所的な修正にはカラードットを領域上に直接付与することで選んだ色で着色される。

ページレイアウト復元

最後にページのレイアウトを元に戻す。

ネットワーク

クラス分類に用いるラベルはイラストに付与されたタグ428ラベルを用いている。
学習データはカラーイラストを大津の二値化をかけることで元のカラー画像をground-truthとした。自動着色でも鮮やかな着色を学習できるよう、再度が低いカラーイラストは除外している。
モデルの損失関数はLab色空間での平均2乗誤差、敵対的損失およびクラス分類誤差も用いている。