📝

エントロピー抑制による位相ノイズ耐性を持つ高次元複素ニューラルネットワークによる画像復元

に公開

1. はじめに

画像復元において、位相ノイズや高周波ノイズの存在は、従来のCNNベースの復元手法の性能を著しく低下させることが知られている。
近年では、FFTを用いた複素CNN(Complex CNN)やFourier CNNなど、周波数領域での学習を行う手法が提案され、一定の性能向上が報告されている。

しかしこれらの手法では、ノイズによって情報のエントロピー(不確実性)が増大することを明示的に抑制するという情報理論的視点が十分に考慮されていない。

本研究では、高次元化したデータのフーリエ変換複素ニューラルネットワークによる非線形変換を組み合わせ、エントロピーの抑制を通じて画像の構造的秩序を保持しつつ、復元性能を向上させる手法を提案する。

2. 提案手法

  • H: 高さ
  • W: 幅
  • C: チャネル数

入力画像 x \in \mathbb{R}^{H \times W \times C} に対して、フーリエ変換を適用し、複素周波数空間 X = \mathcal{F}(x) \in \mathbb{C}^{H \times W \times C} を得る。
複素CNN(またはFourierCNN)を用いて、実部と虚部を分離して学習し、再構成後に逆フーリエ変換(IFFT)を通じて復元画像を得る。

本研究では、ノイズとして FFTの位相成分にランダムな摂動(phase noise) のみを加え、ガウスノイズ等は扱わない。

3. 実験

  • データセット: CelebA (128×128)

  • 学習時のノイズ強度: 位相ノイズ強度 = 0.5

  • 評価時のノイズ強度: 位相ノイズ強度 = 0.2

  • 比較モデル:

    • RealCNN(実数CNN)
    • ComplexCNN(複素CNN)
    • FourierComplexCNN(提案手法)
  • 評価指標:

    • PSNR(Peak Signal-to-Noise Ratio)
    • SSIM(Structural Similarity Index)

結果の要点

  • 提案手法(FourierComplexCNN)は、位相ノイズ環境下で最も高いPSNRを示し、RealCNNより 約1〜3dB向上
  • 学習過程において、複素CNNはエントロピーの増加を抑えながら復元を進めていることが可視化により確認された。

4. 考察

  • フーリエ変換による高次元化は、単なる空間の拡張ではなく、情報の再整理と局所構造の強調に寄与する。
  • 複素ReLUや複素BatchNormなどの非線形処理により、位相ノイズに対して高い頑健性が得られる。
  • 従来手法では経験的にしか説明できなかった性能向上を、エントロピー抑制という理論的枠組みによって説明可能となった。

5. 結論

本研究では、フーリエ変換による複素高次元表現エントロピー抑制的な学習構造を組み合わせた画像復元手法を提案した。

実験により、位相ノイズ環境において従来のCNNを上回る復元性能が得られ、また情報の秩序性(低エントロピー)を維持しながら復元する挙動が確認された。


今後の展望

  • より高解像度な画像や動画への応用
  • 実データにおけるノイズモデルへの拡張
  • 情報理論的評価指標(例:相互情報量)による定量化

https://github.com/chacha20-poly/High-Dimensional-Noise-filter-CNN

タグ

#画像復元 #複素ニューラルネットワーク #FourierCNN #情報理論 #研究ノート

Discussion