🙆

論文要約:Magnification Invariant Medical Image Analysis: A Comparison of C

2023/04/24に公開

Magnification Invariant Medical Image Analysis: A Comparison of Convolutional Networks, Vision Transformers, and Token Mixers

概要

異なる倍率への汎化性について、CNN、ViT、Token Mixerそれぞれの性能を比較。WaveMixが優位。

書誌情報

2023/2/22
Pranav Jeevan、他
インド工科大学ボンベイ校
https://arxiv.org/abs/2302.11488

背景

CNNは、テスト画像の倍率が、学習画像の倍率と異なる場合、性能が低下してしまう。

方法

学習時と評価時で倍率が異なる場合における、汎化性を評価。
CNN、ViT、Mixerそれぞれの性能を比較。
CNN  ResNet、MobileNet。
ViT  Vision Transformers、Swin Transformers。
Mixer Fourier-Net、ConvMixer、MLP-Mixer、WaveMix。
乳がんの病理画像データセット(BreakHis)で評価。

レンズ倍率 40倍、100倍、200倍、400倍。
1つの倍率を学習。残りの倍率でそれぞれ評価。
全モデルで事前学習なし。
ハイパーパラメータはデフォルト値を使用。

結果

WaveMixは学習時と評価時で倍率が異なる場合でも高精度、かつ、安定している。
また、CNNはViTより全般に優位。

Discussion