🙆
論文要約:Magnification Invariant Medical Image Analysis: A Comparison of C
Magnification Invariant Medical Image Analysis: A Comparison of Convolutional Networks, Vision Transformers, and Token Mixers
概要
異なる倍率への汎化性について、CNN、ViT、Token Mixerそれぞれの性能を比較。WaveMixが優位。
書誌情報
2023/2/22
Pranav Jeevan、他
インド工科大学ボンベイ校
背景
CNNは、テスト画像の倍率が、学習画像の倍率と異なる場合、性能が低下してしまう。
方法
学習時と評価時で倍率が異なる場合における、汎化性を評価。
CNN、ViT、Mixerそれぞれの性能を比較。
CNN ResNet、MobileNet。
ViT Vision Transformers、Swin Transformers。
Mixer Fourier-Net、ConvMixer、MLP-Mixer、WaveMix。
乳がんの病理画像データセット(BreakHis)で評価。
レンズ倍率 40倍、100倍、200倍、400倍。
1つの倍率を学習。残りの倍率でそれぞれ評価。
全モデルで事前学習なし。
ハイパーパラメータはデフォルト値を使用。
結果
WaveMixは学習時と評価時で倍率が異なる場合でも高精度、かつ、安定している。
また、CNNはViTより全般に優位。
Discussion