<h2 id="%F0%9F%9F%A2-%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" data-line="1" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%9F%A2-%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" aria-hidden="true"></a> <strong>🟢 はじめに</strong>
</h2>
<p data-line="2" class="code-line">画像の特徴量を抽出する際に、最もよく使われるのが**CNN（畳み込みニューラルネットワーク）**です。その中でも <strong>ResNet（Residual Networks）</strong> は、さまざまなバージョンがあり、用途に応じて選択されます。</p>
<p data-line="4" class="code-line">また、ResNet以外にも、<strong>EfficientNet・VGG・Inception・MobileNet</strong> など、画像の特徴量を抽出するための強力なモデルが存在します。</p>
<p data-line="6" class="code-line">今回は、<strong>ResNetの各バージョンの違いを徹底比較し、他の画像特徴量抽出モデルとの違いを詳しく解説</strong>します。</p>
<hr data-line="8" class="code-line">
<h2 id="%F0%9F%93%8C-1.-resnet%E3%81%A8%E3%81%AF%EF%BC%9F" data-line="10" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%93%8C-1.-resnet%E3%81%A8%E3%81%AF%EF%BC%9F" aria-hidden="true"></a> <strong>📌 1. ResNetとは？</strong>
</h2>
<h3 id="%F0%9F%94%B9-%E6%AE%8B%E5%B7%AE%E5%AD%A6%E7%BF%92%EF%BC%88residual-learning%EF%BC%89%E3%81%A8%E3%81%AF%EF%BC%9F" data-line="11" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%94%B9-%E6%AE%8B%E5%B7%AE%E5%AD%A6%E7%BF%92%EF%BC%88residual-learning%EF%BC%89%E3%81%A8%E3%81%AF%EF%BC%9F" aria-hidden="true"></a> <strong>🔹 残差学習（Residual Learning）とは？</strong>
</h3>
<p data-line="12" class="code-line">ResNet（Residual Network）は、**「層を深くしても学習が進む」**という特徴を持つニューラルネットワークです。</p>
<p data-line="14" class="code-line">従来のCNN（VGGなど）では、<strong>層を深くすると勾配消失が発生し、学習が進みにくくなる</strong> という課題がありました。<br>
ResNetは、この問題を解決するために**スキップ接続（Skip Connection）**を導入しました。</p>
<p data-line="17" class="code-line">🔍 <strong>スキップ接続とは？</strong></p>
<ul data-line="18" class="code-line">
<li data-line="18" class="code-line">通常の畳み込み層（Conv）では、出力 = <strong>活性化関数（畳み込み(入力)）</strong> となる。</li>
<li data-line="19" class="code-line">ResNetでは、<strong>「入力 + 出力」</strong> を足し合わせることで、勾配の伝播をスムーズにする。</li>
<li data-line="20" class="code-line">これにより、層が深くなっても<strong>情報が失われにくくなる</strong>。</li>
</ul>
<hr data-line="22" class="code-line">
<h2 id="%F0%9F%93%8C-2.-resnet%E3%81%AE%E7%A8%AE%E9%A1%9E%E3%81%A8%E9%81%95%E3%81%84%EF%BC%8818%EF%BD%9E152%EF%BC%89" data-line="24" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%93%8C-2.-resnet%E3%81%AE%E7%A8%AE%E9%A1%9E%E3%81%A8%E9%81%95%E3%81%84%EF%BC%8818%EF%BD%9E152%EF%BC%89" aria-hidden="true"></a> <strong>📌 2. ResNetの種類と違い（18～152）</strong>
</h2>
<p data-line="25" class="code-line">ResNetには <strong>ResNet18, ResNet34, ResNet50, ResNet101, ResNet152</strong> という複数のバージョンが存在します。<br>
それぞれの違いは、<strong>ネットワークの深さ（層数）</strong> にあります。</p>
<h3 id="%F0%9F%94%B9-resnet%E3%81%AE%E5%90%84%E3%83%90%E3%83%BC%E3%82%B8%E3%83%A7%E3%83%B3%E3%81%AE%E6%AF%94%E8%BC%83" data-line="28" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%94%B9-resnet%E3%81%AE%E5%90%84%E3%83%90%E3%83%BC%E3%82%B8%E3%83%A7%E3%83%B3%E3%81%AE%E6%AF%94%E8%BC%83" aria-hidden="true"></a> <strong>🔹 ResNetの各バージョンの比較</strong>
</h3>
<table data-line="29" class="code-line">
<thead data-line="29" class="code-line">
<tr data-line="29" class="code-line">
<th><strong>モデル</strong></th>
<th><strong>畳み込み層の数</strong></th>
<th><strong>パラメータ数</strong></th>
<th><strong>出力次元 (GAP後)</strong></th>
</tr>
</thead>
<tbody data-line="31" class="code-line">
<tr data-line="31" class="code-line">
<td><strong>ResNet18</strong></td>
<td>18層</td>
<td>11.7M</td>
<td>512</td>
</tr>
<tr data-line="32" class="code-line">
<td><strong>ResNet34</strong></td>
<td>34層</td>
<td>21.8M</td>
<td>512</td>
</tr>
<tr data-line="33" class="code-line">
<td><strong>ResNet50</strong></td>
<td>50層</td>
<td>25.6M</td>
<td>2048</td>
</tr>
<tr data-line="34" class="code-line">
<td><strong>ResNet101</strong></td>
<td>101層</td>
<td>44.5M</td>
<td>2048</td>
</tr>
<tr data-line="35" class="code-line">
<td><strong>ResNet152</strong></td>
<td>152層</td>
<td>60.2M</td>
<td>2048</td>
</tr>
</tbody>
</table>
<h3 id="%F0%9F%94%B9-%E3%83%A2%E3%83%87%E3%83%AB%E3%81%94%E3%81%A8%E3%81%AE%E7%89%B9%E5%BE%B4" data-line="37" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%94%B9-%E3%83%A2%E3%83%87%E3%83%AB%E3%81%94%E3%81%A8%E3%81%AE%E7%89%B9%E5%BE%B4" aria-hidden="true"></a> <strong>🔹 モデルごとの特徴</strong>
</h3>
<ul data-line="38" class="code-line">
<li data-line="38" class="code-line">
<strong>ResNet18 / ResNet34</strong>
<ul data-line="39" class="code-line">
<li data-line="39" class="code-line"><strong>軽量で処理が速い</strong></li>
<li data-line="40" class="code-line">エッジデバイス（スマホ、IoT）やリアルタイム処理向け</li>
<li data-line="41" class="code-line"><strong>特徴量の次元数は 512</strong></li>
</ul>
</li>
<li data-line="42" class="code-line">
<strong>ResNet50</strong>
<ul data-line="43" class="code-line">
<li data-line="43" class="code-line"><strong>バランスが良い</strong></li>
<li data-line="44" class="code-line">ほとんどの画像分類・特徴抽出タスクで使用</li>
<li data-line="45" class="code-line"><strong>特徴量の次元数は 2048</strong></li>
</ul>
</li>
<li data-line="46" class="code-line">
<strong>ResNet101 / ResNet152</strong>
<ul data-line="47" class="code-line">
<li data-line="47" class="code-line"><strong>精度が高いが計算コストが高い</strong></li>
<li data-line="48" class="code-line">大規模な画像データセット向け（医療画像解析、AIアート）</li>
<li data-line="49" class="code-line"><strong>特徴量の次元数は 2048</strong></li>
</ul>
</li>
</ul>
<hr data-line="51" class="code-line">
<h2 id="%F0%9F%93%8C-3.-resnet%E4%BB%A5%E5%A4%96%E3%81%AE%E7%94%BB%E5%83%8F%E7%89%B9%E5%BE%B4%E9%87%8F%E6%8A%BD%E5%87%BA%E3%83%A2%E3%83%87%E3%83%AB" data-line="53" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%93%8C-3.-resnet%E4%BB%A5%E5%A4%96%E3%81%AE%E7%94%BB%E5%83%8F%E7%89%B9%E5%BE%B4%E9%87%8F%E6%8A%BD%E5%87%BA%E3%83%A2%E3%83%87%E3%83%AB" aria-hidden="true"></a> <strong>📌 3. ResNet以外の画像特徴量抽出モデル</strong>
</h2>
<p data-line="54" class="code-line">ResNetの他にも、画像の特徴量抽出に優れたモデルが存在します。<br>
以下に、それぞれの特徴を詳しく説明します。</p>
<h3 id="%F0%9F%94%B9-efficientnet%EF%BC%88%E6%9C%80%E6%96%B0%E3%81%AE%E9%AB%98%E5%8A%B9%E7%8E%87%E3%83%A2%E3%83%87%E3%83%AB%EF%BC%89" data-line="57" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%94%B9-efficientnet%EF%BC%88%E6%9C%80%E6%96%B0%E3%81%AE%E9%AB%98%E5%8A%B9%E7%8E%87%E3%83%A2%E3%83%87%E3%83%AB%EF%BC%89" aria-hidden="true"></a> <strong>🔹 EfficientNet（最新の高効率モデル）</strong>
</h3>
<p data-line="58" class="code-line">✅ <strong>ポイント</strong></p>
<ul data-line="59" class="code-line">
<li data-line="59" class="code-line">
<strong>「小さいのに強い」</strong> → 少ないパラメータで高精度を実現</li>
<li data-line="60" class="code-line"><strong>MobileNetのように軽量、ResNetのように高精度</strong></li>
<li data-line="61" class="code-line"><strong>EfficientNet-B0 ～ B7 の7つのバージョンがある</strong></li>
</ul>
<p data-line="63" class="code-line">✅ <strong>活用シーン</strong></p>
<ul data-line="64" class="code-line">
<li data-line="64" class="code-line">スマホ・組み込み機器（エッジAI）</li>
<li data-line="65" class="code-line">高精度なリアルタイム画像認識</li>
</ul>
<p data-line="67" class="code-line">✅ <strong>出力次元</strong></p>
<table data-line="68" class="code-line">
<thead data-line="68" class="code-line">
<tr data-line="68" class="code-line">
<th>EfficientNet</th>
<th>パラメータ数</th>
<th>出力次元</th>
</tr>
</thead>
<tbody data-line="70" class="code-line">
<tr data-line="70" class="code-line">
<td>B0</td>
<td>5.3M</td>
<td>1280</td>
</tr>
<tr data-line="71" class="code-line">
<td>B3</td>
<td>12M</td>
<td>1536</td>
</tr>
<tr data-line="72" class="code-line">
<td>B7</td>
<td>66M</td>
<td>2560</td>
</tr>
</tbody>
</table>
<hr data-line="74" class="code-line">
<h3 id="%F0%9F%94%B9-vgg%EF%BC%88%E3%82%B7%E3%83%B3%E3%83%97%E3%83%AB%E3%81%A0%E3%81%91%E3%81%A9%E8%A8%88%E7%AE%97%E9%87%8F%E3%81%8C%E5%A4%9A%E3%81%84%EF%BC%89" data-line="76" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%94%B9-vgg%EF%BC%88%E3%82%B7%E3%83%B3%E3%83%97%E3%83%AB%E3%81%A0%E3%81%91%E3%81%A9%E8%A8%88%E7%AE%97%E9%87%8F%E3%81%8C%E5%A4%9A%E3%81%84%EF%BC%89" aria-hidden="true"></a> <strong>🔹 VGG（シンプルだけど計算量が多い）</strong>
</h3>
<p data-line="77" class="code-line">✅ <strong>ポイント</strong></p>
<ul data-line="78" class="code-line">
<li data-line="78" class="code-line">
<strong>「ResNetの前身」</strong> → 直感的なアーキテクチャ</li>
<li data-line="79" class="code-line"><strong>非常にシンプルな設計（3×3畳み込みを繰り返す）</strong></li>
<li data-line="80" class="code-line"><strong>パラメータ数が非常に多く、計算コストが高い</strong></li>
</ul>
<p data-line="82" class="code-line">✅ <strong>活用シーン</strong></p>
<ul data-line="83" class="code-line">
<li data-line="83" class="code-line"><strong>計算コストを気にしないオフライン処理</strong></li>
<li data-line="84" class="code-line"><strong>事前学習済みモデルを使う画像分類</strong></li>
</ul>
<p data-line="86" class="code-line">✅ <strong>出力次元</strong></p>
<table data-line="87" class="code-line">
<thead data-line="87" class="code-line">
<tr data-line="87" class="code-line">
<th>モデル</th>
<th>パラメータ数</th>
<th>出力次元</th>
</tr>
</thead>
<tbody data-line="89" class="code-line">
<tr data-line="89" class="code-line">
<td>VGG16</td>
<td>138M</td>
<td>4096</td>
</tr>
<tr data-line="90" class="code-line">
<td>VGG19</td>
<td>144M</td>
<td>4096</td>
</tr>
</tbody>
</table>
<p data-line="92" class="code-line">💡 <strong>VGGはResNetと比較して精度が劣るため、特徴抽出にはあまり使われない。</strong></p>
<hr data-line="94" class="code-line">
<h3 id="%F0%9F%94%B9-inception%EF%BC%88google%E9%96%8B%E7%99%BA%E3%81%AE%E5%A4%9A%E3%82%B9%E3%82%B1%E3%83%BC%E3%83%AB%E3%83%A2%E3%83%87%E3%83%AB%EF%BC%89" data-line="96" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%94%B9-inception%EF%BC%88google%E9%96%8B%E7%99%BA%E3%81%AE%E5%A4%9A%E3%82%B9%E3%82%B1%E3%83%BC%E3%83%AB%E3%83%A2%E3%83%87%E3%83%AB%EF%BC%89" aria-hidden="true"></a> <strong>🔹 Inception（Google開発の多スケールモデル）</strong>
</h3>
<p data-line="97" class="code-line">✅ <strong>ポイント</strong></p>
<ul data-line="98" class="code-line">
<li data-line="98" class="code-line"><strong>「1つの畳み込みカーネルサイズに依存しない」</strong></li>
<li data-line="99" class="code-line"><strong>複数の異なるカーネルサイズ（1×1, 3×3, 5×5）を同時に適用</strong></li>
<li data-line="100" class="code-line"><strong>特徴の多様性を維持</strong></li>
</ul>
<p data-line="102" class="code-line">✅ <strong>活用シーン</strong></p>
<ul data-line="103" class="code-line">
<li data-line="103" class="code-line"><strong>多様な物体が混在する画像認識</strong></li>
<li data-line="104" class="code-line"><strong>画像分類（Googleの画像検索エンジン）</strong></li>
</ul>
<p data-line="106" class="code-line">✅ <strong>出力次元</strong></p>
<table data-line="107" class="code-line">
<thead data-line="107" class="code-line">
<tr data-line="107" class="code-line">
<th>モデル</th>
<th>パラメータ数</th>
<th>出力次元</th>
</tr>
</thead>
<tbody data-line="109" class="code-line">
<tr data-line="109" class="code-line">
<td>InceptionV3</td>
<td>23M</td>
<td>2048</td>
</tr>
<tr data-line="110" class="code-line">
<td>InceptionV4</td>
<td>43M</td>
<td>2048</td>
</tr>
</tbody>
</table>
<hr data-line="112" class="code-line">
<h2 id="%F0%9F%93%8C-4.-%E3%81%A9%E3%81%AE%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92%E9%81%B8%E3%81%B6%E3%81%B9%E3%81%8D%E3%81%8B%EF%BC%9F" data-line="114" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%93%8C-4.-%E3%81%A9%E3%81%AE%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92%E9%81%B8%E3%81%B6%E3%81%B9%E3%81%8D%E3%81%8B%EF%BC%9F" aria-hidden="true"></a> <strong>📌 4. どのモデルを選ぶべきか？</strong>
</h2>
<table data-line="115" class="code-line">
<thead data-line="115" class="code-line">
<tr data-line="115" class="code-line">
<th><strong>用途</strong></th>
<th><strong>最適なモデル</strong></th>
</tr>
</thead>
<tbody data-line="117" class="code-line">
<tr data-line="117" class="code-line">
<td><strong>軽量 &amp; 高速</strong></td>
<td>ResNet18, EfficientNet-B0, MobileNet</td>
</tr>
<tr data-line="118" class="code-line">
<td><strong>バランス</strong></td>
<td>ResNet50, InceptionV3</td>
</tr>
<tr data-line="119" class="code-line">
<td><strong>高精度</strong></td>
<td>ResNet101, ResNet152, EfficientNet-B7</td>
</tr>
<tr data-line="120" class="code-line">
<td><strong>多スケール特徴抽出</strong></td>
<td>InceptionV3, InceptionV4</td>
</tr>
<tr data-line="121" class="code-line">
<td><strong>オフライン計算（計算コスト無視）</strong></td>
<td>VGG16, VGG19</td>
</tr>
</tbody>
</table>
<hr data-line="123" class="code-line">
<h2 id="%F0%9F%93%8C-5.-%E3%81%BE%E3%81%A8%E3%82%81" data-line="125" class="code-line">
<a class="header-anchor-link" href="#%F0%9F%93%8C-5.-%E3%81%BE%E3%81%A8%E3%82%81" aria-hidden="true"></a> <strong>📌 5. まとめ</strong>
</h2>
<ul data-line="126" class="code-line">
<li data-line="126" class="code-line"><strong>ResNetはスキップ接続を導入し、深層学習の勾配消失を解決した</strong></li>
<li data-line="127" class="code-line"><strong>ResNetのバージョン（18〜152）は、層数・パラメータ数・出力次元が異なる</strong></li>
<li data-line="128" class="code-line"><strong>EfficientNetは最新の高効率モデル</strong></li>
<li data-line="129" class="code-line"><strong>VGGはシンプルだが計算コストが高く、あまり特徴抽出には向かない</strong></li>
<li data-line="130" class="code-line"><strong>Inceptionは異なるカーネルサイズを同時に適用し、多スケール特徴を抽出可能</strong></li>
</ul>
<p data-line="132" class="code-line"><strong>✅ 結論</strong><br>
<strong>「計算コストが許すなら ResNet50 or EfficientNet-B3 を選べばOK！」</strong><br>
この2つはバランスがよく、ほとんどの画像特徴抽出タスクで最適です！ 🚀</p>


画像特徴量抽出モデルの比較：ResNetの進化と他のモデルとの違い

🔹 残差学習（Residual Learning）とは？

🔹 ResNetの各バージョンの比較

📌 2. ResNetの種類と違い（18～152）

🔹 EfficientNet（最新の高効率モデル）

🔹 VGG（シンプルだけど計算量が多い）

🔹 Inception（Google開発の多スケールモデル）

📌 3. ResNet以外の画像特徴量抽出モデル

📌 4. どのモデルを選ぶべきか？

機械学習

Discussion