結果から原因を予測する問題を逆問題と言います。 
逆問題では順問題とは異なり問題が非適切になっていることが大半で、安定した解が得られません。 
非適切性が原因で生じる誤差鋭敏性という現象について説明します。
<h2 id="%E9%80%86%E5%95%8F%E9%A1%8C%E3%81%A8%E3%81%AF%EF%BC%9F">
<a class="header-anchor-link" href="#%E9%80%86%E5%95%8F%E9%A1%8C%E3%81%A8%E3%81%AF%EF%BC%9F" aria-hidden="true"></a> 逆問題とは？</h2>
モデルの出力から入力を推定する問題のことです。 
逆問題ではモデルに組み込まれていない観測値に含まれる未知量が原因で非適切な問題となることが多いです。 
出力から入力を求める過程を逆過程と言い、逆問題を解く方法を逆解析と言います。
<h2 id="%E9%80%86%E5%95%8F%E9%A1%8C%E3%81%AE%E9%81%A9%E5%88%87%E6%80%A7">
<a class="header-anchor-link" href="#%E9%80%86%E5%95%8F%E9%A1%8C%E3%81%AE%E9%81%A9%E5%88%87%E6%80%A7" aria-hidden="true"></a> 逆問題の適切性</h2>
逆問題は以下の3つの適切性を満たさないとき安定した解が得られません。
<ol>
<li>解の存在性</li>
<li>解の一意性</li>
<li>解の安定性</li>
</ol>
1 と 2 は条件を満たしている、あるいは満たしていなくても問題にならないことが多いです。 
3 が満たされていないとき、誤差鋭敏性という現象が生じて解が安定しなくなります。 
観測値にはノイズが含まれていますのでほとんどの逆問題で発生します。
<h2 id="%E8%AA%A4%E5%B7%AE%E9%8B%AD%E6%95%8F%E6%80%A7%E3%81%A8%E3%81%AF%EF%BC%9F">
<a class="header-anchor-link" href="#%E8%AA%A4%E5%B7%AE%E9%8B%AD%E6%95%8F%E6%80%A7%E3%81%A8%E3%81%AF%EF%BC%9F" aria-hidden="true"></a> 誤差鋭敏性とは？</h2>
観測誤差が含まれる観測値で逆解析をすると解が大きく変動する現象のことをいいます。 
これは特異値が小さな特異ベクトルで生じます。特異値の詳細は<a href="https://ja.wikipedia.org/wiki/%E7%89%B9%E7%95%B0%E5%80%A4%E5%88%86%E8%A7%A3" target="_blank" rel="nofollow noopener noreferrer">wiki</a>を参照してください。
誤差鋭敏性のメカニズムは以下の通りです。 
偏回帰係数を <embed-katex><eq class="zenn-katex">A</eq></embed-katex> として <embed-katex><eq class="zenn-katex">r</eq></embed-katex> 番目の特異ベクトルの特異値が小さな値だったとします。観測誤差が含まれた観測値を <embed-katex><eq class="zenn-katex">A</eq></embed-katex> の逆行列に入力すると観測誤差の <embed-katex><eq class="zenn-katex">r</eq></embed-katex> 番目の特異ベクトル成分と特異値の逆数が掛け合わされて解が大きく変動します。
では特異値が小さいときに誤差鋭敏性が起きるのか確認してみましょう。
<div class="code-block-container"><pre class="language-python"><code class="language-python">... # 観測値b1から0.1ずつずらした観測値をb2として解の変動を確認します。
&gt;&gt;&gt; A = np.array([[7.1, 5.9], [7.7, 6.5]])
&gt;&gt;&gt; b1 = np.array([3.6, 3.8])
&gt;&gt;&gt; b2 = np.array([3.5, 3.9])
&gt;&gt;&gt; np.linalg.inv(A) @ b1
array([1.3611111, -1.0277778])
&gt;&gt;&gt; np.linalg.inv(A) @ b2
array([-0.3611111, 1.0277778])
... # 観測値が0.1しかずれていないにもかかわらず解が大きく変動しています。
</code></pre></div><embed-katex><eq class="zenn-katex">A</eq></embed-katex> を特異値分解すると特異値が小さいのが分かります。
<div class="code-block-container"><pre class="language-python"><code class="language-python">&gt;&gt;&gt; u, s, vh = np.linalg.svd(A)
&gt;&gt;&gt; s
array([13.66591, 0.052686])
</code></pre></div>誤差鋭敏性の大きさは特異値の最大値と最小値の比の条件数で決まります。 
条件数が大きいときは誤差鋭敏性が大きい悪条件になります。
<div class="code-block-container"><pre class="language-python"><code class="language-python">&gt;&gt;&gt; s[0]/s[1]
259.385034
</code></pre></div><embed-katex><eq class="zenn-katex">r</eq></embed-katex> 番目の特異ベクトルを削除する低ランク近似あるいは特異値を正則化項で大きくするチホノフ正則化によって誤差鋭敏性は適切化されます。
<h2 id="%E8%AA%A4%E5%B7%AE%E9%8B%AD%E6%95%8F%E6%80%A7%E3%81%AE%E5%8F%AF%E8%A6%96%E5%8C%96">
<a class="header-anchor-link" href="#%E8%AA%A4%E5%B7%AE%E9%8B%AD%E6%95%8F%E6%80%A7%E3%81%AE%E5%8F%AF%E8%A6%96%E5%8C%96" aria-hidden="true"></a> 誤差鋭敏性の可視化</h2>
b1にガウスノイズを加えて逆解析をしてみましょう。
<div class="code-block-container"><pre class="language-python"><code class="language-python"># iはノイズスケール
noise = np.random.normal(loc=0, scale=i, size=(100, 2))
b1 = b1 + noise
x = b1 @ np.linalg.pinv(A)
x1 = x[:, 0]
</code></pre></div>n=100でx1を箱ヒゲ図でx1の分布を表示します。 
横軸はノイズの標準偏差で観測誤差にあたります。
<img src="https://storage.googleapis.com/zenn-user-upload/dtnirbt33667ibrdyq6cujtj45cs" alt loading="lazy" class="md-img">
ノイズのスケールに対してx1のばらつきはとても大きいです。 
誤差鋭敏性を可視化できました。
<h2 id="%E3%81%BE%E3%81%A8%E3%82%81">
<a class="header-anchor-link" href="#%E3%81%BE%E3%81%A8%E3%82%81" aria-hidden="true"></a> まとめ</h2>
逆過程で解を陽に求めると誤差鋭敏性が生じます。 
誤差鋭敏性は特異値の小さな特異ベクトルで生じその大きさは条件数で決まります。 
悪条件になっている場合低ランク近似あるいはチホノフ正則化で適切化する必要があります。
適切化手法は別の記事に書きます。

逆問題と誤差鋭敏性について

Discussion