🙄

リッジ回帰とは？L1正則化・L2正則化・SVMとの関連性

2025/03/03に公開

 1. リッジ回帰（Ridge Regression）とは？リッジ回帰は、過学習を防ぐための正則化手法の一つであり、線形回帰の拡張版として知られています。通常の線形回帰では、目的変数 ( y ) を説明変数 ( X ) の線形結合として表現しますが、データが多次元である場合や、多重共線性が存在する場合、回帰係数が不安定になり、モデルの一般化能力が低下することがあります。
リッジ回帰では、回帰係数（重み）( \beta ) の大きさに対してペナルティを課すことで、モデルの安定性を向上させます。
リッジ回帰の損失関数は次のように表されます：
[

L(\beta) = \sum_{i=1}^{n} (y_i - \hat{y}i)^2 + \lambda \sum{j=1}^{p} \beta_j^2

]
ここで、
( (y_i - \hat{y}_i)^2 ) は通常の最小二乗誤差（MSE）
( \lambda \sum_{j=1}^{p} \beta_j^2 ) はL2正則化項（ペナルティ）
( \lambda ) は正則化の強さを調整するハイパーパラメータ
リッジ回帰の主な目的は、回帰係数の絶対値を小さく抑え、モデルの過学習を防ぐこと です。

 2. L1正則化（Lasso回帰）とL2正則化（リッジ回帰）リッジ回帰の正則化項はL2正則化（( L2 ) regularization）と呼ばれ、回帰係数の二乗和をペナルティとして課します。一方で、L1正則化（Lasso回帰）という別の手法も存在します。

 L1正則化（Lasso回帰）Lasso回帰（Least Absolute Shrinkage and Selection Operator）は、L1ノルムを正則化項として導入した回帰手法です。
[

L(\beta) = \sum_{i=1}^{n} (y_i - \hat{y}i)^2 + \lambda \sum{j=1}^{p} |\beta_j|

]
L1正則化の特徴は、不要な回帰係数をゼロにすることができる 点です。そのため、特徴量選択の機能を持つ ことが最大の利点です。


比較項目
L1正則化（Lasso）
L2正則化（Ridge）


正則化項
( \sum
\beta_j

目的
不要な変数を削除し、スパースなモデルを作る
係数の大きさを均等に小さくし、多重共線性を抑える

係数の効果
一部の係数がゼロになる
すべての係数が小さくなるがゼロにはならない

適用場面
特徴量選択が必要な場合
高次元データの安定化が必要な場合


 3. L1/L2正則化とSVM（サポートベクターマシン）の関連性リッジ回帰とLasso回帰の正則化手法は、サポートベクターマシン（SVM）とも関連があります。

 SVMにおける正則化SVMでは、マージンを最大化するために、L1正則化またはL2正則化が適用されることがあります。
L1正則化のSVM（L1-SVM）：
特徴量のスパース化を行い、一部の特徴量の重みをゼロにする（特徴選択が可能）
高次元データで有用
L2正則化のSVM（L2-SVM）：
すべての特徴量を考慮しながら、マージンを最適化する
適度なペナルティを与えながら過学習を防ぐ
SVMにおける正則化は、リッジ回帰やLasso回帰と同じく、モデルの安定性を高め、過学習を防ぐ役割を果たします。

 4. リッジ回帰の実用的な応用例リッジ回帰は、以下のような場面で有効です。

多重共線性の問題を持つデータセット
変数間の相関が強い場合、リッジ回帰は通常の回帰分析よりも安定したモデルを構築できます。


高次元データの回帰分析
説明変数が非常に多い場合、リッジ回帰を適用するとモデルの過学習を防ぎながら予測精度を向上できます。


医療・金融・マーケティング領域のデータ分析
変数の重要性を考慮しつつ、信頼性の高いモデルを構築できます。


 5. まとめ
リッジ回帰（Ridge Regression）はL2正則化を用いた線形回帰の拡張 であり、過学習を防ぎながらモデルの安定性を向上させる。

L1正則化（Lasso回帰）は特徴量選択が可能な手法 であり、スパースなモデルを作るのに適している。
SVMにもL1正則化・L2正則化が適用され、特徴選択や過学習の防止に役立つ。

リッジ回帰は高次元データや多重共線性のあるデータで特に有効 であり、さまざまな応用分野で活用されている。
これらの手法を適切に使い分けることで、より精度の高い機械学習モデルを構築することができます。

比較項目	L1正則化（Lasso）	L2正則化（Ridge）
正則化項	( \sum	\beta_j
目的	不要な変数を削除し、スパースなモデルを作る	係数の大きさを均等に小さくし、多重共線性を抑える
係数の効果	一部の係数がゼロになる	すべての係数が小さくなるがゼロにはならない
適用場面	特徴量選択が必要な場合	高次元データの安定化が必要な場合

1. リッジ回帰（Ridge Regression）とは？

2. L1正則化（Lasso回帰）とL2正則化（リッジ回帰）

L1正則化（Lasso回帰）

3. L1/L2正則化とSVM（サポートベクターマシン）の関連性

SVMにおける正則化

4. リッジ回帰の実用的な応用例

5. まとめ

Discussion