ちょっと前に、回帰分析における多重共線性に関する解説記事を2本ほど書いたわけですが。 多重共線性そのものの問題点はこれでもかと論じている割に、その対処法についてはあまり触れていなかったなと気付いたのでした。ということで、今回の記事では遅ればせながら多重共線性への対処法をある程度網羅的に挙げていこうと思います。 データセット VIFで多重共線性に寄与する変数を特定した上で削除orマージ(第一選択) PCAで変数を削除orマージ(要件次第) L1正則化で変数選択(要件次第) L2正則化で回帰係数同士のバランスをとる(非推奨) ベイズ回帰で事前分布を設定することで多重共線性によるバイアスを軽減させる(事前分布の蓋然性次第) コメントなど データセット まず、x1-5の5つの説明変数から成るデータセットを用意します。真の回帰係数はそれぞれ1, 2, -2, 5, -3.5とし、サンプルサイズは10