統計学には様々な分析手法がありますが、変数間の相関関係の強さを定量的に測るための「相関係数(ピアソンの積率相関係数)」は非常に有名でよく使われています。 通常、連続変数(量的変数)間の相関関係を定量評価するために使われる相関係数ですが、カテゴリカル変数(質的変数)に対して使える相関係数も存在します。 私が所属する株式会社 GA technologies ではマンションの設備の充実度のスコアリングといったことも行っており、マンションの設備データは「宅配ボックスの有無」「インターネット対応かどうか」「浴室のタイプ("3 点ユニットバス", "2 点ユニットバス", "独立洗面台")」など様々なカテゴリカル変数が含まれています。本記事でご紹介する「カテゴリカル変数の相関係数」は私自身も業務で使用しており、個人的に興味深い手法だと思うのでご紹介します。 (※(注記)なおタイトルでは「カテゴリカル変数」と書