はじめに 主成分分析を使って、画像データの傾向を掴んだり、前景と背景に分離することになりました。 勉強したことを備忘のためにもここに書いていきます。 この記事で扱う内容 pythonのscikit learnのPCA(Principal Component Analysis)を使って主成分分析を実施し、低次元の主成分の空間に圧縮してみます。データとしては、ここでもMNISTを使ってみます。 MNISTの訓練データを使ってPCAを実施し、主成分の寄与率を求めてデータの75%ほどを説明できる次元数を求めます。そしてこの低い次元数に圧縮した画像を、訓練データとテストデータそれぞれで確認します。 また、第1主成分と第2主成分の二次元まで落として可視化して、0から9までの手書き文字がどのように分布するかを確認します。 実装 MNISTの読み込みと寄与率の確認 まずはMNISTデータを読み込みます。こ