独立成分分析

この記事には参考文献や外部リンクの一覧が含まれていますが、脚注によって参照されておらず、情報源が不明瞭です。脚注を導入して、記事の信頼性向上にご協力ください。(2023年10月)

この記事は英語版の対応するページを翻訳することにより充実させることができます。(2024年5月)

翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。

英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。
万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。
信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。
履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。
翻訳後、{{翻訳告知|en|Independent component analysis|...}}をノートに追加することもできます。
Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があります。

独立成分分析(どくりつせいぶんぶんせき、英: independent component analysis、ICA)は、多変量の信号を複数の加法的な成分に分離するための計算手法である。各成分は、ガウス的でない信号で相互に統計的独立なものを想定する。これはブラインド信号分離の特殊な場合である。

概要

[編集 ]

独立性の仮定が正しいなら、混合信号のブラインドICA分離は非常に良い結果となる。混合信号でなくとも、分析のためにこれを行う場合もある。典型的なICAの応用として、室内で録音された複数の人間の会話から特定の人物の声を抜き出す音源分離がある。一般に遅延や反響がないと仮定することで問題が単純化される。考慮すべき重要な点として、N個の信号源があるとき、個々を分離するには少なくともN個の観測装置(マイクロフォンなど)が必要となる。

この統計的手法は、予測される成分の統計的独立性を最大化するようにその独立成分(ファクター、潜在変数、信号源など)を見つける。中心極限定理によると、非ガウス性^{[注釈 1]}は成分の独立性を測る手法の1つである。非ガウス性は例えば、尖度やネゲントロピーの近似で測ることができる。相互情報量も信号間の独立性の尺度となる。

ICAの典型的アルゴリズムでは、複雑さを削減するために前段階として、中心化^{[注釈 2]}、白色化^{[注釈 3]}、次元削減(圧縮)^{[注釈 4]}などを行う。白色化と次元削減は主成分分析や特異値分解 ^{[注釈 5]}などによってなされる。ICAのアルゴリズムとしては、Infomax(インフォマックス)、FastICA(ファストアイシーエイ)、JADE(ジェイド)など様々なものがある。

ICA はブラインド信号分離で重要であり、具体的な応用がいくつもある。

数学的定義

[編集 ]

線形独立成分分析はノイズのない場合とノイズのある場合に分けられ、ノイズのない ICA はノイズのある ICA の特別な場合である。非線形 ICA はそれらとは別と考えられる。

一般的定義

[編集 ]

データは確率変数ベクトル $x=(x_{1},\ldots ,x_{m})$ {\displaystyle x=(x_{1},\ldots ,x_{m})} と成分の確率変数ベクトル $s=(s_{1},\ldots ,s_{n})$ {\displaystyle s=(s_{1},\ldots ,s_{n})} で表される。すべきことは、線形な統計的変換 $s=Wx$ {\displaystyle s=Wx} を使って、観測データ $x$ {\displaystyle x} を独立成分 $s$ {\displaystyle s} に変換することである(独立性は関数 $F(s_{1},\ldots ,s_{n})$ {\displaystyle F(s_{1},\ldots ,s_{n})} によって表される)。

生成的モデル

[編集 ]

線形ノイズなしICA

[編集 ]

観測された確率変数ベクトル $x=(x_{1},\ldots ,x_{m})^{T}$ {\displaystyle x=(x_{1},\ldots ,x_{m})^{T}} の成分 $x_{i}$ {\displaystyle x_{i}} は独立成分 $s_{k}$ {\displaystyle s_{k}}, $k=1,\ldots ,n$ {\displaystyle k=1,\ldots ,n} の次のような総和として生成される。

$x_{i}=a_{i,1}s_{1}+\ldots +a_{i,k}s_{k}+\ldots +a_{i,n}s_{n}$ {\displaystyle x_{i}=a_{i,1}s_{1}+\ldots +a_{i,k}s_{k}+\ldots +a_{i,n}s_{n}}

すなわち、 $a_{i,k}$ {\displaystyle a_{i,k}} でそれぞれの独立成分に重み付けがなされている。

このモデルをベクトルとして表すと

$x=\sum _{k=1}^{n}s_{k}a_{k}$ {\displaystyle x=\sum _{k=1}^{n}s_{k}a_{k}}

となり、観測された確率変数ベクトル $x$ {\displaystyle x} が基本ベクトル $a_{k}=(a_{1,k},\ldots ,a_{m,k})^{T}$ {\displaystyle a_{k}=(a_{1,k},\ldots ,a_{m,k})^{T}} で表される。

基本ベクトル $a_{k}$ {\displaystyle a_{k}} は混合行列^{[注釈 6]} $A=(a_{1},\ldots ,a_{n})$ {\displaystyle A=(a_{1},\ldots ,a_{n})} の列を形成し、生成式は $x=As$ {\displaystyle x=As} と表され、このとき $s=(s_{1},\ldots ,s_{n})^{T}$ {\displaystyle s=(s_{1},\ldots ,s_{n})^{T}} である。

モデルと $x_{1},\ldots ,x_{N}$ {\displaystyle x_{1},\ldots ,x_{N}} からなる確率変数ベクトル $x$ {\displaystyle x} の標本があるとき、混合行列 $A$ {\displaystyle A} と信号源 $s$ {\displaystyle s} を予測する作業が行われる。これは、 $w$ {\displaystyle w} ベクトルを順応的に計算し、計算された $s_{k}=(w^{T}*x)$ {\displaystyle s_{k}=(w^{T}*x)} の非ガウス性を最大化するか、相互情報量を最小化するコスト関数を設定することでなされる。場合によっては信号源の確率分布についての事前の知識をコスト関数に利用する。

信号源 $s$ {\displaystyle s} は観測された信号群 $x$ {\displaystyle x} に混合行列の逆行列 $W=A^{-1}$ {\displaystyle W=A^{-1}} (分離行列^{[注釈 7]}をかけることで求められる。ここで、混合行列は正方行列と想定されている。

線形ノイズありICA

[編集 ]

平均がゼロとなる無相関のガウス雑音 $n\sim N(0,\operatorname {diag} (\Sigma ))$ {\displaystyle n\sim N(0,\operatorname {diag} (\Sigma ))} を仮定すると、ICAモデルは $x=As+n$ {\displaystyle x=As+n} という形式になる。

非線形ICA

[編集 ]

信号源の混合は線形でなければならないわけではない。パラメータ $\theta$ {\displaystyle \theta } の非線形混合関数 $f(\cdot |\theta )$ {\displaystyle f(\cdot |\theta )} による非線形ICAモデルは $x=f(s|\theta )+n$ {\displaystyle x=f(s|\theta )+n} となる。

同定可能性

[編集 ]

独立成分分析の同定可能性には以下の要素が必要である。

信号源のうち高々1つだけ( $s_{k}$ {\displaystyle s_{k}})がガウス雑音である。
混合信号の観測数 $m$ {\displaystyle m} と予測される信号源の数 $n$ {\displaystyle n} について、 $m\geq n$ {\displaystyle m\geq n} でなければならない。
混合行列 $A$ {\displaystyle A} の行列の階数は最大でなければならない。

脚注

[編集 ]

[脚注の使い方]

注釈

[編集 ]

^ 英: non-Gaussianity
^ 英: centering
^ 英: whitening
^ 英: dimensionality reduction
^ 英: singular value decomposition
^ 英: mixing matrix
^ 英: demixing matrix、separating matrix

参考文献

[編集 ]

村田昇:『入門独立成分分析』、東京電機大学出版局、ISBN 4-501-53750-7 (2004年7月10日).
Aapo Hyvärien, Juha Karhunen:『詳解独立成分分析:信号解析の新しい世界』、東京電機大学出版局、ISBN 978-4-501-53860-6(2005年2月10日).

外部リンク

[編集 ]

What is independent component analysis? by Aapo Hyvärinen
Nonlinear ICA, Unsupervised Learning, Redundancy Reduction by Jürgen Schmidhuber
A Brief Introduction to Independent Component Analysis by JV Stone, 2005 (7 pages).
A. Hyvärinen, J. Karhunen, E. Oja (2001). Independent Component Analysis という書籍の Introductory chapter
FastICA as a package for Matlab, in R language, C++, and Python
ICALAB Toolboxes - Matlab 用。理化学研究所が開発。
High Performance Signal Analysis Toolkit - FastICA や Infomax の C++ による実装。
Free software for ICA by JV Stone.
ICA toolbox - Matlab 用。DTUが開発。
Demonstration of the cocktail party problem
EEGLAB Toolbox - Matlab による脳波の独立成分分析ツール。UCSDが開発。
FMRLAB Toolbox - Matlab によるfMRIの独立成分分析ツール。UCSDが開発。
Discussion of ICA used in a biomedical shape-representation context

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック–ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

相関係数	ピアソンの積率相関係数スピアマンの順位相関係数ケンドールの順位相関係数偏相関係数
その他	自己相関空間的自己相関相互相関交絡変数相関関係と因果関係擬似相関錯誤相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法回帰木ランダムフォレストニューラルネットワークサポートベクター回帰射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法(k-means++法) DBSCAN
密度推定 (英語版)	カーネル密度推定(カーネル)
その他	主成分分析独立成分分析自己組織化写像

統計図表

生存時間分析

歴史

応用

出版物

全般

その他

カテゴリカテゴリ

「https://ja.wikipedia.org/w/index.php?title=独立成分分析&oldid=103671153」から取得

概要

数学的定義

一般的定義

生成的モデル

線形ノイズなしICA

線形ノイズありICA

非線形ICA

同定可能性

脚注

注釈

参考文献

関連項目

外部リンク