コンテンツにスキップ
Wikipedia

独立成分分析

出典: フリー百科事典『ウィキペディア(Wikipedia)』
この記事には参考文献外部リンクの一覧が含まれていますが、脚注によって参照されておらず、情報源が不明瞭です 脚注を導入して、記事の信頼性向上にご協力ください。(2023年10月)
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2024年5月)
翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
  • 英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。
  • 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。
  • 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。
  • 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。
  • 翻訳後、{{翻訳告知|en|Independent component analysis|...}}ノートに追加することもできます。
  • Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があります。

独立成分分析(どくりつせいぶんぶんせき、: independent component analysis、ICA)は、多変量の信号を複数の加法的な成分に分離するための計算手法である。各成分は、ガウス的でない信号で相互に統計的独立なものを想定する。これはブラインド信号分離の特殊な場合である。

概要

[編集 ]

独立性の仮定が正しいなら、混合信号のブラインドICA分離は非常に良い結果となる。混合信号でなくとも、分析のためにこれを行う場合もある。典型的なICAの応用として、室内で録音された複数の人間の会話から特定の人物の声を抜き出す音源分離がある。一般に遅延や反響がないと仮定することで問題が単純化される。考慮すべき重要な点として、N個の信号源があるとき、個々を分離するには少なくともN個の観測装置(マイクロフォンなど)が必要となる。

この統計的手法は、予測される成分の統計的独立性を最大化するようにその独立成分(ファクター、潜在変数、信号源など)を見つける。中心極限定理によると、非ガウス性[注釈 1] は成分の独立性を測る手法の1つである。非ガウス性は例えば、尖度ネゲントロピーの近似で測ることができる。相互情報量も信号間の独立性の尺度となる。

ICAの典型的アルゴリズムでは、複雑さを削減するために前段階として、中心化[注釈 2] 、白色化[注釈 3] 、次元削減(圧縮)[注釈 4] などを行う。白色化と次元削減は主成分分析特異値分解 [注釈 5] などによってなされる。ICAのアルゴリズムとしては、Infomax(インフォマックス)FastICA(ファストアイシーエイ)JADE(ジェイド)など様々なものがある。

ICA はブラインド信号分離で重要であり、具体的な応用がいくつもある。

数学的定義

[編集 ]

線形独立成分分析はノイズのない場合とノイズのある場合に分けられ、ノイズのない ICA はノイズのある ICA の特別な場合である。非線形 ICA はそれらとは別と考えられる。

一般的定義

[編集 ]

データは確率変数ベクトル x = ( x 1 , , x m ) {\displaystyle x=(x_{1},\ldots ,x_{m})} {\displaystyle x=(x_{1},\ldots ,x_{m})} と成分の確率変数ベクトル s = ( s 1 , , s n ) {\displaystyle s=(s_{1},\ldots ,s_{n})} {\displaystyle s=(s_{1},\ldots ,s_{n})} で表される。すべきことは、線形な統計的変換 s = W x {\displaystyle s=Wx} {\displaystyle s=Wx} を使って、観測データ x {\displaystyle x} {\displaystyle x} を独立成分 s {\displaystyle s} {\displaystyle s} に変換することである(独立性は関数 F ( s 1 , , s n ) {\displaystyle F(s_{1},\ldots ,s_{n})} {\displaystyle F(s_{1},\ldots ,s_{n})} によって表される)。

生成的モデル

[編集 ]

線形ノイズなしICA

[編集 ]

観測された確率変数ベクトル x = ( x 1 , , x m ) T {\displaystyle x=(x_{1},\ldots ,x_{m})^{T}} {\displaystyle x=(x_{1},\ldots ,x_{m})^{T}} の成分 x i {\displaystyle x_{i}} {\displaystyle x_{i}} は独立成分 s k {\displaystyle s_{k}} {\displaystyle s_{k}}, k = 1 , , n {\displaystyle k=1,\ldots ,n} {\displaystyle k=1,\ldots ,n} の次のような総和として生成される。

x i = a i , 1 s 1 + + a i , k s k + + a i , n s n {\displaystyle x_{i}=a_{i,1}s_{1}+\ldots +a_{i,k}s_{k}+\ldots +a_{i,n}s_{n}} {\displaystyle x_{i}=a_{i,1}s_{1}+\ldots +a_{i,k}s_{k}+\ldots +a_{i,n}s_{n}}

すなわち、 a i , k {\displaystyle a_{i,k}} {\displaystyle a_{i,k}} でそれぞれの独立成分に重み付けがなされている。

このモデルをベクトルとして表すと

x = k = 1 n s k a k {\displaystyle x=\sum _{k=1}^{n}s_{k}a_{k}} {\displaystyle x=\sum _{k=1}^{n}s_{k}a_{k}}

となり、観測された確率変数ベクトル x {\displaystyle x} {\displaystyle x} が基本ベクトル a k = ( a 1 , k , , a m , k ) T {\displaystyle a_{k}=(a_{1,k},\ldots ,a_{m,k})^{T}} {\displaystyle a_{k}=(a_{1,k},\ldots ,a_{m,k})^{T}} で表される。

基本ベクトル a k {\displaystyle a_{k}} {\displaystyle a_{k}} は混合行列[注釈 6] A = ( a 1 , , a n ) {\displaystyle A=(a_{1},\ldots ,a_{n})} {\displaystyle A=(a_{1},\ldots ,a_{n})} の列を形成し、生成式は x = A s {\displaystyle x=As} {\displaystyle x=As} と表され、このとき s = ( s 1 , , s n ) T {\displaystyle s=(s_{1},\ldots ,s_{n})^{T}} {\displaystyle s=(s_{1},\ldots ,s_{n})^{T}} である。

モデルと x 1 , , x N {\displaystyle x_{1},\ldots ,x_{N}} {\displaystyle x_{1},\ldots ,x_{N}} からなる確率変数ベクトル x {\displaystyle x} {\displaystyle x} の標本があるとき、混合行列 A {\displaystyle A} {\displaystyle A} と信号源 s {\displaystyle s} {\displaystyle s} を予測する作業が行われる。これは、 w {\displaystyle w} {\displaystyle w} ベクトルを順応的に計算し、計算された s k = ( w T x ) {\displaystyle s_{k}=(w^{T}*x)} {\displaystyle s_{k}=(w^{T}*x)} の非ガウス性を最大化するか、相互情報量を最小化するコスト関数を設定することでなされる。場合によっては信号源の確率分布についての事前の知識をコスト関数に利用する。

信号源 s {\displaystyle s} {\displaystyle s} は観測された信号群 x {\displaystyle x} {\displaystyle x} に混合行列の逆行列 W = A 1 {\displaystyle W=A^{-1}} {\displaystyle W=A^{-1}} (分離行列[注釈 7] をかけることで求められる。ここで、混合行列は正方行列と想定されている。

線形ノイズありICA

[編集 ]

平均がゼロとなる無相関のガウス雑音 n N ( 0 , diag ( Σ ) ) {\displaystyle n\sim N(0,\operatorname {diag} (\Sigma ))} {\displaystyle n\sim N(0,\operatorname {diag} (\Sigma ))} を仮定すると、ICAモデルは x = A s + n {\displaystyle x=As+n} {\displaystyle x=As+n} という形式になる。

非線形ICA

[編集 ]

信号源の混合は線形でなければならないわけではない。パラメータ θ {\displaystyle \theta } {\displaystyle \theta } の非線形混合関数 f ( | θ ) {\displaystyle f(\cdot |\theta )} {\displaystyle f(\cdot |\theta )} による非線形ICAモデルは x = f ( s | θ ) + n {\displaystyle x=f(s|\theta )+n} {\displaystyle x=f(s|\theta )+n} となる。

同定可能性

[編集 ]

独立成分分析の同定可能性には以下の要素が必要である。

  • 信号源のうち高々1つだけ( s k {\displaystyle s_{k}} {\displaystyle s_{k}})がガウス雑音である。
  • 混合信号の観測数 m {\displaystyle m} {\displaystyle m} と予測される信号源の数 n {\displaystyle n} {\displaystyle n} について、 m n {\displaystyle m\geq n} {\displaystyle m\geq n} でなければならない。
  • 混合行列 A {\displaystyle A} {\displaystyle A}行列の階数は最大でなければならない。

脚注

[編集 ]

注釈

[編集 ]
  1. ^ : non-Gaussianity
  2. ^ : centering
  3. ^ : whitening
  4. ^ : dimensionality reduction
  5. ^ : singular value decomposition
  6. ^ : mixing matrix
  7. ^ : demixing matrixseparating matrix

参考文献

[編集 ]
  • 村田昇:『入門 独立成分分析』、東京電機大学出版局、ISBN 4-501-53750-7 (2004年7月10日).
  • Aapo Hyvärien, Juha Karhunen:『詳解 独立成分分析:信号解析の新しい世界』、東京電機大学出版局、ISBN 978-4-501-53860-6(2005年2月10日).

関連項目

[編集 ]

外部リンク

[編集 ]
標本調査
記述統計学
連続データ
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
相関係数
その他
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定 (英語版)
その他
統計図表
生存時間分析
歴史
応用
出版物
全般
その他
カテゴリ カテゴリ

AltStyle によって変換されたページ (->オリジナル) /