コルモゴロフ–スミルノフ検定

コルモゴロフ–スミルノフ検定(コルモゴロフ–スミルノフけんてい、英: Kolmogorov–Smirnov test)は統計学における仮説検定の一種であり、有限個の標本に基づいて、二つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる。しばしばKS検定と略される。

1標本KS検定は、経験分布を帰無仮説において示された累積分布関数と比較する。主な応用は、正規分布および一様分布に関する適合度検定である。正規分布に関する検定については、リリフォースによる若干の改良が知られている(リリフォース検定)。正規分布の場合、一般にはリリフォース検定よりもシャピロ-ウィルク検定やアンダーソン-ダーリング検定の方がより強力な手法である。

2標本KS検定は、二つの標本を比較する最も有効かつ一般的なノンパラメトリック手法の一つである。これは、この手法が二つの標本に関する経験分布の位置および形状の双方に依存するためである。

検定統計量

[編集 ]

経験分布(青)と累積分布(赤)の例。検定統計量はこれらの「ズレ」を測っている。

n個の標本y₁, y₂, ..., y_nに対する経験分布 F_nは以下のように与えられる。

F_{n}(x)={\frac {\#\{,1円\leq i\leq n\mid y_{i}\leq x,円\}}{n}}

{\displaystyle F_{n}(x)={\frac {\#\{,1円\leq i\leq n\mid y_{i}\leq x,円\}}{n}}}

このとき F(x) を帰無仮説で提示される分布、またはもう一方の経験分布とすると、二つの片側KS検定統計量は、以下で与えられる^[1]。

D_{n}^{+}=\sup _{x}(F_{n}(x)-F(x))

{\displaystyle D_{n}^{+}=\sup _{x}(F_{n}(x)-F(x))}

D_{n}^{-}=\sup _{x}(F(x)-F_{n}(x))

{\displaystyle D_{n}^{-}=\sup _{x}(F(x)-F_{n}(x))}

二つの分布が等しいという帰無仮説が棄却されないと仮定する場合、上記の二つの統計量が従うべき確率分布は、仮説で提示される分布が連続分布である限りにおいて、分布の形に依存しない。

クヌースはこの1対の統計量に関する有意性を解析する方法に関する詳細な記述を与えている。多くの人々は2つの統計量の代わりに

D_{n}=\sup _{x}\vert F_{n}(x)-F(x)\vert =\max(D_{n}^{+},D_{n}^{-})

{\displaystyle D_{n}=\sup _{x}\vert F_{n}(x)-F(x)\vert =\max(D_{n}^{+},D_{n}^{-})}

という統計量を用いるが、この統計量の分布はさらに扱いにくい。

有意確率

[編集 ]

1標本KS検定では、サンプル数nが十分大きいとき、経験分布F_n(x)が帰無仮説に従う(すなわち、経験分布が帰無仮説で提示された分布F(x)と一致する)と仮定した下での場合の検定量の分布は

\operatorname {Prob} ({\sqrt {n}}D_{n}\leq x)=1-2\sum _{i=1}^{\infty }(-1)^{i-1}e^{-2i^{2}x^{2}}={\frac {\sqrt {2\pi }}{x}}\sum _{i=1}^{\infty }e^{-(2i-1)^{2}\pi ^{2}/(8x^{2})}

{\displaystyle \operatorname {Prob} ({\sqrt {n}}D_{n}\leq x)=1-2\sum _{i=1}^{\infty }(-1)^{i-1}e^{-2i^{2}x^{2}}={\frac {\sqrt {2\pi }}{x}}\sum _{i=1}^{\infty }e^{-(2i-1)^{2}\pi ^{2}/(8x^{2})}}

で与えられる。したがって、有意水準を $\alpha$ {\displaystyle \alpha }とするとき、検定量D_nが ${\sqrt {n}}D_{n}>K_{\alpha }$ {\displaystyle {\sqrt {n}}D_{n}>K_{\alpha }}(ただし $K_{\alpha }$ {\displaystyle K_{\alpha }}は $\operatorname {Prob} ({\sqrt {n}}D_{n}\leq K_{\alpha })=1-\alpha .,円$ {\displaystyle \operatorname {Prob} ({\sqrt {n}}D_{n}\leq K_{\alpha })=1-\alpha .,円}を満たす数)を満たすとき、帰無仮説は棄却され、経験分布F_n(x)は帰無仮説で提示された分布F(x)とは異なることが示唆される。

その他

[編集 ]

1年のうちの1日や、あるいは1週間のうちの1日といったように、独立変数が周期性を持つ場合、カイパー検定の方がより適切である。数値解析の有名な著作である"Numerical Recipes"には、このことに関する詳しい情報が記載されている^[2]。

さらに、コルモゴロフ-スミルノフ検定は分布の裾の部分よりも中央値付近の方に強く依存する。これに対して、アンダーソン-ダーリング検定は裾でも中央値付近でも等しい感度を与える。

脚注

[編集 ]

^ Durbin 1973, p. 6 .
^ Press et al. 1983.

参考文献

[編集 ]

William H.Press, William T. Vetterling, Saul A. Teukolsky, Brian P. Flannery 著、丹慶勝市・奥村晴彦・佐藤俊郎・小林誠訳『ニューメリカルレシピ・イン・シー日本語版―C言語による数値計算のレシピ』(1版)技術評論社、1993年。ISBN 978-4874085608。
Durbin, J. (1973). Distribution theory for tests based on the sample distribution function. Society for Industrial and Applied Mathematics. ISBN 978-0-89871-007-6. MR 0305507 . https://books.google.co.jp/books?id=zAryCrT1IUYC

外部リンク

[編集 ]

分位数の表 — Pestman, Wiebe R. (2009). Mathematical statistics. de Gruyter Textbook (Second ed.). Walter de Gruyter. ISBN 978-3-11-020852-8. MR 2516478. Zbl 1251.62001 . https://books.google.co.jp/books?id=9QHcJ8WQQ5UC

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック–ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

相関係数	ピアソンの積率相関係数スピアマンの順位相関係数ケンドールの順位相関係数偏相関係数
その他	自己相関空間的自己相関相互相関交絡変数相関関係と因果関係擬似相関錯誤相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法回帰木ランダムフォレストニューラルネットワークサポートベクター回帰射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法(k-means++法) DBSCAN
密度推定 (英語版)	カーネル密度推定(カーネル)
その他	主成分分析独立成分分析自己組織化写像