標本 (統計学)
- Afrikaans
- Alemannisch
- العربية
- Betawi
- Català
- Čeština
- Чӑвашла
- Cymraeg
- Dansk
- Deutsch
- Ελληνικά
- English
- Esperanto
- Español
- Eesti
- Euskara
- فارسی
- Suomi
- Français
- Galego
- עברית
- हिन्दी
- Magyar
- Bahasa Indonesia
- Íslenska
- Italiano
- Jawa
- Қазақша
- 한국어
- Lietuvių
- Македонски
- Bahasa Melayu
- Nederlands
- Norsk bokmål
- Polski
- Português
- Русский
- Simple English
- Slovenščina
- Shqip
- Sunda
- Svenska
- தமிழ்
- Українська
- Tiếng Việt
- 吴语
- 中文
- 閩南語 / Bân-lâm-gí
- 粵語
- 英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。
- 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。
- 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。
- 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。
- 翻訳後、
{{翻訳告知|en|Sampling (statistics)|...}}をノートに追加することもできます。 - Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があります。
統計学における標本(ひょうほん、英: sample)とは、母集団の部分集合を言う。推測統計学においては、標本と母集団は明確に区別される[注釈 1] 。
概要
[編集 ]母集団を完全に調査するのは不可能な場合、標本から母集団の特性を推定する必要がある。この標本抽出には作為抽出法と無作為抽出法の2つの抽出方法がある。統計学では無作為抽出法だけを議論するわけではない。無作為抽出法では、母集団のどの要素も等しい確率で標本に選ぶことが必要である。しかし、実際に母集団がわかっていない状態で、抽出した方法が無作為であることを保証できない。そのため、理想的には無作為抽出を仮定するものの、抽出方法の妥当性を確認する必要があり、統計学の対象を無作為抽出に限定することは不可能である。
また統計学的推定(標本から母集団の性質を推定する)を行うには、各標本に対し、それを選抜する確率を知る必要がある。このために様々な標本抽出法が開発されている。例えば異なる標本を選抜する確率がすべて同じならば、その抽出法を単純ランダム(無作為)抽出という。
日本工業規格では、標本(sample)を一つ以上の抽出単位からなる母集団の部分集合と定義している[1] 。
母集団を表現する数値を母数 というのに対し、標本を表現する数値を統計量 という。統計量は標本から算出できる数値である。また統計量で特に母数を推定するために用いるものを推定量という。
形式的定義
[編集 ]母集団分布を F とするとき、母集団から抽出された(無作為)標本 (random sample) とは分布 F に従う独立同分布 確率変数列 x1, x2, ..., xn のことである。この確率変数列の長さn を標本のサイズ(サンプルサイズ)という。とりうる標本の全体が成す集合 Ω, 確率を定めうる集合の全体 M (⊂ 2^Ω), 分布を表す確率測度 P からなる確率空間 (Ω, M, P) を標本空間という。
例えば母集団の分布 F が母平均 E[X] = m, 母分散 V[X] = σ2 を持つならば、標本 x1, x2, ... は i を任意の番号として平均 E[xi] = m, 分散 V[xi] = σ2 を満たす。
標本から適当な操作を行って新たに作り出される確率変数を統計量と呼ぶ。統計量は(同じ量でも)標本の採り方に依存して定まり、一般に母集団の分布とは異なる分布に従う。統計量の従う分布を標本分布と呼ぶ。
例えば標本 x = (x1, x2, ..., xn) に対し、その平均
- {\displaystyle {\bar {\mathbf {x} }}:={\frac {x_{1}+x_{2}+\cdots +x_{n}}{n}}}
を取る操作を考えるとき、x の標本 x の取り方をさまざまに考えるものとして得られる確率変数は統計量である。この統計量は標本平均と呼ばれ、X などで表す。母集団の分布 F が母平均 E[X] = m, 母分散 V[X] = σ2 を持つならば、標本平均 X の従う標本分布について、平均 E[X] = m, 分散 V[X] = σ2/n を得る。
注釈
[編集 ]出典
[編集 ]- ^ JIS Z 8101-1 : 2015, 1.3 標本.
参考文献
[編集 ]- 蓑谷 千凰彦『統計学のはなし』東京図書、1987年。
- 蓑谷 千凰彦『推定と検定のはなし』東京図書、1988年。
- 蓑谷 千凰彦『統計学入門』 1巻、東京図書、1994年。
- 日本数学会『数学辞典』岩波書店、2007年。ISBN 9784000803090。
- JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (2015)