2項分布

二項分布
	確率質量関数;
	累積分布関数; ; 色は上図と同じ
母数	試行回数(整数); 成功確率(実数)
台
確率質量関数
累積分布関数
期待値
最頻値
分散
歪度
尖度
モーメント母関数
特性関数
	テンプレートを表示

Wikipedia preview

出典(authority):フリー百科事典『ウィキペディア（Wikipedia）』「2016/04/27 11:08:05」(JST)

wiki ja

[Wiki ja表示]

数学において、二項分布（にこうぶんぷ）は、結果が成功か失敗のいずれかである n 回の独立な試行を行ったときの成功数で表される離散確率分布である。各試行における成功確率 p は一定であり、このような試行を、ベルヌーイ試行と呼ぶ。二項分布に基づく統計的有意性の検定は、二項検定と呼ばれている。

例

二項分布の典型例を次に示す。全住民の5%がある感染症に罹患しており、その全住民の中から無作為に500人を抽出する。ただし住民は500人よりずっと多いとする。このとき、抽出された集団の中に罹患者が30人以上いる確率はどれくらいか。抽出された集団の中に含まれる罹患者数を確率変数 X で表すとき、X は n = 500、p = 0.05 の二項分布に近似的に従う。ここで、求める確率は Pr[X ≥ 30] である。

定義

パラメータp（ただし）ならび自然数のパラメータnに対して、自然数を値としてとる確率変数Xが

を満たすとき、確率変数Xはパラメータ n、p の二項分布B(n, p)に従うという。確率変数 X が二項分布 B(n, p)に従うとき、X ~ B(n, p) と表記する。

ここで、

は n 個から k 個を選ぶ組合せの数、すなわち二項係数を表す。二項分布という名前は、この二項係数に由来している。n = 1 の場合を特に、ベルヌーイ分布と呼ぶ。

この公式は、次のように解釈することができる。一回の試行において成功する確率がpであるとき、p^k の項は k 回成功する確率を表し、(1 − p)^{n − k}の項は n − k 回失敗する確率を表している。ただし、k 回の成功は n 回の試行の中のどこかで発生したものであるから、C(n, k) 通りの発生順序がある。したがって、n 回の独立な試行を行ったときの成功回数がkとなる確率を意味する。

性質

期待値・分散

B(n, p)にしたがう確率変数X に対し、X の期待値E[X]は

であり、分散Var[X]は

となる。

X の最頻値は、(n+1)p 以下の最大の整数によって与えられる。ただし、m = (n+1)p において m が整数である場合、m − 1 と m の双方が最頻値となる。

再生性

二項分布は再生性を有する。すなわち B(n, p) に従う確率変数X、と B(m, p)に従う確率変数Y が互いに独立であるとき、確率変数の和X + Y は二項分布B(n+m, p)に従う。

近似

二項分布の近似として、次の2種類の分布が知られている。

正規分布

期待値np および分散np(1 − p) が5よりも大きい場合、二項分布B(n, p)に対する良好な近似として正規分布がある。但し、この近似を適用するにあたっては、変数のスケールに注意し、連続な分布への適切な処理がなされる必要がある。より厳密に述べれば、nが十分大きくかつ、期待値np および分散np(1 − p) も十分大きい場合、期待値np 、分散np(1 − p)の正規分布N(np,np(1 − p))で近似することができ、期待値からの差|k-np|が標準偏差(np(1 − p))^1/2と同程度となるkに対して

が漸近的に成り立つ。二項分布が一定の条件下で正規分布に近づく、この近似式は数学者アブラーム・ド・モアブルが1733年に著書 The Doctrine of Chances の中で紹介したのが最初であり、ド・モアブル=ラプラスの極限定理またはラプラスの定理と呼ぶことがある^[1] 。これは、今日でいうところの中心極限定理の特別な場合に相当する。この正規分布による近似を用いることにより、計算の労力を大きく削減することができる。

例えば、多数の住民の中から n 人を無作為に抽出し、ある質問について同意するかどうかを尋ねる場合を考える。同意する人数の割合は、もちろんサンプルに依存する。n 人を無作為に抽出する作業を何度も繰り返し行うとき、同意する人々の割合の分布は、実際の全住民の合意割合 p とほぼ等しい平均を持ち、標準偏差 σ = (p(1 − p)/n)^1/2 である正規分布に近似される。未知の変数 p は、標準偏差が小さいほど正確な推定が可能である。そのため、抽出する人数 n は多い方が好ましい。

95%信頼区間ならば、正規分布で近似すると、その範囲は、

となる。たとえば、p = 50%の場合、n = 100なら40%〜60%、n = 1,000ならば47%〜53%、n = 10,000ならば49%〜51%となる。n = 10の場合、正規分布近似ではなく、本来の定義に従って計算すると、89%信頼区間で、30%〜70%となる^[2]。

ポアソン分布

n が大きく p が十分小さい場合、np は適度な大きさとなるため、パラメータ λ = np であるポアソン分布が二項分布B(n, p) の良好な近似を与える。すなわち、期待値λ = npを一定とし、nを十分大きくしたとき、

が成り立つ（詳細はポアソン分布の項を参照）。この結果は数学者シメオン・ドニ・ポアソンが1837年に著書 Recherches sur la probabilite des jugements (Researches on the Probabilities) の中で与えており、ポアソンの極限定理と呼ばれる。

参照

^ 伏見康治「確率論及統計論」第IV章　独立偶然量の和　27節 Bernoulliの定理, Laplaceの定理 p.452 ISBN 9784874720127 http://ebsa.ism.ac.jp/ebooks/ebook/204
^ prob 3 <= x <= 7 for x binomial with n=10 and p=0.5 - Wolfram Alpha

UpToDate Contents

全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.

1. 平均赤血球容積 mean corpuscular volume
2. 自動血液分析装置 automated hematology instrumentation
3. 小児の身体組成測定 measurement of body composition in children
4. 肥満の病因 pathogenesis of obesity
5. 血液透析における水の浄化システム water purification systems in hemodialysis

Japanese Journal

平成23年度における被爆者大腸癌-広島原爆健康管理・増進センターにおける症例-

川西昌弘,平野雅俊 [他]
長崎醫學會雜誌 : Nagasaki Igakkai zasshi 87(特集), 216-219, 2012-09-25
… 集計や統計処理は「R」3)を用い,2項分布の95%信頼限界,Fisher's Exact Methodおよび一般化線形モデル(Logisticモデル)を用い,p\<0<Oh>.05を有意と判断した. …
NAID 110009517212

多群の2項モデルとポアソンモデルにおけるすべてのパラメータの多重比較法

白石高章
日本統計学会誌 42(1), 55-90, 2012-09-00
NAID 40019461498

Related Pictures

二項分布繰り返し行われる分布は 2 項分布に近づく二項分布がポアソン分布に図 3-3 二項分布 (p=0.5, n=10) 項分布ちなみに二項分布考えられる負の二項分布を 2項分布パチンコなお 2 項分布について

[1] 伏見康治「確率論及統計論」第IV章　独立偶然量の和　27節 Bernoulliの定理, Laplaceの定理 p.452 ISBN 9784874720127 http://ebsa.ism.ac.jp/ebooks/ebook/204

[2] rob 3 <= x <= 7 for x binomial with n=10 and p=0.5 - Wolfram Alpha

匿名

検索

案内

案内