出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2015/08/08 09:50:53」(JST)
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(2013年5月) |
仮説検定(かせつけんてい、英: hypothesis testing)[1]とは、ある仮説が正しいといってよいかどうかを統計学的・確率論的に判断するための方法を言う。
仮説検定の手法は、ネイマン=ピアソン流の仮説検定である統計的仮説検定(statistical hypothesis testing)とベイズ流の仮説検定の二つに大きく分けられる[2]が、基本的に「仮説検定」という場合、統計的仮説検定のことを指していることが多い。
統計的仮説検定においては、仮説が正しいと仮定した上で、それに従う母集団から、実際に観察された標本が抽出される確率を求め、その値により判断を行う。その確率が十分に(予め決めておいた値より)小さければ、「仮説は成り立ちそうもない」と判断できる。(なお本項で述べるのは従来の頻度主義統計学の考え方であって、ベイズ主義では考え方が異なる)
統計的仮説検定は次のような手順で実施する。
仮説が正しいと仮定した場合にその標本が観察される確率を算出できるように、仮説を統計学的に表現する。 たとえば薬の試験(薬の効果を主張できることを示したい)を例にとれば、帰無仮説(きむかせつ Null hypothesis)(証明したい仮説の反対の仮説。この場合は、「主張できない」)は
「薬に対する反応の平均がプラセボに対する反応の平均と等しい。どちらの反応も正規分布に従うがその標準偏差は両者で等しく、平均を問題とする」
という仮説を立てる。この仮説は最終的に棄却(間違っていたという判断)されるべきものなので、帰無仮説と呼ばれ、普通 H0 と書く。また帰無仮説に対立する仮説(対立仮説(たいりつかせつ Alternative hypothesis): H1 )を立てることも多い。上の例では対立仮説は「薬に対する反応の平均がプラセボに対するそれと異なる」ということになる。
標本データから、仮説に関係した情報を要約する検定統計量を計算する。下記のように十分性を持つ統計量(十分統計量)が存在すればそれを計算する。
母数に対応する十分統計量は、母集団の確率分布が指数型分布族である場合にのみ存在する。例で言えば、指数型分布族で、二つの標本平均の差m1 − m2は十分統計量である。
仮説に基づき、検定統計量の確率分布を明らかにする。
例では、標本平均の差は正規分布に従い、その標準偏差は母標準偏差に をかけたもの(ここで n1 と n2 は各標本のサイズ)である。
可能な全ての値の集合の中で、仮説に反する極端な範囲(分布関数をグラフ表示した場合には、裾に当たる部分)を選ぶ。これは検定統計量の危険域(Critical region)と呼ばれる。仮説が正しい場合に検定統計量が危険域内に入る確率を検定の危険率(有意水準あるいは検定のサイズともいい、ふつうαと表す)と呼ぶ。危険率として具体的には0.05(5%)、0.01(1%)などを用いることが多い。
仮説が例のように「平均が等しい」と主張するタイプであれば、分布関数の裾として左右両側を用いる(両側検定)。また「・・・の方が平均が大きい(小さい)ということはない」と主張するタイプであれば、片側の裾だけを用いる(片側検定)。検定の種類によっては両側検定または片側検定のみということもある。
データから算出した検定統計量が危険域内にあるかどうかを判定する。
通常は統計量が仮定した分布の中で、算出した検定統計量と同じかそれよりも極端な(仮説に反する)値となる確率(これをp値という)を数表などにより求め、これとαとを比較し、p < αならば危険域の内部にあると判断する。 検定統計量が危険域内にあれば、結論は
か、さもなくば
のいずれかになる。 この場合をα水準で統計学的に有意であるという。例では「薬に対して観察された反応はα水準で統計学的に有意である」といえる。分かりやすくいえば、「仮説の下でこのようなことは偶然に起こりそうもないが、ごく小さい確率αで起こり得る」ということである。
一方、検定統計量が危険域の外側にあれば、
統計学の目的は(当然であるが)科学的な真理を明らかにすることではなく、数学的な誤謬をできるだけ減らすことにある。
例のように、母集団の分布として正規分布を、あるいは比較する2群間の等分散(標準偏差が等しい)を仮定する(母数=パラメータを仮定する)検定法をパラメトリックParametric、それらを仮定せず一般の分布に適用できる検定法をノン・パラメトリックNon-parametricな検定と呼ぶ。具体的な方法の例を挙げる。
検定の目的からは、母数の有意性の検定、適合度検定(特定の母集団から抽出されたものか)、均一性検定(2標本が同一母集団によるものか:上の例)、独立性検定(2標本が独立か)などに分けられる。
|
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
拡張検索 | 「統計的仮説検定」 |
関連記事 | 「検定」「仮説」 |
.