出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2014/07/22 19:16:28」(JST)
t検定(ティーけんてい)とは、帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学的検定法の総称である。母集団が正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接、もとの平均や標準偏差にはよらない(ただし自由度による)ことを利用している。2組の標本について平均に有意差があるかどうかの検定などに用いられる。統計的仮説検定の一つ。
スチューデントのt検定(Student's t-test)とも呼ばれるが、これは統計学者のウィリアム・ゴセットが雇用者であるギネスビール社に本名使用を許されずStudent というペンネームで最初の論文を発表した(1908年)ためである。
t検定は大きく次のように分けられる。
母集団の平均値μが特定の値である μ0と等しいかどうかの帰無仮説を検定する際に使用する。
は標本平均であり sは 標本の標準偏差 である。標本サイズは nであり、t検定における自由度はn − 1である。
次のような回帰分析のモデルを考える。
xi, i = 1, ..., nは既存の説明変数であり、 α と βは未知の係数である。そして εiは独立に同一の正規分布に従った期待値0で未知の分散σ2であるランダムな誤差とする。 Yi, i = 1, ..., nは観測値である。この際、 βがある特定の値β0と等しいかどうかをテストしたい (多くの場合β0は 0である。何故なら、βが0であればx と y に相関性が無いと言う事になり、0以外の値であればx と y は相関しているということになる)。
すると
帰無仮説が正しければ、この数値はt値の自由度がn − 2に従う。
すると は
一つ目の母集団の平均値μ1が二つ目の母集団の平均値μ2と等しいかどうかの帰無仮説を検定する際に使用する。言い換えるとμ1-μ2=0かどうかの帰無仮説を検定する。
実務的なデータ分析では、母集団が様々な前提を満たしているかどうかを調べるため、以下のような検定をt検定の前段階に行う場合がある。
比較する両群をX1, ..., XmおよびY1, ..., Yn(標本サイズはmおよびn)とする。両群から標本平均および、ならびに不偏分散およびを求める。 両群を合わせた分散の推定値を
により算出する。
これから検定統計量t0 を
により算出する。 両群の平均が等しい場合には「統計量T は自由度ν = m + n – 2 のt分布に従う」ので、これを帰無仮説として両側検定を行う。 このt分布におけるの上側のp値を求め、有意水準αと比較する(あるいは数表で比較を行う)。p < α ならば帰無仮説は棄却され、「両群の平均には有意差がある」といえる。
詳細は「ウェルチのt検定」を参照
前と同じ標本(ただし分散が等しくない)を対象とする。
検定統計量t0 を
により算出する。 t分布の自由度νは、
であるが、これは整数になるとは限らないので、10未満の場合は小数自由度のt分布表を利用する。10以上ならば小数部を切り捨て整数部のみを使用してよい。
n 対のデータがあるとし、対応する2変数をXi とYi 、両者の差をdi = Xi - Yi とする(i = 1, 2, ... , n)。di の平均をとする。差の母集団の平均値μdが特定の値である μ0と等しいかどうかの帰無仮説を検定する際に使用する。
検定統計量 t0 を
により算出する。 t分布の自由度はν = n -1となる。
t検定は、母集団が正規分布をしており標本の分散がχ2 分布をしているという前提の下において、「完全に」正確な確率を計算することができる(ウェルチ検定では「ほぼ」正確な値を計算できる)。逆の言い方をすると、母集団が正規分布に従っていない場合は、標本平均はt値からは多かれ少なかれ乖離する。実務的に標本から母集団が正規分布をしているかどうかという事を判断する事は、色々な検定方法があるとは言うものの、非常に困難である。ただし、中心極限定理によると、母集団の分布が正規分布に従わない標本でさえも、サンプル数が多くなればなるほど、標本平均は正規分布に近似していく。したがって、標本サイズが多ければ多いほど、標準検定値であるはZ値に近似することになる。このような基礎に基づくと、母集団が正規分布から完全に逸脱した分布に従っていて、標本サイズが十分に大きな場合(大学の初等の統計の教科書などではn>30などと載っている場合があるが、勿論多ければ多いほど良い)、Z検定で近似的な確率を計算できる。ただしt値は自由度が上がるとZ値に近似するため、計算上はt検定を用いても殆ど大差ない結果を得られる(哲学的には異なるが)。それがt検定が頑強(robust)であると言われる所以である。
t検定は母集団の正規分布を前提とするパラメトリック検定であるが、この条件が満たされず、さらに標本サイズが小さいと、t検定で近似することも困難となる。そういった場合にはノンパラメトリック検定を用いる方法がある。ノンパラメトリック検定は汎用性を重視し、効率性を犠牲にしているというものの、場合によっては統計のパワー(1 − β)がt検定に比べてはるかに高い。
を用いることができる。ただしt検定やZ検定が母集団の平均値に注目して仮説を立てるのに対して、ノンパラメトリック検定ではランキング、中央値や分布などに注目して仮説を立てることに注意が必要。
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
リンク元 | 「Student t-test」 |
関連記事 | 「検定」「t検定」「ting」「T」「スチューデント」 |
.