- 英
- χ2 test, chi-squared test
- 同
- χ2テスト、カイ二乗検定
- 関
- χ2分布、検定、t検定
参考
- http://ja.wikipedia.org/wiki/%CE%A72%E6%A4%9C%E5%AE%9A
Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2016/12/23 07:43:09」(JST)
[Wiki ja表示]
カイ二乗検定(カイにじょうけんてい、カイじじょうけんてい、英: Chi-squared test)、または検定とは、帰無仮説が正しければ検定統計量が漸近的にカイ二乗分布に従うような統計学的検定法の総称である。次のようなものを含む。
- ピアソンのカイ二乗検定:カイ二乗検定として最もよく利用されるものである(本項で述べる)。
- 一部の尤度比検定:標本サイズが大きい場合には近似的にカイ二乗検定となる場合がある。
- イェイツのカイ二乗検定(イェイツの修正)
- マンテル・ヘンツェルのカイ二乗検定
- 累積カイ二乗検定
- Linear-by-linear連関カイ二乗検定
これらはいずれも
(ここで"expected" という語は期待値そのものではなく観測値から求められる期待値の推定量あるいは理論値を指すことが多い)
という形の統計量「カイ二乗(χ2)」を含む。
日本工業規格では、「検定統計量が,帰無仮説の下でχ2分布に従うことを仮定して行う統計的検定。」と定義している[1] 。
目次
- 1 ピアソンのカイ二乗検定
- 2 脚注
- 3 参考文献
- 4 関連項目
- 5 外部リンク
ピアソンのカイ二乗検定
ピアソンのカイ二乗検定(Pearson's chi-square test)は、カイ二乗検定のうち最も基本的かつ広く用いられる方法であって、「観察された事象の相対的頻度がある頻度分布に従う」という帰無仮説を検定するものである[2]。この頻度分布は特定のものに限らない。すなわちこの方法はノンパラメトリック検定である。
事象は互いに排他的でなければならない(例えば「さいころの目」、「ある人が男か女か」など)。カイ二乗は各頻度の観測値と理論値の差を2乗し、各頻度の理論値で割って、合計したもの:
である。ただしここでO = 頻度の観測値,E = 帰無仮説から導かれる頻度の期待値(理論値)である。
ピアソンのカイ二乗検定は2つのタイプの比較、適合度検定及び独立性検定に用いられる:
適合度検定
観測された度数分布が理論分布と同じかどうかを検定する。例えば簡単な例として、標本として100人の人がいる場合に、「男と女が同数だけいる集団から、ランダムに抽出された100人である」という仮説を検定するには、男女の人数の観測度数と期待度数とを比較すればよい。観測値が男45人、女55人ならば、
i |
属性 Si |
観測度数 νi |
期待確率 pi |
期待度数 npi |
(νi − npi)2/npi |
1 |
男性 |
45 |
1/2 |
50 |
25/50 |
2 |
女性 |
55 |
1/2 |
50 |
25/50 |
計 |
|
n = 100 |
1 |
100 |
χ2 = 1 |
この場合の自由度は1である(2つの観測値と理論値の差は、一方を決めると他方も自動的に決まるから)。そこで自由度1のカイ二乗分布を見ると、男女の人数が等しい場合にこのような差(及び女がさらに多くなるような場合)が見出される確率は、おおよそ0.32である。この確率は普通用いる統計学的有意水準( α = 0.05, 0.01など)よりも高いから、「男女の人数が等しい」とする帰無仮説を棄却する理由がない。
またカイ二乗分布で十分近似できるのは、実際的な問題として期待度数が条件 npi ≥ 10 をすべての属性に対して満たすときとされている。
独立性検定
2つの変数に対する2つの観察(2x2分割表で表される)が互いに独立かどうかを検定する。例えば、「別の地域の人々について、選挙である候補を支持する頻度が違う」かどうかを検定する方法である。
カイ二乗の計算値は、確率分布が二項分布あるいは正規分布に従う集団に関しては正確にカイ二乗分布に従う。
期待値が二項分布:
(ただしここで、p = 帰無仮説の下での確率,n = 標本の観測値) に従う場合、カイ二乗は自由度1のカイ二乗分布に従う。なおこの二項分布は標本数が大きい場合には次のような正規分布で近似できる:
標準正規分布に従う個の変数から、各二乗の合計を求めると、自由度のカイ二乗分布:
に従う。
しかし一般の頻度分布でもカイ二乗は「近似的には」カイ二乗分布に従うので、カイ二乗検定が適用可能である。期待値Eが小さい(標本数が小さい、または観測数が少ない)場合は、二項分布を正規分布ではうまく近似できないため、この場合には尤度比検定の1つであるG検定を用いるのがより適切である。全標本数が小さい場合は、二項検定、さらに2x2分割表で表される場合にはフィッシャーの正確確率検定を用いる必要がある。
脚注
- ^ JIS Z 8101-1 : 1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語 2.60 カイ二乗検定, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html
- ^ 伏見康治「確率論及統計論」第 VII 章 確率と統計 65節. χ² - 検定法 p.373
参考文献
- Cramér, Harald (1999) [1946]. Mathematical methods of statistics. Princeton Landmarks in Mathematics. Princeton University Press. ISBN 0-691-00547-8. MR 1816288. Zbl 0985.62001. //books.google.com/books?id=CRTKKaJO0DYC.
- 西岡康夫 『数学チュートリアル やさしく語る 確率統計』 オーム社、2013年。ISBN 9784274214073。
- 伏見康治 『確率論及統計論』 河出書房、1942年。ISBN 9784874720127。
- 日本数学会 『数学辞典』 岩波書店、2007年。ISBN 9784000803090。
- JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, http://kikakurui.com/z8/Z8101-1-1999-01.html
関連項目
外部リンク
- カイ二乗分布表 — 脇本和昌 『身近なデータによる統計解析入門』 森北出版、1973年。ISBN 4627090307。 付表
統計学 |
標本調査 |
|
要約統計量 |
|
統計的推測 |
仮説検定 |
- 帰無仮説
- 対立仮説
- 有意
- 棄却
- ノンパラメトリック手法
- スチューデントのt検定
- ウェルチのt検定
- カイ二乗検定
- イェイツのカイ二乗検定
- 累積カイ二乗検定
- F検定
- G検定
- マン・ホイットニーのU検定
- Z検定
- フィッシャーの正確確率検定
- 二項検定
- 尤度比検定
- マンテル検定
- コクラン・マンテル・ヘンツェルの統計量
- ウィルコクソンの符号順位検定
- アンダーソン–ダーリング検定
- カイパー検定
- ジャック–ベラ検定
- シャピロ–ウィルク検定
- コルモゴロフ–スミルノフ検定
- 分散分析
- 共分散分析
|
区間推定 |
|
その他 |
- 最尤推定
- ベイズ推定
- 尤度関数
- カーネル密度推定
- 最小距離推定
- メタアナリシス
|
|
生存時間分析 |
- 生存時間関数
- カプラン=マイヤー推定量
- ログランク検定
- 故障率
- 比例ハザードモデル
|
相関 |
- 交絡変数
- ピアソンの積率相関係数
- 順位相関
- スピアマンの順位相関係数
- ケンドールの順位相関係数
|
モデル |
- 一般線形モデル
- 一般化線形モデル
- 混合モデル
- 一般化線形混合モデル
|
回帰 |
線形 |
- 線形回帰
- リッジ回帰
- Lasso
- エラスティックネット
|
非線形 |
- k近傍法
- 回帰木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクター回帰
- 射影追跡回帰
|
|
分類 |
線形 |
- 線形判別分析
- ロジスティック回帰
- 単純ベイズ分類器
- 単純パーセプトロン
- 線形サポートベクターマシン
|
二次 |
|
非線形 |
- k近傍法
- 決定木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクターマシン
- ベイジアンネットワーク
- 隠れマルコフモデル
|
その他 |
|
|
教師なし学習 |
|
統計図表 |
- 棒グラフ
- バイプロット
- 箱ひげ図
- 管理図
- 森林プロット
- ヒストグラム
- Q-Q プロット
- ランチャート
- 散布図
- 幹葉図
|
歴史 |
|
応用 |
- 社会統計学
- 生物統計学
- 統計力学
- 計量経済学
- 機械学習
- 実験計画法
|
出版物 |
|
カテゴリ |
|
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
Japanese Journal
- 地域在住老年者の生活状況の変化に関する調査研究 : 朝食を摂ることの変化に焦点を当てて
- 帰属スタイルが小学5年生のレジリエンスに及ぼす影響
- 医療現場に役立つ 実践!生物統計学(第4回)薬剤間の有効性を比較するときに用いられるχ²検定およびFisherの正確検定を理解しよう
Related Links
- ... 検定 の内容に応じてこのχ 2 値をχ 2 表と見比べて判断する.(この例では ... 100 期待度数 よい 普通 悪い 計 男子 14 27 11 54 女子 12 23 10 46 計 27 51 22 100 χ2 0.286 0.333 0.091 0. ...
- χ 2 検定1(独立した2変数の場合) 2変数の独立性の検定。使用する変数は2つとも名義または順序尺度が適当です。 χ 2 検定(カイ2乗検定)とは 2つの変数を集計する場合に、クロス集計表を用いることがあります。
Related Pictures
★リンクテーブル★
[★]
- 英
- t test, t-test
- 同
- スチューデントのt検定 Student t-test
- 関
- 検定、χ2検定
- 2つの母集団がいずれも正規分布に従うと仮定した上での、平均が等しいかどうかの検定。(参考1)
参考
- http://ja.wikipedia.org/wiki/t%E6%A4%9C%E5%AE%9A
[★]
- 英
- assay、test、assay、test
- 関
- アッセイ、検査、検定法、試験、試験法、測定法、定量、テスト、分析、アッセイ法
- 母数についてある特定の家庭を設定し、その仮定が正しいかどうかについて統計学的に伴ダンスrための手法である。設定した帰無仮説の下で、ある特定の統計量が得られる確率を求める。その検定により得られた確率(p値)がある基準(有意水準)より小さければ、母数に関する帰無仮説が間違っている可能性が高い(有意差がある)と判断する。(QB)
参考
- http://ja.wikipedia.org/wiki/%E4%BB%AE%E8%AA%AC%E6%A4%9C%E5%AE%9A