Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2015/09/14 23:08:53」(JST)
[Wiki ja表示]
外れ値(はずれち、英:outlier )は、統計において他の値から大きく外れた値である。
測定ミス・記録ミス等に起因する異常値とは概念的には異なるが、実用上は区別できないこともある。
目次
- 1 検定
- 1.1 スミルノフ・グラブス検定
- 1.2 トンプソン検定
- 2 関連項目
- 3 外部リンク
検定
外れ値かどうか検定したい標本について、偏差を不偏標準偏差で割った検定統計量
を求め(x1 は標本値、μ は平均、σ は標準偏差)、この値(両側検定をする場合はこの絶対値)が有意点より大きいかどうかで検定する。
簡単な方法では、2または3を有意点とする。つまり、μ ± 2–3 σ の外なら外れ値とする。
スミルノフ・グラブス検定
より精密には、正規分布を仮定して、スミルノフ・グラブス (Smirnov‐Grubbs) 検定を使う。標本数を n、所要の有意水準を α、自由度 n - 2 のt分布の α / n × 100 パーセンタイルを t として、
を有意点とする。この式は再帰的に使う。つまり、最も外れた1標本のみを検定し、それが外れ値と判定されたら、それを除外した n - 1 個の標本を使って2番目に外れた標本を検定し、以下、外れ値が検出されなくなるまで繰り返す。
トンプソン検定
トンプソン (Thompson) 検定では、
を使う。計算式の都合上、スミルノフ・グラブス検定とは逆に、標本値の検定統計量 τ1 から t1 を経て有意水準 α1 を求めることが多い。n が十分大きければスミルノフ・グラブス検定と同じ結果になる。
関連項目
外部リンク
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
Japanese Journal
- データサイエンティストの泥臭い仕事(第18回)所得分布と外れ値(outlier)の扱い
- LSIテストにおけるフェイル予測のためのばらつき補正に関する検討 (ディペンダブルコンピューティング) -- (組込み技術とネットワークに関するワークショップETNET2016)
- 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115(519), 271-276, 2016-03-24
- NAID 40020791519
Related Links
- 外れ値とは、他のデータからみて、極端に大きな値、または極端に小さな値のことです。外れ値のなかで、測定をミスや、データの入力ミスなど、原因がわかっているものが異常値です。極端に小さい・大きい値であるからといって ...
- 統計学の「32-1. 外れ値」についてのページです。統計WEBの「統計学の時間」では、統計学の基礎から応用までを丁寧に解説しています。大学で学ぶ統計学の基礎レベルである統計検定2級の範囲をほぼ全てカバーする内容となってい ...
- 外れ値は統計において他の値から大きく外れた値です。データ解析をしていると外れ値の存在を考慮すべき場面に出くわすことがあります。外れ値は統計において他の値から大きく外れた値であり、異常値とは表現しません。 測定ミス ...
★リンクテーブル★
[★]
- 英
- external、externally、extra、exo
- 関
- エキソ、エクソ、外側、外部、余分
[★]
- 英
- value
- 関
- 価値、評価