Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2021/08/24 19:51:13」(JST)
[Wiki ja表示]
アヤメの花弁の長さの分布を種ごとに表す箱ひげ図(Iris flower data set)
箱ひげ図 (はこひげず、箱髭図、英: box plot、box-and-whisker plot )は、データのばらつきをわかりやすく表現するための統計図である。主に多くの水準からなる分布を視覚的に要約し、比較するために用いる。ジョン・テューキーが1970年代に提唱した。様々な分野で利用されるが、特に品質管理で盛んに用いられる。箱 (box )と、その両側に出たひげ (whisker )で表現されることからこの名がある[1] 。
定義
箱ひげ図 は五数要約(five-number summary )と呼ばれる(頑健な)要約統計量
Q 0/4 : 最小値(minimum )
Q 1/4 : 第1四分位点(lower quartile )
Q 2/4 : 中央値(第2四分位点、median )
Q 3/4 : 第3四分位点(upper quartile )
Q 4/4 : 最大値(maximum )
を表すグラフである。第1四分位点から第3四分位点までの高さに箱を描き、中央値で仕切りを描く。ただし、ひげや外れ値、箱の幅・形などの扱いにはいくつか変種がある。簡明なのは最大値と最小値をひげの端で表したものである。外れ値も扱うときには閉区間
[
Q
1
/
4
−
1.5
I
Q
R
,
Q
3
/
4
+
1.5
I
Q
R
]
(
I
Q
R
=
Q
3
/
4
−
Q
1
/
4
)
{\displaystyle [Q_{1/4}-1.5\,\mathrm {IQR} ,\,Q_{3/4}+1.5\,\mathrm {IQR} ]\qquad (\mathrm {IQR} =Q_{3/4}-Q_{1/4})}
の外にあるものを(もしあれば)外れ値として個別に表示し、外れ値を除いたものの最大値・最小値にそれぞれひげの端をとる[2] [3] 。母集団は実際には様々なタイプの確率分布に従うわけだが、箱ひげ図はそのような仮定に関係なく、データの分布を表現することができる。箱の各部分の間隔から分散や歪度の程度を知ることもできる。
例
以下に箱ひげ図の具体例を挙げる:
このデータセット(値は図から読み取れる概略値とする)から、次のことが分かる。
最小値 = 0.5
第1四分位点 = 7
中央値(第2四分位点) 8.5
第3四分位点 = 9
最大値 = 10
四分位範囲(IQR) = 2
3.5という値は"軽度の"外れ値、つまりQ 1/4 よりも 1.5×IQR から 3×IQR だけ下にある
0.5という値は"極端な"外れ値、つまりQ 1/4 よりも 3×IQR 以上下にある
外れ値以外の最小値は5
データは左に歪んでいる(負の歪度)
"軽度"および"極端"外れ値の境は、箱の長さの2倍の点である。なお、この図からデータの平均値は読み取れない。
変種
いろいろな統計パッケージで使われている箱ひげ図の中には、違う方式(例えば5%点と95%点をひげの端にする)を採用したものもある。このような方式は、中央値を中心とする分布を強調するテューキーの方式と異なり、またデータサイズが10を越えただけで(分布の形によらず)外れ値を出してしまう傾向がある。
脚注
^ 西岡康夫,数学チュートリアル やさしく語る 確率統計,1.6 箱ひげ図 p.13, オーム社, 2013, ISBN 9784274214073
^ Dekking et al. 2005, 16.4 The box-and-whisker plot .
^ R言語のboxplot
もデフォルトではこのようにプロットする。
参考文献
Dekking, F. M.; Kraaikamp, C.; Lopuhaä, H. P.; Meester, L. E. (2005). A modern introduction to probability and statistics . Springer Texts in Statistics. Springer-Verlag. ISBN 978-1-85233-896-1. MR 2208349. https://books.google.com/books?id=TEcmHJX67coC
西岡康夫『数学チュートリアル やさしく語る 確率統計』オーム社、2013年。 ISBN 9784274214073。
関連項目
外部リンク
総務省統計局. “箱ひげ図”. なるほど統計学高等部 . 2016年3月29日 閲覧。 —Excelで箱ひげ図を作る方法
“R: Box Plots”. 2016年3月29日 閲覧。 —R言語で箱ひげ図を作る方法
統計学
標本調査 記述統計学
連続データ
位置 分散
範囲
偏差
偏差値
標準偏差
標準誤差
変動係数
決定係数
相関係数
自己相関
共分散
自己共分散
分散共分散行列
百分率
統計的ばらつき
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
t検定
ウェルチのt検定
F検定
Z検定
二項検定
ジャック–ベラ検定
シャピロ–ウィルク検定
分散分析
共分散分析
ノンパラメトリック
ウィルコクソンの符号順位検定
マン・ホイットニーのU検定
カイ二乗検定
イェイツのカイ二乗検定
累積カイ二乗検定
フィッシャーの正確確率検定
尤度比検定
G検定
アンダーソン–ダーリング検定
コルモゴロフ–スミルノフ検定
カイパー検定
マンテル検定
コクラン・マンテル・ヘンツェルの統計量
その他
区間推定 モデル選択基準 その他
偏り
偏りと分散
過剰適合
推定量
点推定
最尤推定
尤度関数
尤度方程式
最小距離推定
メタアナリシス
ブートストラップ法
ベイズ統計学
確率
主観確率
ベイズ確率
事前確率
事後確率
最大事後確率
その他
相関
交絡変数
ピアソンの積率相関係数
順位相関(スピアマンの順位相関係数・ケンドールの順位相関係数)
モデル
一般線形モデル
一般化線形モデル
混合モデル
一般化線形混合モデル
回帰
線形
線形回帰
リッジ回帰
ラッソ回帰
エラスティックネット
非線形
k近傍法
回帰木
ランダムフォレスト
ニューラルネットワーク
サポートベクター回帰
射影追跡回帰
時系列
自己回帰モデル
自己回帰移動平均モデル
ARCHモデル
対移動平均比率法
トレンド定常
傾向推定
共和分
構造変化
分類
線形
線形判別分析
ロジスティック回帰
単純ベイズ分類器
単純パーセプトロン
線形サポートベクターマシン
二次 非線形
k近傍法
決定木
ランダムフォレスト
ニューラルネットワーク
サポートベクターマシン
ベイジアンネットワーク
隠れマルコフモデル
その他
教師なし学習
統計図表
棒グラフ
バイプロット(英語版)
箱ひげ図
管理図
森林プロット(英語版)
ヒストグラム
円グラフ
Q-Qプロット
ランチャート
散布図
幹葉図
バイオリン図
ドットプロット
ヒートマップ
階級区分図
生存時間分析
生存時間関数
カプラン=マイヤー推定量(英語版)
ログランク検定(英語版)
故障率
比例ハザードモデル
歴史 応用
社会統計学
疫学
生物統計学
統計力学
計量経済学
機械学習
実験計画法
出版物 その他 全般
Japanese Journal
中学校における定期考査と実力考査を活用した学力の経年分析
半沢 裕太
宮城教育大学教職大学院紀要 = Bulletin of Miyagi University of Education Graduate School for Teacher Training (2), 137-147, 2021-03-31
… 第2章では,定期考査や実力考査等の偏差値データの経年グラフや相関係数,箱ひげ図 からの分析結果について述べる。 …
NAID 120007034226
フェルミ推定を取り入れた「標本調査」単元の開発と実践
四分位数や箱ひげ図 の導入段階と課題に関する一考察-生徒による発想を生かした導入について-
Related Links
箱ひげ図の見方 箱ひげ図は、その名のとおり「箱」と「ひげ」によって構成される、データのばらつきを可視化するための図式です。「棒グラフ」「円グラフ」「折れ線グラフ」「散布図」「ヒストグラム」と同様に、データの分布を確認する手法のひとつとして活用されています。
箱ひげ図とは? 箱ひげ図はデータを可視化するグラフの1つで、主に データの分布 を把握したい場合に使われます。 下図のような箱ひげ図を用いて、箱ひげ図の見方について説明します。 上図のように、箱ひげ図は長方形の「 箱 」と「 ひげ 」と呼ばれる直線で構成されます。
パーセンタイル 箱ひげ図の見方を説明する前に、「パーセンタイル」について触れます。 パーセンタイルは「データを小さい順で並べたとき、ある数値がデータの小さい方から見て何%の位置にあるかを表すもの」です。0パーセンタイルは最小値を、100パーセンタイルは最大値を表します。
Related Pictures
★リンクテーブル★
[★]
英
figure 、plate 、plot 、diagram 、drawing 、fig
関
形 、杢 、シャーレ 、図示 、板状 、プレート 、プロット 、図表 、蒔く 、イチジク
[★]
英
box
関
ボックス