尖度 (せんど、英: kurtosis )は、確率変数の確率密度関数や頻度分布の鋭さを表す数字である。正規分布と比べて、尖度が大きければ鋭いピークと長く太い裾を持った分布を持ち、尖度が小さければより丸みがかったピークと短く細い尾を持った分布であるという事が判断できる。日本工業規格では、とがり(kurtosis)として平均値まわりの 4 次のモーメントμ4 と標準偏差σの 4 乗の比 μ4 /σ4 と定義している。
2種類の定義
正規分布の尖度を0とする定義と3とする定義があることに注意。2つの定義の違いは、正規分布との乖離をみるために使われることに起因している。一般には0とすることが多い。Excelの分析ツール等は正規分布の尖度を0としている[3] 。英語版のWikipediaでも、正規分布の尖度は0としている。東京大学出版会の「統計学入門」(ISBN 4130420658)やNumerical Recipesなども正規分布の尖度は0である。
モーメントによる定義
確率変数
X
{\displaystyle X}
の分布関数を
F
(
X
)
{\displaystyle F(X)}
μ
=
E
[
X
]
=
∫
X
d
F
(
x
)
{\displaystyle \mu =E[X]=\int XdF(x)}
μ
r
=
E
[
(
X
−
μ
)
r
]
=
∫
(
X
−
μ
)
r
d
F
(
x
)
{\displaystyle \mu _{r}=E[(X-\mu )^{r}]=\int (X-\mu )^{r}dF(x)}
(
r
{\displaystyle r}
は正整数)
とする。このとき、分布関数
F
(
X
)
{\displaystyle F(X)}
の尖度
β
2
{\displaystyle \beta _{2}}
は以下である。(各積分値が存在すると仮定する)
正規分布の尖度を0とする定義では、
β
2
=
μ
4
μ
2
2
−
3
{\displaystyle \beta _{2}={\frac {\mu _{4}}{{\mu _{2}}^{2}}}-3}
正規分布の尖度を3とする定義では、
β
2
=
μ
4
μ
2
2
{\displaystyle \beta _{2}={\frac {\mu _{4}}{{\mu _{2}}^{2}}}}
キュムラントによる定義
確率変数
X
{\displaystyle X}
の
r
{\displaystyle r}
次のキュムラント[4] を
κ
r
{\displaystyle \kappa _{r}}
とすると尖度
β
2
{\displaystyle \beta _{2}}
は以下で定義される。
正規分布の尖度を0とする定義では、
β
2
=
κ
4
κ
2
2
{\displaystyle \beta _{2}={\frac {\kappa _{4}}{{\kappa _{2}}^{2}}}}
正規分布の尖度を3とする定義では、
β
2
=
κ
4
κ
2
2
+
3
{\displaystyle \beta _{2}={\frac {\kappa _{4}}{{\kappa _{2}}^{2}}}+3}
計算例
正規分布の尖度。モーメント母関数MX (t )のキュムラント母関数は
l
o
g
(
M
X
(
t
)
)
=
μ
t
+
σ
2
t
2
/
2
{\displaystyle log(M_{X}(t))=\mu t+\sigma ^{2}t^{2}/2}
より
κ
1
=
μ
,
κ
2
=
σ
,
κ
r
=
0
(
r
≥
3
)
{\displaystyle \kappa _{1}=\mu ,\kappa _{2}=\sigma ,\kappa _{r}=0(r\geq 3)}
となり3次以上のキュムラントはすべて0であることがわかる。従って正規分布の尖度は
β
2
=
0
{\displaystyle \beta _{2}=0}
(または3)となる。
尖度の意味
以下に正規分布とそれより尖度が大きくおなじ平均と標準偏差をもつ確率密度関数を示す。
模式的であるが、平均の周りでは尖りが大きく裾を引いた分布であることがわかる。
厳密には、尖度と表現するのは間違いであり、本来は裾の重さというべきであることは明らかであろう。詳細は参考文献を見られたい。
特殊な分布
p
(
x
)
=
1
α
B
(
m
−
1
2
,
1
2
)
[
1
+
(
x
−
λ
α
)
2
]
−
m
{\displaystyle p(x)={\frac {1}{\alpha \,\mathrm {\mathrm {B} } \!\left(m-{\frac {1}{2}},{\frac {1}{2}}\right)}}\left[1+\left({\frac {x-\lambda }{\alpha }}\right)^{\!2\,}\right]^{-m}\!}
では両者(裾の重さと平均の周りでは尖り)の概念は一致するが、一般の分布では一致しないのは明らかである。
標本モーメントによる母集団の尖度推定
ここでは、標本の大きさ
n
{\displaystyle n}
の標本に基づく母集団の尖度の推定を考える。
厳密な意味での標本における尖度についての不偏推定量の研究はこのウィキペディアの範疇を超えるので省略する。
一般には尖度の定義の分母分子の不偏推定量をもって母集団の尖度の推定量とする方法がもっとも多く使用される。具体的には、母集団のキュムラントの不偏推定量であるk-statistics(k統計量)[5] を使った計算方法である。r次のk統計量を
k
r
{\displaystyle k_{r}}
、平均周りのr次のモーメントを
m
r
=
1
n
∑
i
=
1
n
(
x
i
−
x
¯
)
r
{\displaystyle m_{r}={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{r}}
とすれば、
k
2
=
n
n
−
1
m
2
{\displaystyle k_{2}={\frac {n}{n-1}}m_{2}}
k
4
=
n
2
(
n
−
1
)
(
n
−
2
)
(
n
−
3
)
{
(
n
+
1
)
m
4
−
3
(
n
−
1
)
m
2
2
}
{\displaystyle k_{4}={\frac {n^{2}}{(n-1)(n-2)(n-3)}}\left\{(n+1)m_{4}-3(n-1){m_{2}}^{2}\right\}}
なので、上記2式をキュムラントによる定義に代入して推定量とする方法である。
最終的には
β
2
{\displaystyle \beta _{2}}
の推定量
b
2
{\displaystyle b_{2}}
について次を得る。
b
2
=
n
(
n
+
1
)
(
n
−
1
)
(
n
−
2
)
(
n
−
3
)
∑
i
(
x
i
−
x
¯
s
)
4
−
3
(
3
n
−
5
)
(
n
−
2
)
(
n
−
3
)
{\displaystyle b_{2}={\frac {n(n+1)}{(n-1)(n-2)(n-3)}}\sum _{i}\left({\frac {x_{i}-{\overline {x}}}{s}}\right)^{4}-{\frac {3(3n-5)}{(n-2)(n-3)}}}
ここに
s
=
n
n
−
1
m
2
{\displaystyle s={\sqrt {{\frac {n}{n-1}}m_{2}}}}
(標本標準偏差)
または3を引いた形式では以下となる。
n
(
n
+
1
)
(
n
−
1
)
(
n
−
2
)
(
n
−
3
)
∑
i
(
x
i
−
x
¯
s
)
4
−
3
(
n
−
1
)
2
(
n
−
2
)
(
n
−
3
)
{\displaystyle {\frac {n(n+1)}{(n-1)(n-2)(n-3)}}\sum _{i}\left({\frac {x_{i}-{\overline {x}}}{s}}\right)^{4}-3{\frac {(n-1)^{2}}{(n-2)(n-3)}}}
分布と尖度
分布
尖度
ラプラス分布
3
双曲線正割分布
2
ロジスティック分布
1.2
正規分布
0
二乗余弦分布
−0.593762…
ウィグナー半円分布
-1
一様分布
-1.2
上記の分布は歪度は全て0である。
脚注
^ 関連項目に挙げたが、歪度(
β
1
=
E
(
X
−
μ
)
3
/
[
E
(
X
−
μ
)
2
]
(
3
/
2
)
{\displaystyle \beta _{1}=E{(X-\mu )^{3}}/[E{(X-\mu )^{2}}]^{(3/2)}}
)、分散(
σ
=
E
(
X
−
μ
)
2
{\displaystyle \sigma =E{(X-\mu )^{2}}}
)は不等式による制限関係があるので、注意する必要がある。当然の事ながら標本における歪度、尖度は互いに独立ではない。
参考までにコーシーシュワルツの不等式を考えれば尖度
β
2
{\displaystyle \beta _{2}}
は明らかに1より大きく、3を引いた意味での尖度は-2以上の値をとることは明らかであろう。
^ 簡単に言えば、モーメント母関数
M
X
(
t
)
{\displaystyle M_{X}(t)}
の対数をとった関数を
t
=
0
{\displaystyle t=0}
の周りで形式的に展開し、tについて整理し、
r
{\displaystyle r}
次の係数が
κ
r
{\displaystyle \kappa _{r}}
である。
^ 具体的には
E
{
k
r
}
=
κ
r
{\displaystyle E\{k_{r}\}=\kappa _{r}}
となる性質がある。
参考文献
A Dictionary of Statistical Terms, 4th edition(Kendall, Maurice G.;Buckland, William R.)
ケンドール 統計学用語辞典 (訳 千葉大学統計グループ) (丸善) ISBN 4621032038
西岡康夫『数学チュートリアル やさしく語る 確率統計』オーム社、2013年。ISBN 9784274214073。
日本数学会『数学辞典』岩波書店、2007年。 ISBN 9784000803090。
JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語 , 日本規格協会, (1999), http://kikakurui.com/z8/Z8101-1-1999-01.html
JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:確率及び一般統計用語 , 日本規格協会, (2015)
伏見康治『確率論及統計論』河出書房、1942年。 ISBN 9784874720127。
関連項目