平均(へいきん、英: mean, 独: Mittelwert, 仏: moyenne)または平均値(mean value)は、観測値の総和を観測値の個数で割ったものである。 例えばA、B、Cという3人の体重がそれぞれ55 kg、60 kg、80 kgであったとすると、3人の体重の平均値は (55 kg + 60 kg + 80 kg)/3 = 65 kgである。
特に断らずに平均という場合の多くはこのような加算して個数で割ったものである。
目次
- 1 平均を用いる際の注意
- 2 統計学
- 3 一般化平均
- 3.1 相乗平均
- 3.2 調和平均
- 3.3 一般化平均
- 3.4 定義域
- 3.5 具体例
- 3.6 関係式
- 3.6.1 相加平均≧相乗平均≧調和平均
- 3.6.2 相加平均と調和平均の相乗平均
- 4 様々な平均
- 4.1 加重平均
- 4.2 連続分布の相加平均
- 4.3 ベクトルの平均
- 4.4 算術幾何平均
- 4.5 移動平均
- 5 脚注
- 6 参考文献
- 7 関連項目
平均を用いる際の注意
社会調査では、平均を代表値として使うことがある。社会調査では平均が中央値、最頻値、中点値と比べて調査の目的に適切かどうかを検討する必要がある。例を挙げる。
世帯の貯蓄の事例では、一部の大金持ちの巨大な貯蓄が平均値を引き上げてしまう。最も多い数の貯蓄額(最頻値)が仮に300万円だとしても平均は700万円くらいになる。従って、一般的な世帯の貯蓄について考察するのが目的ならば中央値や最頻値を用いる。また、とびぬけた値がごく少数の場合には、最大と最小を除外した刈込平均(トリム平均(英語版))を用いることもある。
分布が左右対称でない時、中央値、最頻値をもちいるとよい。平均が中央値、最頻値、中点値と乖離している場合は刈込平均を含めた平均以外の使用を考えるとよい 。
統計学
統計学では、観測データから算術的に計算して得る統計指標値という。 算術平均を統計学では相加平均と呼んでいる。
母平均と標本平均
統計学では平均には「母平均」と「標本平均」がある。母平均は母集団の全ての要素に関する相加平均である。標本平均は、選んだ標本(母集団の部分集合)の要素に関する相加平均である。母平均をμと書き、標本平均を m と書いて区別する場合がある。
相加平均
詳細は「算術平均」を参照
算術平均(さんじゅつへいきん、英: arithmetic mean, 独: arithmetisches Mittel, 仏: moyenne arithmétique)とも呼ぶ。単に平均といった場合は相加平均を意味する。
相加平均を
と定義する。あるいは
と表す。
の相加平均を とも表す。
相加平均は、加法とスカラー倍が可能であるような量(実数, 複素数, ベクトル等)について定義する。
一般化平均
相乗平均
詳細は「幾何平均」を参照
相乗平均(そうじょうへいきん)または幾何平均(きかへいきん、英: geometric mean, 独: geometrisches Mittel, 仏: moyenne géométrique)を
と定義する。相乗平均は相加平均、幾何平均は算術平均と対になった用語である。
あるいは
とも表せる。
対数を取ると
となり、相乗平均は、対数の算術平均の指数関数である。あるいは、相乗平均の対数は対数の算術平均である。
データに1つ以上の0があるときは、相乗平均は0となる。データが実数であっても、積が負になる場合は、相乗平均は複素数になる可能性がある。
相乗平均は、積と累乗根が可能であるような量(実数, 複素数)について定義できる。
調和平均
調和平均(ちょうわへいきん、英: harmonic mean)を、
と定義する。あるいは
とも表せる。
調和平均は、逆数の算術平均の逆数である。あるいは、逆数の算術平均は調和平均の逆数である。
しかし、
データに1つ以上の0があるとき、調和平均の定義式はそのままでは使えないが、0への極限を取ると、調和平均は0となる( のとき )。データに負数があっても調和平均は計算することができる。ただし、正負が混在している場合に逆数の和が0になることがあり、その場合の極限は発散する。
一般化平均
算術平均、相乗平均、調和平均は同じ式
あるいは
で表せる。この式を一般の実数 m に対し定義した値を一般化平均と呼ぶ。
m = 1 で算術平均、m = -1 で調和平均となり、m → 0 への極限が相乗平均である。これらのほか、m = 2 の場合を二乗平均平方根 (RMS) と呼び、物理学や工学で様々な応用をもつ。m → ∞ への極限は最大値、m → -∞ への極限は最小値である。
一般化平均は、ベクトル の m-ノルムを で割った結果に一致する。
データの m 乗の平均、つまり、一般化平均の m 乗
を m 乗平均と呼ぶ。
m 乗平均・一般化平均の応用として、例えば統計学では分散と標準偏差がある。それぞれ m = 2 の場合の m 乗平均・一般化平均により定義されている。(ただし、相加平均を引いた後 m 乗平均・一般化平均を取る)。
一般化平均はさらに一般化が可能で、全単射な関数 f により
という平均が定義できる。恒等関数 f(x)= x により相加平均が、逆数 f(x)= 1/x により調和平均が、対数関数 f(x)= log x により相乗平均がそれぞれ表されている。
定義域
一般の実数 m による一般化平均は、全てが非負の実数であるデータに対してのみ定義される。これは、一般化平均の式に現れる m 乗根(冪関数)が負数に対し定義できないためである。例外は、冪関数を使わずに計算できる算術平均と調和平均 (m = ±1) である。m ≠ ±1 の場合、1つ以上の負数が含まれるデータに対し、一般化平均の定義式は実数を返さないか、実数を返したとしても結果は解釈が難しい。
m < 0 の場合、1つ以上の0が含まれるデータに対し一般化平均の定義式は使えないが、調和平均同様、0への極限を取ると一般化平均は0となる。幾何平均(m = 0 の一般化平均)も0となるので、m ≦ 0 の場合に一般化平均は0となる。
具体例
- 相乗平均
- 78年の経済成長率20%、79年の経済成長率80%の場合、この2年間の平均成長率はより、約47%
- 調和平均
- 往は時速60km 復は時速90kmの場合の往復の平均速度は である。
- 並列接続された電気抵抗の抵抗値などを考える場合に用いる(直列回路と並列回路)。
関係式
相加平均≧相乗平均≧調和平均
n 個のデータが全て正の時、次のような大小関係が成り立つ。
相加平均 ≥ 相乗平均 ≥ 調和平均
等号成立のための必要十分条件は、
である。
左側の不等式は、「対数を使った関係式」にlogの凸性(ジェンセンの不等式)を適用すれば証明できる(数学的帰納法を使った別証明も知られている)。 右側の不等式は、調和平均が逆数の相加平均の逆数という事実を左側の不等式に適用すれば証明できる。
相加平均と調和平均の相乗平均
データ数nが2のときの相加平均、相乗平均、調和平均をそれぞれA、G、Hとすると、
なので、
が成立する。すなわち、もとのデータの相乗平均は相加平均と調和平均の相乗平均に等しくなる。
様々な平均
加重平均
観測される値それぞれに重みがある時には、単に相加平均をとるのでなく重みを考慮した平均をとるのが便利である。各データ xi に、重み wi がついているときの加重平均(重み付き平均)は
と定義される。全ての重みが等しければ、これは通常の相加平均である。
例えば重み付き最小二乗法では、誤差の小さなデータに大きな重みを与えた残差の加重平均を最小化[5]することで、尤度の最大化を図る。重点サンプリング(英語版)によって期待値をモンテカルロ推定するときは、求めたい期待値に関する確率密度とサンプルの確率密度の比を重みとした加重平均を推定量とする。
相乗平均についての重み付き平均は
と定義される。ただし、 とする。
連続分布の相加平均
観測されるデータ x(t) が区間 [a, b] 上に連続的に分布しているとき、その相加平均は積分
と定義される。これは離散分布の相加平均に対して、無限個の平均を算出する操作を極限により表したものである。
ベクトルの平均
ベクトルに対し、 の(相加)平均を、
により定義する。
相加平均と違い、相乗平均や調和平均はベクトルの場合に一般化できない。
ベクトルの数が3の場合、の平均は、 の作る三角形の重心に一致する。 ベクトルの数が4の場合も同様で、の平均は、 の作る四面体の重心に一致する。
この事実は一般にベクトルの数が n の場合も拡張でき、の平均は、 の作るn-単体の重心に一致する。
また、後述するように、ベクトルの平均は物理学における質点の重心と関係がある。
加重平均も同様にベクトルに拡張でき、
と定義される。
m 乗平均・一般化平均はスカラー
として定義される。ただしここでは、ベクトルのノルムである。
m = 2 の場合、 は内積 に一致するので、m = 2 の場合の m 乗平均や一般化平均が特に重要である。たとえば物理学では速さの平均値として、m = 2 の場合の一般化平均を使うことがある。
ベクトルの加重平均の概念には、物理的な解釈を与える事ができる。質点 がそれぞれ位置 にあり、それぞれの質量が であるとき、 の重心は、加重平均
に一致する。
よって特にベクトルの(相加)平均は、質量1の質点達の重心に一致する。
算術幾何平均
詳細は「算術幾何平均」を参照
を、 を満たす2つの非負実数とする。 を
により定義する。
このとき、
を と の算術幾何平均という。
移動平均
詳細は「移動平均」を参照
脚注
- ^ 最小二乗法において、加重和の最小化と加重平均の最小化は同じことである。
参考文献
- 岡田泰栄 『平均値の統計』、共立出版<数学ワンポイント双書>、1981年。
- 鷲尾泰俊 『推定と検定』、共立出版<数学ワンポイント双書>、1978年。
- 西岡康夫 『数学チュートリアル やさしく語る 確率統計』 オーム社、2013年。ISBN 9784274214073。
- 日本数学会 『数学辞典』 岩波書店、2007年。ISBN 9784000803090。
- JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999), http://kikakurui.com/z8/Z8101-1-1999-01.html
- 伏見康治 『確率論及統計論』 河出書房、1942年。ISBN 9784874720127。
関連項目
統計学 |
|
標本調査 |
|
|
要約統計量 |
|
|
統計的推測 |
仮説検定 |
- 帰無仮説
- 対立仮説
- 有意
- 棄却
- ノンパラメトリック手法
- スチューデントのt検定
- ウェルチのt検定
- カイ二乗検定
- イェイツのカイ二乗検定
- 累積カイ二乗検定
- F検定
- G検定
- マン・ホイットニーのU検定
- Z検定
- フィッシャーの正確確率検定
- 二項検定
- 尤度比検定
- マンテル検定
- コクラン・マンテル・ヘンツェルの統計量
- ウィルコクソンの符号順位検定
- アンダーソン–ダーリング検定
- カイパー検定
- ジャック–ベラ検定
- シャピロ–ウィルク検定
- コルモゴロフ–スミルノフ検定
- 分散分析
- 共分散分析
|
|
区間推定 |
|
|
その他 |
- 最尤推定
- ベイズ推定
- 尤度関数
- カーネル密度推定
- 最小距離推定
- メタアナリシス
|
|
|
生存時間分析 |
- 生存時間関数
- カプラン=マイヤー推定量
- ログランク検定
- 故障率
- 比例ハザードモデル
|
|
相関 |
- 交絡変数
- ピアソンの積率相関係数
- 順位相関
- スピアマンの順位相関係数
- ケンドールの順位相関係数
|
|
モデル |
- 一般線形モデル
- 一般化線形モデル
- 混合モデル
- 一般化線形混合モデル
|
|
回帰 |
線形 |
- 線形回帰
- リッジ回帰
- Lasso
- エラスティックネット
|
|
非線形 |
- k近傍法
- 回帰木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクター回帰
- 射影追跡回帰
|
|
|
分類 |
線形 |
- 線形判別分析
- ロジスティック回帰
- 単純ベイズ分類器
- 単純パーセプトロン
- 線形サポートベクターマシン
|
|
二次 |
|
|
非線形 |
- k近傍法
- 決定木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクターマシン
- ベイジアンネットワーク
- 隠れマルコフモデル
|
|
その他 |
|
|
|
教師なし学習 |
|
|
統計図表 |
- 棒グラフ
- バイプロット
- 箱ひげ図
- 管理図
- 森林プロット
- ヒストグラム
- Q-Q プロット
- ランチャート
- 散布図
- 幹葉図
|
|
歴史 |
|
|
応用 |
- 社会統計学
- 生物統計学
- 統計力学
- 計量経済学
- 機械学習
- 実験計画法
|
|
出版物 |
|
|
カテゴリ |
|