- 英
- regression analysis、regression analyses
Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2016/12/02 10:35:56」(JST)
[Wiki ja表示]
|
この項目では、統計学における回帰について説明しています。その他の用法については「回帰」をご覧ください。 |
回帰(かいき、英: regression)とは、統計学において、Y が連続値の時にデータに Y = f(X) というモデル(「定量的な関係の構造[1]」)を当てはめる事。別の言い方では、連続尺度の従属変数(目的変数)Y と独立変数(説明変数)X の間にモデルを当てはめること。X が1次元ならば単回帰、X が2次元以上ならば重回帰と言う。Y が離散の場合は分類と言う。
回帰分析(かいきぶんせき、英: regression analysis)とは、回帰により分析する事。
回帰で使われる、最も基本的なモデルは Y = AX + B という形式の線形回帰である。
目次
- 1 概要
- 2 モデル
- 3 最小二乗法による推定
- 4 独立変数同士の相関
- 5 語源
- 6 解析ソフト
- 7 関連項目
- 8 脚注
- 9 参考文献
概要
回帰分析では独立変数と従属変数の間の関係を表す式を統計的手法によって推計する。
従属変数(目的変数)とは、説明したい変数(注目している変数)を指す。独立変数(説明変数)とは、これを説明するために用いられる変数のことである。経済学の例を挙げてみると次のようになる。経済全体の消費()を国民所得()で説明する消費関数が というモデルで表されるとする。この例では、消費 Y が従属変数、国民所得 X が独立変数に対応する。そして といった係数(パラメータ)を推定する。
最も単純な方法は上式のような一般化線形モデルを用いる線形回帰であるが、その他の非線形モデルを用いる非線形回帰もある。
モデル
線形(一般化線形モデル、一般線形モデルなど)
- 線形回帰
- 正則化項付き
- リッジ回帰(英語版)
- Lasso(英語版)
- エラスティックネット(英語版)
非線形
- k近傍法
- 回帰木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクター回帰
- 射影追跡回帰
- 多変量適応的回帰スプライン(英語版)
最小二乗法による推定
詳細は「最小二乗法」を参照
パラメータを推定する代表的な方法として、最小二乗法がある。これは、二乗和誤差を最小化する最尤推定である。
最小二乗法の概要は次のとおりである。はじめに回帰式(目的変数を説明変数で計算する式)を設定する。次に、回帰式の係数を求めるが、「従属変数の測定値と、独立変数の測定値および回帰式を用いて求めた推定値の差の二乗和誤差」が最小になるように求める。線形モデルの場合、回帰式の係数で推定値の差の2乗平均を微分し0と置いた連立方程式を解いて求められる。
独立変数同士の相関
マーケティングやアンケートでよく使う一般的な重回帰の場合、複数の説明変数同士は無相関という仮定が入っている。そのため、一般化線形モデルで説明変数同士が関連性の高いものを使うと係数が妙な値になることがあるので注意する必要がある(これは多重共線性と呼ばれる)。
- 例: 小学校での定期テスト得点から重回帰で分析する場合に、理科の点数を従属変数に、算数と国語を説明変数にした場合、算数が増えると理科の点数が多く、国語の点数が高ければ理科の点数が減るといった意味の係数が出ることがある。これは算数と国語の点数に強い相関が両者にあるからである。この場合は算数と国語の平均点と、算数と国語の得点の差というように和と差に数字を加工すると、この2つは相関がたいてい低く、かつ解釈しやすい。算数と国語の得点の差は、算数の方が高い生徒の方が理科の点数が高い傾向があるというように理解できるからである。
これは、線形モデルの問題であるため、線形モデルが不適切ならば、非線形モデルを使用すれば良い。また、共分散構造分析という重回帰より複雑な関係を適切に説明できるモデルもある。
語源
回帰は語源的には回帰効果(平均への回帰)に由来する。回帰効果は相関(直線的な関係)が低い場合に顕著に現れる。しかし回帰分析では必ずしも直線的関係を仮定しない。また「目的変数yを説明変数xに回帰する」といい、「回帰」という言葉が由来とは異なる意味に使われている。
解析ソフト
- NAG
- IMSL
- R言語 - 統計解析言語。回帰分析ほか多くの統計関数を標準装備したフリーウェア。『モデル式』でモデル記述や当てはめが容易。他アプリケーションのファイル取込やODBC接続対応。FDA公認。CRANという仕組みで世界の膨大なソフトを無償利用可能。可視化機能に優れ、日本語対応。マルチプラットフォーム。
- Stata
関連項目
- 統計学
- 計量経済学
- 相関係数
- 傾向推定
- 曲線あてはめ
- アンスコムの例
脚注
参考文献
- J. R. Taylor 『計測における誤差解析入門』 林 茂雄,馬場 凉(訳)、東京化学同人、2000年。
- 蓑谷 千凰彦 『回帰分析のはなし』 東京図書、1985年。
統計学 |
標本調査 |
|
要約統計量 |
|
統計的推測 |
仮説検定 |
- 帰無仮説
- 対立仮説
- 有意
- 棄却
- ノンパラメトリック手法
- スチューデントのt検定
- ウェルチのt検定
- カイ二乗検定
- イェイツのカイ二乗検定
- 累積カイ二乗検定
- F検定
- G検定
- マン・ホイットニーのU検定
- Z検定
- フィッシャーの正確確率検定
- 二項検定
- 尤度比検定
- マンテル検定
- コクラン・マンテル・ヘンツェルの統計量
- ウィルコクソンの符号順位検定
- アンダーソン–ダーリング検定
- カイパー検定
- ジャック–ベラ検定
- シャピロ–ウィルク検定
- コルモゴロフ–スミルノフ検定
- 分散分析
- 共分散分析
|
区間推定 |
|
その他 |
- 最尤推定
- ベイズ推定
- 尤度関数
- カーネル密度推定
- 最小距離推定
- メタアナリシス
|
|
生存時間分析 |
- 生存時間関数
- カプラン=マイヤー推定量
- ログランク検定
- 故障率
- 比例ハザードモデル
|
相関 |
- 交絡変数
- ピアソンの積率相関係数
- 順位相関
- スピアマンの順位相関係数
- ケンドールの順位相関係数
|
モデル |
- 一般線形モデル
- 一般化線形モデル
- 混合モデル
- 一般化線形混合モデル
|
回帰 |
線形 |
- 線形回帰
- リッジ回帰
- Lasso
- エラスティックネット
|
非線形 |
- k近傍法
- 回帰木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクター回帰
- 射影追跡回帰
|
|
分類 |
線形 |
- 線形判別分析
- ロジスティック回帰
- 単純ベイズ分類器
- 単純パーセプトロン
- 線形サポートベクターマシン
|
二次 |
|
非線形 |
- k近傍法
- 決定木
- ランダムフォレスト
- ニューラルネットワーク
- サポートベクターマシン
- ベイジアンネットワーク
- 隠れマルコフモデル
|
その他 |
|
|
教師なし学習 |
|
統計図表 |
- 棒グラフ
- バイプロット
- 箱ひげ図
- 管理図
- 森林プロット
- ヒストグラム
- Q-Q プロット
- ランチャート
- 散布図
- 幹葉図
|
歴史 |
|
応用 |
- 社会統計学
- 生物統計学
- 統計力学
- 計量経済学
- 機械学習
- 実験計画法
|
出版物 |
|
カテゴリ |
|
- ^ 『統計学入門』(東京大学出版会)、257頁
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
Japanese Journal
- ビジネスマンのための基礎からの統計学(12)回帰分析の実際(3)ビジネスマンにとっての統計学とは?
- 清水 千弘
- 不動産鑑定 = Appraisal & finance : アセット・ビジネスを考える人のコマーシャル・マガジン 51(7), 87-92, 2014-07
- NAID 40020088926
- スモールデータアプローチによるオフィスビルの電力需要予測方式
- 川野 裕希,山田 敏志,阿倍 博信,中島 宏一
- 情報処理学会論文誌. コンシューマ・デバイス&システム 4(2), 1-9, 2014-06-11
- … 量(期間)のデータ,つまりスモールデータで各時間帯の電力需要量を予測する方式を提案する.具体的には,過去の電力需要量と気温のみを用いた重回帰分析による予測方式において,オフィスビルの電力需要予測に適した説明変数の提案・選択や,重回帰分析を用いた予測方式の課題である外挿への対応を検討して予測精度の向上を図り,オフィスビルの1年間の電力需要量を用いた予測精度評価によりそ …
- NAID 110009794822
- ビジネスマンのための基礎からの統計学(11)回帰分析の実際(2)モデル選択
- 清水 千弘
- 不動産鑑定 = Appraisal & finance : アセット・ビジネスを考える人のコマーシャル・マガジン 51(6), 85-91, 2014-06
- NAID 40020056366
Related Links
- 回帰分析の目的 例えば身長と体重のような,相互依存の関係にある2変量があるとき,一方の数値が与えられたとき,他方の組を予測することができます. 回帰分析とは,乱暴にいってしまえば,複数の変数間の関係を一次方程式(Y=aX ...
- Excelを使った回帰分析(最小二乗法)の手順と出力の意味を説明します。このページでは、Excelの分析ツールを使った回帰分析の手順を紹介します。
Related Pictures
★リンクテーブル★
[★]
回帰分析
- 関
- regression analysis
[★]
- 関
- regression analyses
[★]
- 英
- logistic regression、multivariate logistic regression、multiple logistic regression
- 関
- 多重ロジスティック回帰、多変量ロジスティック回帰、ロジスティックモデル
[★]
- 英
- Cox proportional hazards regression analysis
- 関
- コックス比例ハザード回帰分析
[★]
- 英
- Cox proportional hazards regression analysis
- 関
- Cox比例ハザード回帰分析
[★]
- 英
- multiple linear regression analysis
- 関
- 多重線形回帰分析
[★]
- 英
- multiple linear regression analysis
- 関
- 重回帰分析
[★]
- 英
- analysis、analyses、assay、analyze、analyse、dissect、analytical、anal
- 関
- アッセイ、解体、解剖、検定、検定法、肛門、試験法、精査、測定法、定量、分析法、分析用、解析、アッセイ法、解析法
[★]
- 英
- regression、recurrence、recurrent
- 関
- 再発、再発性、退行、退縮、反回、反回性、反復性、後退