- 英
- confounding
WordNet
- that confounds or contradicts or confuses (同)contradictory
Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2013/03/26 20:37:56」(JST)
[Wiki ja表示]
交絡(こうらく、英: Confounding)は、統計モデルの中の従属変数と独立変数の両方に(肯定的または否定的に)相関する外部変数が存在すること。そのような外部変数を交絡変数(confounding variable)、交絡因子(confounding factor、confounder)、潜伏変数(lurking variable)などと呼ぶ。したがって科学的研究では、第一種過誤(従属変数が独立変数との因果関係にあるという偽陽性の結論)と呼ばれるこれらの要因を避けるよう制御する必要がある。2つの観測された変数のそのような関係を擬似相関という。すなわち交絡が存在する場合、観測された現象の真の原因は交絡変数であるにもかかわらず、独立変数を原因と推論してしまう。
目次
- 1 概要
- 2 研究における交絡の回避方法
- 3 関連項目
- 4 脚注
- 5 外部リンク
|
概要
定義上、交絡変数は想定される原因と結果の両方に関連している。交絡因子は原因と結果の中間に位置することはない。AがCの原因と想定されるとき、交絡変数BはAを原因として起きるのではないし、またBによって常にCが起きるとは限らない。例えば、女性であることは常に喫煙の原因とはならないし、喫煙が常に癌の原因とは限らない。従って、女性であることと癌になることの因果関係を研究する際には、考えられる交絡因子として喫煙を考慮すべきである。(このたとえ話は一つの予言である。)さらに、2つのリスクグループ(例えば男性と女性)があるとき、交絡因子はそれぞれのグループで常に異なる普及率(例えば喫煙率)となっている。(Hennekens, Buring & Mayrent, 1987)
統計学的研究における因果関係の判定基準は盛んに研究されてきたが、ジューディア・パールは統計学的な概念だけで交絡変数を定義することはできず、そのためにはある程度の因果的想定が必要であることを示した[1]。Austin Bradford Hill は1965年の論文で因果関係の判定基準を提案した[2]。多くの疫学者はこれを交絡と因果関係を考える出発点として採用した。しかし、これはせいぜいヒューリスティック的な価値しかない。因果グラフによって因果的な想定を表す際には、backdoor≒バックドアといわれる簡単な基準によって、交絡変数の集合を特定することが可能である。
研究における交絡の回避方法
研究において、積極的に交絡変数を除去したり制御したりする方法はいくつか存在する[3]。
- ケースコントロール研究(case-control studies)
- ケース群とコントロール群に等しく交絡因子があるものとする。例えば、心筋梗塞の原因の研究をするとき年齢が交絡変数と考えられるなら、67歳の梗塞患者(ケース)と67歳の健常者(コントロール)を対照する。ケースコントロール研究では、対照変数は年齢や性別であることが多い。
- コホート研究(cohort studies)
- 例えば、年齢が交絡因子と考えられるとき、年齢層をそろえた集団(コホート)を対象として観測する。その中で例えば心筋梗塞の原因として運動量の多寡で対照する。
- 層化(stratification)
- 心筋梗塞において、運動量が多ければ罹患する可能性が低いと考えられ、年齢が交絡因子と考えられるとする。サンプリングされたデータは年齢層によって層化される。すなわち、運動量と心筋梗塞の関係を各年齢層毎に分析する。年齢層によって危険率に差が生じるなら、年齢が交絡因子と考えられる。層化されたデータを扱う統計手法としてマンテル=ヘンツェル法などがある。
これらの手法にはそれぞれ欠点がある。例えば、45歳のアラスカ出身の黒人で、フットボール選手で菜食主義者で教育者として働いている人が何らかの病気にかかり、ケースコントロール研究の対象者になったとする。対照者として属性がほとんど同じでその病気にかかっていない点だけが異なる人を見つけなければならないが、これは大変な作業である。また常に過大対応や過少対応の危険性がつきまとう。コホート研究では、除外される人があまりにも多くなる傾向があり、層化では層が薄くなりすぎる(標本数が少なすぎる)傾向がある。
既知の交絡因子を測定することによって交絡を制御し、それらを多変量解析における共変動とする方法もある。層化に比較して、交絡変数の強さに関する情報をほとんど得られないという欠点がある。
重要な問題として、交絡変数は必ずしも判別し測定可能とは限らない。疫学では交絡を完全に制御できないことを指して「残余交絡(residual confounding)」と呼ぶ。標本数が多いなら、無作為抽出が最も良い方法であることが多く、その場合は全ての交絡変数(既知も未知も含めて)が全ての研究対象群に等しく分散していると考えられる。
関連項目
脚注
- ^ Pearl, Judea (2000年). Causality: Models, Reasoning, and Inference. Cambridge University Press. ISBN 0-521-77362-8.
- ^ Bradford Hill, Austin (1965年). “The environment or disease: association or causation?”. Proc R Soc Med 58 (May): 295–300. PMID 14283879. http://www.edwardtufte.com/tufte/hill.
- ^ Mayrent, Sherry L (1987年). Epidemiology in Medicine. Lippincott Williams & Wilkins. ISBN 0-316-35636-0.
外部リンク
- Linear Regression (Yale University)
- Scatterplots (Simon Fraser University)
- Pearl, J. "Why there is no statistical test for counfounding, why many think there is, and why they are almost right," UCLA Computer Science Department, Technical Report R-256, January 1998
統計学 |
|
実験計画法 |
統計母集団 • サンプリング • 層化抽出法 • 反復 • ブロック化
|
|
標本推定 |
帰無仮説 • 対立仮説 • 第一種過誤と第二種過誤 • 統計的検出力 • 効果の大きさ
|
|
記述統計学 |
連続データ |
位置 |
平均(算術、幾何、調和) • 中央値 • 最頻値
|
|
分散 |
範囲 • 標準偏差 • 変動係数 • 百分率
|
|
モーメント |
分散 • 歪度 • 尖度
|
|
|
カテゴリデータ |
頻度 • 分割表
|
|
|
統計的推測 |
ベイズ推定 • 仮説検定 • 有意性 • Z検定 • スチューデントのt検定 • カイ二乗検定 • F検定 • 有意 • 区間推定 • 最尤度 • 最小距離 • メタアナリシス • 信頼区間
|
|
生存時間分析 |
生存時間関数 • カプラン-マイヤー推定量 • ログランク検定 • 故障率 • 比例ハザードモデル
|
|
相関 |
交絡変数 • ピアソンの積率相関係数 • 順位相関(スピアマンの順位相関係数、ケンドールの順位相関係数)
|
|
線型モデル |
一般線型モデル • 一般化線型モデル • 分散分析 • 共分散分析
|
|
回帰分析 |
線形回帰 • 非線形回帰 • ロジスティック回帰
|
|
統計図表 |
棒グラフ • バイプロット • ボックスプロット • 管理図 • 森林プロット • ヒストグラム • Q-Q プロット • ランチャート • 散布図 • 幹葉図
|
|
歴史 |
統計学歴史 • 統計学の創始者 • 確率論と統計学の歩み
|
|
応用 |
社会統計学 • 生物統計学 • 統計力学 • 計量経済学
|
|
出版物 |
統計学に関する学術誌一覧 • 重要な出版物
|
|
カテゴリ |
|
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
Japanese Journal
- 糖尿病とがん (特集 糖尿病治療のパラダイムシフト)
- 疫学・統計解析シリーズ(3)偶然・バイアス・交絡 : その研究結果は真実?それとも、偽り?
- 操 華子
- 日本環境感染学会誌 = Japanese journal of environmental infecions 29(2), 67-79, 2014
- NAID 40020035683
Related Links
- みなさまは「交絡」という言葉をお聞きになったことはありますか?もしかしたら耳慣れない言葉かもしれません。「交絡」は、データ解析における「因果関係」の判断を惑わせる要因として知られています。事例を交えて考えた方が ...
- 交絡因子は医学統計において、かなり重要な知識であるにも関わらず、とてもイメージしにくいです。 「交絡」「交絡因子」「交絡バイアス」など、交絡に関する用語が結構出てくるため、色々と混乱が生じやすいですね。
- 交絡(こうらく、英: Confounding )は、統計モデルの中の従属変数と独立変数の両方に(肯定的または否定的に)相関する外部変数が存在すること。そのような外部変数を交絡変数(confounding variable)、交絡因子(confounding factor ...
Related Pictures
★リンクテーブル★
[★]
[★]
- 英
- confounding factor、confounder
- 同
- 交絡変数 confounding variable、交絡要因
[★]
- 英
- confounding variable
- 関
- 交絡因子
[★]
- 英
- confounding factor
- 関
- 交絡因子