目次
- 1 1. 交絡因子とは:原因と結果の関係を横からゆがめる第三の要因
- 2 2. 相関と因果関係の違い:なぜ「関連あり」だけでは足りないのか
- 3 3. 現代的な交絡の考え方:DAGで「調整すべき変数」を見極める
- 4 4. 交絡因子と似ている概念:媒介因子・効果修飾因子・コライダーとの違い
- 5 5. 研究デザインで交絡を防ぐ:無作為化・制限・マッチング
- 6 6. 統計解析で交絡を調整する:層別化・多変量解析・傾向スコア
- 7 7. 遺伝医学との接点:GWAS・メンデルランダム化・遺伝カウンセリングでなぜ重要か
- 8 8. 医学研究で実際に起きた交絡の具体例
- 9 9. よくある誤解:交絡因子を正しく扱うために
- 10 よくある質問(FAQ)
- 11 参考文献
- 12 関連記事
交絡因子(Confounding factor)とは、ある「原因」と「結果」の関係を見ようとしたときに、その関係を横からゆがめてしまう第三の要因のことです。たとえば「コーヒーを多く飲む人ほど肺がんが多い」という観察結果があったとしても、コーヒーそのものが肺がんを起こしているとは限りません。コーヒーを多く飲む人に喫煙者が多く、喫煙が肺がんの本当の原因であれば、喫煙が交絡因子です。交絡を理解すると、医学論文やニュースで見かける「関連がある」という言葉を、本当に因果関係といえるのかという視点で読み解けるようになります。
Q. 交絡因子とは何ですか?まず結論だけ知りたいです
A. 交絡因子とは、調べたい原因と結果の両方に関係していて、両者の関係を本当より強く見せたり、弱く見せたり、存在しない関係をあるように見せたりする第三の要因です。観察研究では交絡を完全に避けることが難しいため、研究デザイン、統計解析、DAG(有向非巡回グラフ)による因果構造の整理が重要になります。
- ➤交絡の本質 → 「相関がある」ことと「原因である」ことを取り違えさせる構造的なゆがみ
- ➤古典的3条件 → 結果の危険因子、曝露と関連、中間因子ではない、という教育上の整理
- ➤現代的理解 → DAGでバックドア経路を見つけ、調整すべき変数と調整してはいけない変数を分ける
- ➤遺伝医学との接点 → GWAS、メンデルランダム化、コホート研究、遺伝カウンセリングで因果関係を誤読しないために重要
- ➤臨床での意味 → 薬の効果、検査の意義、疾患リスクを説明するときに、見かけの関連と真の原因を分けて考える力になる
1. 交絡因子とは:原因と結果の関係を横からゆがめる第三の要因
交絡因子を一言でいうと、研究者が本当に知りたい「曝露」と「アウトカム」の関係に、別の原因が混ざり込んでしまう現象です。ここでいう曝露とは、薬を飲む、喫煙する、特定の遺伝的特徴を持つ、ある環境にいる、ある検査を受けるなど、研究で原因候補として扱うものです。アウトカムとは、病気になる、症状が改善する、死亡する、検査値が変化するなど、研究で結果として観察するものです。交絡は、この曝露とアウトカムの両方に関係する第三の要因によって起こります。
たとえば「コーヒーを飲む人ほど肺がんが多い」という観察結果を考えてみましょう。コーヒーを飲む人に喫煙者が多く、喫煙が肺がんの強い原因であれば、コーヒーと肺がんの関係は喫煙によってゆがめられます。このとき研究者が見たいのは「コーヒーそのものが肺がんを増やすか」ですが、実際には「喫煙する人がコーヒーも多く飲む」という行動パターンが混ざっています。その結果、コーヒーが肺がんの原因であるかのように見えることがあります。これが交絡の典型例です。
💡 用語解説:曝露(Exposure)
曝露とは、研究で「原因候補」として扱うものです。薬の使用、喫煙、飲酒、食事、職業、環境物質、年齢、遺伝的背景、特定の検査や治療などが含まれます。医学研究では「曝露」という言葉を使うと、必ずしも悪いものだけでなく、治療薬や予防接種のように良い効果が期待されるものも含みます。つまり曝露は「その人が何を受けているか、何を持っているか、どのような状態にあるか」を広く表す言葉です。
古典的な疫学教育では、ある変数が交絡因子として働くためには、主に3つの条件を満たすと説明されます。第一に、その変数がアウトカムの危険因子であること。第二に、その変数が曝露と関連していること。第三に、その変数が曝露からアウトカムへ至る途中の「中間因子」ではないことです。コーヒーと肺がんの例では、喫煙は肺がんの危険因子であり、コーヒー摂取とも関連し、コーヒーを飲んだ結果として生じるものではありません。そのため喫煙は交絡因子として理解できます。
ただし、この3条件はとても便利な説明である一方、現代の因果推論では「必要十分条件」として機械的に使うのではなく、研究対象の因果構造を図で整理して考えることが重視されます。なぜなら、現実の医学研究では、複数の要因が絡み合い、ある変数が交絡因子なのか、中間因子なのか、コライダーなのかが一見してわからないことが多いからです。特に遺伝医学では、年齢、性別、祖先集団、家族歴、生活習慣、検査を受けるきっかけ、医療アクセスなどが複雑に絡みます。単に統計ソフトにたくさんの変数を入れればよいわけではありません。
💡 用語解説:アウトカム(Outcome)
アウトカムとは、研究で「結果」として観察するものです。病気の発症、死亡、再発、検査値の変化、症状の改善、妊娠転帰、治療後の副作用などが含まれます。患者さん向けに言い換えると、「結局どうなったか」を表す項目です。医学研究で因果関係を考えるときは、曝露とアウトカムをまず明確に分け、その間にどのような要因が入っているかを整理する必要があります。
交絡因子が問題になるのは、主に観察研究です。観察研究では、研究者が治療や曝露をランダムに割り付けるのではなく、現実に起きている医療や生活習慣をそのまま観察します。そのため、治療を受ける人と受けない人、検査を受ける人と受けない人、特定の生活習慣を持つ人と持たない人の間には、もともとの背景差があります。この背景差がアウトカムにも関係していると、見かけ上の関連が生まれます。たとえば「ある薬を飲んでいる人ほど死亡率が高い」という結果が出ても、その薬が危険なのではなく、もともと重症の人にその薬が処方されていたのかもしれません。これを適応による交絡と呼びます。
2. 相関と因果関係の違い:なぜ「関連あり」だけでは足りないのか
医学ニュースでは「〇〇をしている人は△△になりにくい」「□□を食べる人は病気が少ない」といった表現がよく登場します。しかし、そこで示されているのが単なる相関なのか、因果関係なのかは慎重に区別する必要があります。相関とは、2つの出来事が一緒に増えたり減ったりすることです。因果関係とは、一方がもう一方を実際に引き起こすことです。相関は因果関係の手がかりにはなりますが、相関があるだけで原因だと判断するのは危険です。
よく使われる例に、「アイスクリームの売上が増えると水難事故も増える」というものがあります。アイスクリームが水難事故を起こしているわけではありません。暑い日にはアイスクリームを買う人も増え、海や川で遊ぶ人も増えるため、水難事故も増えます。この場合、「暑さ」が交絡因子です。アイスクリームと水難事故の間に見える相関は、暑さという第三の要因によって作られた見かけ上の関連です。
相関と因果を取り違える典型例
🍦
アイスクリーム
売上が増える
☀️
暑さ
これが交絡因子
🌊
水辺に行く人が増え
事故も増える
アイスクリームが事故を起こすのではなく、暑さが両方を増やしています。
医学では、この取り違えが患者さんの判断に直接影響します。たとえば「あるサプリメントを飲む人ほど健康で長生き」という観察研究があったとします。しかし、そのサプリメントを買う人は、もともと健康意識が高く、運動し、食事に気を配り、定期健診も受けているかもしれません。そうすると、長生きに関係しているのはサプリメントそのものではなく、健康意識や生活習慣、医療アクセスかもしれません。このような背景の違いを取り除かずに「サプリメントが寿命を延ばす」と結論づけると、因果関係を誤って理解することになります。
💡 用語解説:見かけの関連
見かけの関連とは、データ上は2つのものが関係しているように見えるけれど、実際には片方がもう片方を直接引き起こしているわけではない状態です。交絡因子があると、この見かけの関連が生まれます。医学論文を読むときは、「関連がある」と書かれていても、それが真の因果関係なのか、背景因子による見かけの関連なのかを分けて考えることが大切です。
交絡の怖いところは、関連を「作り出す」だけでなく、真の関連を「隠す」こともある点です。たとえば、ある治療が本当は効果を持っていても、その治療が重症患者に集中して使われていると、治療群の成績が悪く見えることがあります。すると、治療が効かない、あるいは危険であるかのように見えるかもしれません。逆に、健康な人ほど予防的介入を受ける傾向があると、その介入の効果が本当より大きく見えます。つまり交絡は、研究結果を過大評価することも、過小評価することも、方向を逆転させることもあります。
💡 用語解説:正の交絡・負の交絡
交絡によって、曝露とアウトカムの関連が本当より強く見える場合を「正の交絡」と呼びます。コーヒーと肺がんの例で、喫煙を調整しないためにコーヒーのリスクが大きく見える場合がこれにあたります。
反対に、本当は関連があるのに、交絡によって関連が弱く見えたり消えて見えたりする場合を「負の交絡」と呼びます。重症患者に有効な治療を優先的に使うと、治療群の予後が悪く見え、治療効果が隠れてしまうことがあります。
このため、研究結果を読むときには「何人を調べたか」だけでなく、「どの背景因子を考慮したか」が非常に重要です。大規模なデータであっても、交絡因子を適切に測定していなければ、誤った結論が非常に精密に出るだけです。データ数が多いことは統計的な安定性を高めますが、因果関係の正しさを自動的に保証するものではありません。医学研究では、統計の前に、まず「何が原因で、何が結果で、どの変数がその関係をゆがめる可能性があるか」を考える必要があります。
3. 現代的な交絡の考え方:DAGで「調整すべき変数」を見極める
🔍 関連記事:ランダム化比較試験(RCT)/メンデルランダム化/GWAS
現代の因果推論では、交絡を単なる「統計上の邪魔者」としてではなく、因果構造の問題として考えます。そのために使われる代表的な道具がDAG(Directed Acyclic Graph、有向非巡回グラフ)です。DAGは、変数同士の因果関係を矢印で表した図です。「AがBの原因になる」と考えるなら、AからBへ矢印を引きます。矢印が一方向で、ぐるぐる戻ってこない構造で因果関係を表すため、研究者が頭の中で想定している病態や行動の流れを目に見える形にできます。
💡 用語解説:DAG(有向非巡回グラフ)
DAGは「何が何の原因になっているか」を矢印で表す因果関係の地図です。統計モデルにどの変数を入れるかを決める前に、年齢、性別、疾患の重症度、治療選択、生活習慣、遺伝的背景などの関係を図にします。DAGの目的は、たくさんの変数を何となく調整することではなく、「調整すべき変数」と「調整してはいけない変数」を区別することです。
交絡をDAGで表すと、典型的には「C → X」と「C → Y」という形になります。Cが交絡因子、Xが曝露、Yがアウトカムです。CはXにも影響し、Yにも影響します。そのためXとYの間には、XからYへ向かう本来知りたい道だけでなく、X ← C → Yという裏道ができます。この裏道をバックドア経路と呼びます。バックドア経路が開いていると、XとYの関連にはCの影響が混ざります。したがって、Cを適切に調整することで、この裏道を閉じ、XからYへの関係をより純粋に評価できます。
DAGで見る交絡の基本形
C
交絡因子
例:喫煙
CがXとYの両方に影響
X
曝露
例:コーヒー
Y
アウトカム
例:肺がん
X ← C → Y のバックドア経路を閉じるため、Cを適切に調整します。
DAGが重要なのは、「多くの変数を調整すればするほど良い」という誤解を防ぐためです。統計解析では、年齢、性別、BMI、既往歴、検査値、生活習慣などをモデルに入れることがあります。しかし、ある変数が交絡因子ではなく中間因子であれば、それを調整することで本来の効果を消してしまうことがあります。また、コライダーを調整すると、もともと存在しなかった偽の関連を作り出してしまうこともあります。つまり、調整は薬のようなもので、適切に使えば役に立ちますが、使い方を間違えると結果を悪化させます。
バックドア経路とは何か
バックドア経路とは、曝露XからアウトカムYへ向かう本来知りたい因果経路とは別に、Xの「後ろ側」から入り込んでYへつながる経路です。たとえば治療Xと死亡Yの関係を調べるとき、疾患の重症度Cが治療選択にも死亡リスクにも影響しているとします。このとき、治療Xと死亡Yの間には「X ← 重症度C → Y」というバックドア経路が存在します。治療を受けた人の死亡率が高く見えたとしても、それは治療が悪いのではなく、治療を受けた人が最初から重症だったためかもしれません。
この経路を閉じるには、重症度を測定し、解析で調整する必要があります。調整とは、簡単に言えば「同じくらい重症の人同士で比べる」ことです。重症度が同じであれば、治療を受けた人と受けなかった人の差は、重症度ではなく治療そのものに近づきます。もちろん、実際には重症度を完全に測定することは難しいため、症状、検査値、入院歴、併存疾患、処方内容などを組み合わせて近似します。この近似が不十分だと、残余交絡が残ります。
💡 用語解説:残余交絡
残余交絡とは、交絡因子を調整したつもりでも、測定が不完全だったり、重要な交絡因子を見落としていたりするために残ってしまう交絡です。たとえば「喫煙あり・なし」だけで調整しても、喫煙本数、喫煙年数、過去の喫煙歴、受動喫煙まで正確に測定できていなければ、喫煙による影響が残る可能性があります。
調整しすぎると起こる問題:中間因子とコライダー
交絡因子は調整すべき変数ですが、すべての変数を調整すればよいわけではありません。特に注意すべきなのが、中間因子とコライダーです。中間因子とは、曝露の結果として生じ、その後アウトカムに影響する変数です。たとえば、ある遺伝的要因がLDLコレステロールを上げ、それによって心筋梗塞リスクが上がるとします。このときLDLコレステロールは、遺伝的要因から心筋梗塞へ至る途中にある中間因子です。研究目的が「遺伝的要因の総効果」を知ることなら、LDLを調整すると、その効果の一部を消してしまいます。
コライダーはさらに厄介です。コライダーとは、2つ以上の要因から矢印が入り込む変数です。たとえば、ある病気Aも入院の原因になり、別の病気Bも入院の原因になるとします。このとき「入院した人だけ」を対象に研究すると、AとBの間に本来なかった関連が生まれることがあります。これをコライダーバイアスと呼びます。コライダーを調整する、あるいはコライダーで対象者を限定すると、かえって新しいバイアスを作ることがあります。
交絡因子
曝露と結果の両方に影響する第三の要因です。適切に調整することで、見かけの関連を減らし、因果効果の推定に近づけます。
中間因子
曝露の結果として生じ、その後アウトカムに影響する途中経路です。目的によっては調整すると本来の効果を消してしまいます。
コライダー
複数の要因から影響を受ける変数です。調整したり、そこで対象者を限定したりすると、存在しない関連を作ることがあります。
このように、DAGの役割は単に図を描くことではありません。研究の前に、変数同士の関係を言語化し、どの経路を閉じるべきか、どの経路を残すべきかを決めることです。医学研究では統計ソフトが自動的に正しい因果関係を教えてくれるわけではありません。研究者や臨床家が、病態生理、診療の流れ、検査を受ける人の背景、治療が選ばれる理由を理解し、その知識をもとに調整方針を決める必要があります。これは遺伝医学でも同じです。遺伝子型と表現型の関連を読むときも、集団背景、検査選択、家族歴、医療アクセス、年齢構成などを考えずに「この遺伝子がこの症状を起こす」と短絡することはできません。
4. 交絡因子と似ている概念:媒介因子・効果修飾因子・コライダーとの違い
交絡因子を正しく理解するうえで、必ず一緒に整理しておきたい概念があります。それが、媒介因子、効果修飾因子、コライダーです。これらはすべて「曝露とアウトカムの間に関わる変数」ですが、役割がまったく違います。交絡因子は原則として調整したい変数です。媒介因子は、研究目的によっては調整してはいけない変数です。効果修飾因子は、調整して消すものではなく、層別して意味を読む変数です。コライダーは、調整するとかえって偽の関連を作ってしまう変数です。
この違いを理解しないまま「関係しそうな変数を全部入れる」という解析を行うと、見かけ上は高度な統計処理をしているように見えても、因果関係の推定としては誤った方向へ進むことがあります。医学研究では、統計的に有意かどうかだけでなく、「その変数を調整することに生物学的・臨床的な意味があるか」を考える必要があります。特に遺伝医学では、遺伝子変異、タンパク質機能、代謝経路、症状、検査を受けるきっかけ、診断の遅れなどが一連の因果の流れを作るため、変数の位置づけを間違えると解釈が大きく変わります。
媒介因子:原因から結果へ至る「途中の仕組み」
媒介因子とは、曝露がアウトカムに影響する途中にある変数です。たとえば、ある遺伝的バリアントがLDLコレステロールを上昇させ、その結果として冠動脈疾患のリスクが上がるとします。このとき、LDLコレステロールは遺伝的バリアントと冠動脈疾患の間にある媒介因子です。研究の目的が「この遺伝的バリアントが冠動脈疾患に与える全体の影響」を知ることなら、LDLコレステロールを調整すると、遺伝的バリアントの効果の一部を取り除いてしまいます。
一方で、研究の目的が「その影響のうち、どれだけがLDLコレステロールを介しているのか」を知ることであれば、媒介分析という別の枠組みで評価します。つまり、媒介因子は交絡因子のように単純に「調整すべき邪魔者」ではありません。むしろ病気がどのように起こるのかを理解するための重要なメカニズムです。遺伝医学では、遺伝子変異がタンパク質機能を変え、細胞内シグナルを変え、臓器の形態や機能を変え、最終的に症状として現れるという流れがあります。この途中の段階を安易に調整すると、病気の本質を消してしまうことがあります。
💡 用語解説:媒介因子(メディエーター)
媒介因子とは、「原因が結果に至る途中で起こる変化」です。交絡因子が原因と結果の外側から関係をゆがめるのに対し、媒介因子は原因から結果へ向かう道の途中にあります。病気の仕組みを知るうえでは重要ですが、総効果を知りたいときに調整すると、原因の効果を過小評価することがあります。
効果修飾因子:同じ曝露でも人によって効果が違う
効果修飾因子とは、曝露がアウトカムに与える影響の大きさを変える要因です。これは交絡因子とは違い、「取り除くべきバイアス」ではありません。むしろ臨床的に非常に重要な情報です。たとえば、ある薬が若年者ではよく効くが高齢者では効きにくい、あるいは男性と女性で副作用の出方が違うとします。このとき年齢や性別は効果修飾因子です。全体をまとめて1つの平均効果だけを見ると、重要なサブグループ差を見逃すことがあります。
遺伝医学では、効果修飾の考え方は非常に身近です。同じ病的バリアントを持っていても、発症する人としない人がいます。同じ遺伝子変異でも、症状の重さや発症年齢が異なることがあります。これは浸透率、表現度、遺伝的背景、環境要因、性別、年齢、生活習慣、他の修飾遺伝子などが影響するためです。ある因子が交絡因子なのか、効果修飾因子なのかは、研究の問いによって変わることがあります。そのため、単に統計的に「調整する」のではなく、「層別して意味を見る」ことが大切です。
💡 用語解説:効果修飾因子
効果修飾因子とは、ある原因が結果に与える影響の強さを変える要因です。たとえば同じ薬でも、年齢、性別、腎機能、遺伝子型によって効果や副作用が変わることがあります。効果修飾はバイアスではなく、「どの人に強く効くのか」「どの人では注意が必要なのか」を知るための臨床的に大切な情報です。
コライダー:調整すると新しいバイアスを作る変数
コライダーは、複数の原因が集まる「合流点」のような変数です。たとえば、喫煙も入院の原因になり、COVID-19などの感染症も入院の原因になるとします。このとき「入院している人だけ」を対象に喫煙と感染症の関係を調べると、一般集団では存在しない関連が生まれることがあります。なぜなら、入院という条件で対象者を選ぶことにより、喫煙で入院した人と感染症で入院した人が同じ枠に集められ、片方の要因がある人ではもう片方の要因が少なく見えるなど、人工的な関連が作られるからです。
コライダーの難しさは、直感に反する点です。多くの人は「関係しそうな変数は調整したほうが正確になる」と考えます。しかしコライダーは、調整することで閉じていた経路を開いてしまいます。これは、データ解析だけでなく、研究対象者の選び方にも関係します。ある病院を受診した人だけ、検査を受けた人だけ、診断された人だけを対象にすると、その選択条件自体がコライダーとして働く可能性があります。遺伝医学では、遺伝子検査を受ける人は家族歴、症状、医師の判断、経済的事情、医療アクセスなどで選ばれているため、検査を受けた集団だけを一般集団の代表とみなすことには注意が必要です。
💡 用語解説:コライダーバイアス
コライダーバイアスとは、複数の原因が影響する変数で対象者を絞ったり、その変数を調整したりすることで、本来存在しない関連が作られるバイアスです。入院患者だけ、検査を受けた人だけ、診断された人だけを対象にすると起こることがあります。交絡因子は調整で改善しますが、コライダーは調整すると悪化することがあるため注意が必要です。
5. 研究デザインで交絡を防ぐ:無作為化・制限・マッチング
交絡を制御する方法は、大きく2つに分けられます。ひとつは研究を始める前のデザイン段階で交絡が起こりにくいように設計する方法、もうひとつはデータを集めた後に統計解析で調整する方法です。デザイン段階での対策は、研究の土台そのものを整える作業です。解析段階でどれほど複雑な統計モデルを使っても、重要な交絡因子を測定していなければ後から完全に修正することはできません。そのため、研究計画の時点で「どの交絡因子が問題になりそうか」を考えておくことが非常に重要です。
🔍 関連記事:ランダム化比較試験(RCT)/コホート研究/バイアス
無作為化:既知・未知の交絡因子を平均的にそろえる
交絡を防ぐ最も強力な方法が無作為化です。無作為化とは、治療や介入を受けるかどうかを、研究者や患者の選択ではなくランダムに割り付けることです。ランダム化比較試験(RCT)では、治療群と対照群に参加者を無作為に分けるため、年齢、性別、重症度、生活習慣、測定されていない未知の要因まで、理論上は群間で平均的にバランスします。これにより、治療群と対照群の違いを治療そのものの影響として解釈しやすくなります。
ただし、無作為化は魔法ではありません。サンプルサイズが小さい場合には、偶然によって群間に偏りが残ることがあります。たとえば、たまたま治療群に高齢者が多く入る、重症者が多く入る、といったことは起こり得ます。また、長期の生活習慣、危険な曝露、倫理的に割り付けできない要因にはRCTを使えません。喫煙を人に割り付けることはできませんし、何十年も続く環境曝露をランダム化することも現実的ではありません。そのため、RCTは強力ですが、すべての医学的問いに使えるわけではありません。
💡 用語解説:ランダム化比較試験(RCT)
RCTは、参加者をランダムに治療群と対照群へ分けて、治療の効果を比べる研究です。ランダム化により、既知の交絡因子だけでなく、研究者が測定していない未知の交絡因子も平均的にそろうことが期待されます。ただし、少人数では偶然の偏りが残ることがあり、倫理的・時間的に実施できないテーマもあります。
制限:対象者をあえて絞ることで交絡を減らす
制限とは、研究対象者を特定の条件に絞る方法です。たとえば喫煙が強い交絡因子になりそうな研究で、対象者を非喫煙者だけに限定すれば、喫煙による交絡は大きく減ります。年齢が大きな交絡因子になりそうな場合には、対象者を特定の年齢範囲に限定することもあります。制限の利点は、直感的でわかりやすく、研究デザインの段階で強力に交絡を減らせることです。
一方で、制限には大きな弱点があります。対象者を絞りすぎると、研究結果を一般の人に当てはめにくくなります。非喫煙者だけの研究結果は、喫煙者にも同じように当てはまるとは限りません。若年者だけの研究結果は、高齢者には当てはまらないかもしれません。これは外的妥当性、つまり研究結果をどこまで広く使えるかの問題です。交絡を減らすために対象者を均質にすると、現実の多様な患者さんへの応用が難しくなるというトレードオフがあります。
マッチング:背景が似た人同士を比べる
マッチングとは、曝露群と非曝露群で背景が似た人を対応させて比較する方法です。たとえば症例対照研究で、ある病気の患者さん1人に対して、同じ年齢・同じ性別の対照者を選ぶことがあります。これにより、年齢や性別による交絡を研究デザインの段階で減らせます。マッチングは、比較したい要因以外の背景をできるだけそろえるという発想です。
ただし、マッチングも万能ではありません。マッチングした変数は、解析でも適切に扱う必要があります。また、アウトカムとあまり関係のない変数で過剰にマッチングすると、かえって効率が悪くなります。さらに、マッチングした変数の効果を後から評価しにくくなることがあります。たとえば全員を性別で完全にそろえた研究では、性別によるリスク差をその研究内で評価することは難しくなります。マッチングは強力な方法ですが、「何をそろえるべきか」を研究の目的に合わせて慎重に選ぶ必要があります。
6. 統計解析で交絡を調整する:層別化・多変量解析・傾向スコア
観察研究では、研究デザインだけで交絡を完全に防ぐことは難しいため、解析段階での調整が重要になります。解析段階の調整とは、データを集めた後で、交絡因子の影響をできるだけ取り除いて、曝露とアウトカムの関係を評価することです。代表的な方法には、層別化、標準化、多変量解析、傾向スコア法などがあります。これらはそれぞれ強みと限界があり、研究の目的、データの量、測定された変数の質に応じて使い分けます。
層別化:同じ背景の人たちの中で比べる
層別化とは、交絡因子の値ごとにグループを分け、その中で曝露とアウトカムの関係を調べる方法です。たとえば年齢が交絡因子になりそうなら、40歳未満、40〜64歳、65歳以上のように年齢層を分け、それぞれの層の中で比較します。層の中では年齢のばらつきが小さくなるため、年齢による交絡が減ります。さらに、層ごとの結果を見れば、効果が年齢によって異なるかどうか、つまり効果修飾も確認できます。
層別化は直感的で理解しやすい方法ですが、調整したい変数が増えると急に難しくなります。年齢を3層、性別を2層、喫煙を3層、BMIを4層に分けるだけでも、3×2×3×4で72層になります。さらに多くの変数を考えると、各層の人数が少なくなり、推定が不安定になります。これを次元の呪いと呼びます。層別化は、少数の重要な交絡因子を丁寧に見るには有用ですが、多数の共変量を同時に扱うには限界があります。
💡 用語解説:層別化
層別化とは、年齢層、性別、喫煙歴などでグループを分け、同じ層の中で比較する方法です。たとえば「同じ年齢層の人同士で比べる」ことで、年齢による交絡を減らします。わかりやすい方法ですが、調整したい要因が多いと層が増えすぎ、各層の人数が不足します。
多変量解析:複数の交絡因子を同時に扱う
多変量解析は、複数の共変量を統計モデルに入れて、曝露とアウトカムの関係を評価する方法です。ロジスティック回帰、線形回帰、Cox比例ハザードモデルなどがよく使われます。たとえば、薬の使用と死亡リスクの関係を見るときに、年齢、性別、疾患の重症度、糖尿病、腎機能、喫煙歴などをモデルに入れることで、これらの影響を一定程度調整します。臨床研究で「年齢、性別、併存疾患で調整した」と書かれている場合、多くはこのような多変量モデルを意味します。
多変量解析は便利ですが、モデルの仮定に依存します。連続変数を直線的な効果として扱ってよいのか、変数同士の相互作用を入れるべきか、欠測値をどう扱うか、どの変数をモデルに入れるか、といった判断が必要です。また、測定されていない交絡因子は調整できません。さらに、ステップワイズ法のような自動変数選択だけに頼ると、臨床的に重要な交絡因子が外れてしまうことがあります。統計的に有意でないからといって、因果構造上重要な変数を外してよいとは限りません。
💡 用語解説:共変量
共変量とは、研究で関心のある主な曝露以外に、アウトカムに影響し得る変数です。年齢、性別、BMI、重症度、生活習慣、併存疾患などが典型例です。交絡因子は共変量の一種ですが、すべての共変量が交絡因子とは限りません。解析に入れる前に、その変数が因果構造のどこにあるのかを考えることが重要です。
傾向スコア:治療を受けやすさを1つのスコアにまとめる
傾向スコアとは、ある人が特定の治療や曝露を受ける確率を、背景因子から推定したスコアです。たとえば、年齢、性別、疾患の重症度、併存疾患、検査値などを使って「この人が薬Aを処方される確率」を計算します。そして、傾向スコアが近い人同士を比較したり、スコアに応じて重みを付けたりします。発想としては、「薬Aを受けやすさが同じくらいの人同士で比べる」ことで、治療選択に関わる交絡を減らそうとする方法です。
傾向スコアには、マッチング、層別化、逆確率重み付け(IPTW)などの使い方があります。多くの背景因子を1つのスコアに要約できるため、観察研究でよく使われます。ただし、傾向スコアも測定済みの因子しか調整できません。医師が処方を決めるときに見ていた「患者さんの全体的な弱り方」「家族のサポート」「症状の微妙な変化」などがデータに入っていなければ、それらによる交絡は残ります。傾向スコアを使ったからRCTと同じになる、という理解は誤りです。
💡 用語解説:傾向スコア
傾向スコアとは、「その人が治療を受ける確率」を背景因子から計算した値です。スコアが近い人同士を比べることで、治療群と非治療群の背景をそろえようとします。観察研究でよく使われますが、測定されていない交絡因子までは調整できません。
縦断データでは、交絡はさらに複雑になります。治療が時間とともに変わり、交絡因子も時間とともに変わる場合があります。たとえば、病状が悪化したから治療が強化され、その治療によって次の病状が変わり、その病状がさらに次の治療選択に影響する、という循環が起こります。このような時間依存性交絡では、単純なベースライン調整や従来型の傾向スコアだけでは不十分になることがあります。周辺構造モデル、g-公式、g-推定などの高度な因果推論手法が使われることがありますが、一般向けに大切なのは、時間の流れを無視して単純に調整すると誤る場合がある、という点です。
7. 遺伝医学との接点:GWAS・メンデルランダム化・遺伝カウンセリングでなぜ重要か
交絡因子は、疫学や医学統計だけの専門用語ではありません。遺伝医学の現場でも、交絡を理解していないと、遺伝子と病気の関係、検査結果の意味、家族への説明を誤ってしまうことがあります。遺伝子は生まれたときから変わらない情報であるため、一見すると「交絡の影響を受けにくい」と感じるかもしれません。しかし実際には、遺伝的背景、祖先集団、生活環境、医療アクセス、検査を受けるきっかけ、家族歴、診断されやすさなどが複雑に絡み、観察される関連をゆがめることがあります。
たとえば、ある遺伝的バリアントが特定の疾患と関連すると報告された場合、その関連が本当に病気の原因を示しているのか、それとも集団構造や診断バイアスの影響なのかを考える必要があります。特定の祖先集団に多いバリアントと、その集団で多く観察される生活環境や医療制度の違いが重なると、遺伝子そのものの効果でない関連が出ることがあります。これは遺伝学研究における代表的な交絡の一つです。
🔍 関連記事:GWAS(ゲノムワイド関連解析)/メンデルランダム化/遺伝子型-表現型相関
GWASでは「集団構造」が交絡になる
GWAS(ゲノムワイド関連解析)は、全ゲノムにわたる多数の遺伝的バリアントと疾患・形質との関連を調べる研究です。非常に強力な方法ですが、交絡に注意が必要です。特に重要なのが集団構造です。集団構造とは、研究対象者の中に、祖先集団や地域的背景の異なるグループが混ざっている状態を指します。あるバリアントが特定の祖先集団に多く、その集団で疾患頻度も高い場合、そのバリアントが疾患の原因でなくても関連があるように見えてしまうことがあります。
この問題を避けるため、GWASでは主成分分析などを使って祖先集団の違いを調整します。これは、遺伝的背景そのものが交絡因子として働く可能性があるからです。たとえば、ある地域に多い遺伝的特徴と、その地域に多い食生活や医療アクセス、環境要因が重なると、遺伝子と病気の関連を誤って解釈する危険があります。遺伝子は「固定された情報」ですが、遺伝子を持つ人は社会や環境の中で生きています。そのため、遺伝統計でも交絡の視点が欠かせません。
💡 用語解説:集団構造
集団構造とは、研究対象者の中に祖先集団や地域的背景の異なる人々が混ざっていることです。遺伝的バリアントの頻度は祖先集団によって異なるため、疾患頻度や環境要因の違いと重なると、遺伝子と病気の見かけの関連が生まれることがあります。GWASでは、主成分分析などで集団構造を調整することが重要です。
メンデルランダム化は交絡を減らすための考え方でもある
メンデルランダム化は、遺伝的バリアントを自然のランダム化に近い道具として利用し、ある曝露が病気の原因かどうかを推定する方法です。たとえば、LDLコレステロールを上げる遺伝的バリアントを持つ人で心筋梗塞が多いかを調べることで、LDLコレステロールが心筋梗塞の原因かどうかを評価します。出生時に受け継ぐ遺伝的バリアントは、生活習慣や病気の後からの影響を受けにくいため、通常の観察研究より交絡の影響を受けにくいと考えられます。
しかし、メンデルランダム化も交絡から完全に自由ではありません。遺伝的バリアントが目的の曝露以外の経路を通じてアウトカムに影響する場合、水平的多面発現が問題になります。たとえば、あるバリアントがLDLだけでなく炎症や血圧にも影響し、それらを介して心筋梗塞に影響しているなら、LDLだけの因果効果を推定しているとはいえません。このため、メンデルランダム化では、使用する遺伝的バリアントが適切な操作変数として働くか、複数の感度分析で検討する必要があります。
💡 用語解説:水平的多面発現
水平的多面発現とは、ひとつの遺伝的バリアントが、研究で注目している曝露とは別の経路を通じてアウトカムに影響することです。メンデルランダム化では、これがあると「曝露が病気の原因である」という推定がゆがみます。遺伝的バリアントを自然のランダム化として使うためには、そのバリアントが目的の曝露を通じてのみアウトカムに影響するという前提が重要です。
遺伝カウンセリングでは「数字の背景」を説明する力になる
遺伝カウンセリングでは、検査結果そのものだけでなく、その結果をどう解釈するかが重要です。たとえば、あるバリアントが疾患と関連するという研究結果があっても、その研究がどのような集団で行われたのか、年齢や性別、家族歴、検査を受ける理由がどう調整されているのかによって、患者さんへの説明は変わります。研究対象が特定の祖先集団に偏っている場合、その結果を別の集団にそのまま当てはめることは慎重であるべきです。
また、遺伝性疾患では、同じ遺伝子型でも表現型が大きく異なることがあります。これを遺伝子型-表現型相関として整理しますが、ここにも交絡や効果修飾の視点が必要です。ある遺伝子変異を持つ人で重症例が多く報告されている場合、それは本当にその変異の効果なのか、重症だから検査されやすかったのか、専門施設に紹介されやすかったのかを考える必要があります。診断された人だけを集めたデータでは、軽症例や未診断例が見落とされることがあります。
💡 用語解説:診断バイアス
診断バイアスとは、病気や症状がある人ほど検査を受けやすく、診断されやすいことで、研究データに偏りが生じることです。遺伝性疾患では、重症例ほど専門施設に紹介され、遺伝子検査を受けるため、報告される症状が実際より重く見えることがあります。軽症例や未診断例を考慮しないと、病気の自然歴やリスクを過大評価する可能性があります。
このように、交絡因子を理解することは、遺伝子検査を否定するためではありません。むしろ、検査結果をより正確に読み、患者さんやご家族に誤解の少ない説明をするための基礎です。遺伝医学では「この変異があるから必ずこうなる」と断定できない場面が多くあります。背景因子、年齢、性別、家族歴、環境、診断されるまでの経緯を含めて丁寧に説明することが、遺伝カウンセリングの重要な役割です。
8. 医学研究で実際に起きた交絡の具体例
交絡因子は抽象的な概念に見えますが、医学の歴史の中で何度も重要な判断に影響してきました。ここでは、交絡がどのように誤解を生み、どのように後から整理されてきたかを、代表的な例で確認します。重要なのは、これらの例が単なる過去の失敗ではなく、現在の臨床研究や医療ニュースを読むときにも同じ構造が繰り返し現れるという点です。
コーヒーと肺がん:喫煙という強い交絡因子
コーヒー摂取と肺がんリスクの関係は、交絡を説明する古典的な例です。過去の観察研究では、コーヒーを多く飲む人ほど肺がんリスクが高いように見えることがありました。しかし、詳しく解析すると、コーヒーを多く飲む人に喫煙者が多いことが重要でした。喫煙は肺がんの非常に強い危険因子であり、同時にコーヒー摂取とも関連していました。そのため、喫煙を十分に調整しないと、コーヒーが肺がんを増やすように見えてしまいます。
この例が重要なのは、交絡因子の影響が非常に大きい場合、主たる曝露の効果を完全に覆い隠すことがあるからです。喫煙のようにアウトカムへ強く影響する因子が、曝露とも強く関連している場合、わずかな測定の不完全さでも残余交絡が残ります。喫煙の有無だけでなく、喫煙本数、喫煙期間、禁煙後の年数、受動喫煙などをどこまで測定しているかで結果が変わる可能性があります。これは、生活習慣研究全般に共通する難しさです。
ホルモン補充療法と冠動脈疾患:健康実践者バイアス
閉経後女性に対するホルモン補充療法と冠動脈疾患の関係も、交絡を理解するうえで非常に重要です。かつて観察研究では、ホルモン補充療法を受けている女性は冠動脈疾患が少ないように見える結果が報告されました。しかし、その後のランダム化比較試験では、心血管疾患の予防効果は観察研究ほど明確ではなく、一部ではリスク上昇も示されました。この違いの一因として、健康実践者バイアスが考えられています。
健康実践者バイアスとは、予防的な治療や検診を受ける人が、もともと健康意識が高く、食事や運動に気を配り、医療機関へのアクセスも良い傾向を持つため、その介入の効果が本当より良く見える現象です。ホルモン補充療法を選ぶ女性は、治療そのもの以外にも、社会経済的背景、健康行動、医療へのアクセスが異なっていた可能性があります。つまり、観察研究で見えていた保護効果の一部は、ホルモンそのものではなく、治療を選んだ人たちの背景によるものだった可能性があります。
💡 用語解説:健康実践者バイアス
健康実践者バイアスとは、健康に良いとされる行動や予防的介入を選ぶ人が、もともと健康意識や生活習慣、医療アクセスの面で恵まれているため、その介入の効果が実際より良く見えるバイアスです。サプリメント、検診、予防薬、ワクチン研究などで問題になることがあります。
薬の安全性研究:適応による交絡と重症度による交絡
薬剤疫学で特に重要なのが、適応による交絡です。これは、薬が処方された理由そのものがアウトカムに関係している場合に起こります。たとえば、ある薬を使っている人で死亡率が高いという結果があったとしても、その薬が死亡を増やしたとは限りません。もともと重症で予後が悪い人にその薬が処方されていた可能性があります。医師はランダムに薬を選ぶのではなく、患者さんの病状、併存疾患、検査値、予後予測を見て治療を選びます。よい診療ほど、治療選択に臨床判断が入るため、観察研究では交絡が生じます。
重症度による交絡は、適応による交絡の中でも特に、病気の重さが治療選択とアウトカムの両方に影響する状況です。たとえば強力な治療薬が重症患者に使われる場合、その薬を使った群で死亡率が高く見えるかもしれません。しかし、それは薬が危険だからではなく、重症患者に使われていたからかもしれません。このような場合、単に薬の有無を比較するだけでは不十分です。病状の重症度をどれだけ詳細に測定し、解析で考慮できるかが重要になります。
💡 用語解説:適応による交絡
適応による交絡とは、薬や治療が選ばれた理由そのものが、結果にも影響している状態です。重症だから薬が処方され、重症だから予後が悪い場合、薬のせいで予後が悪いように見えることがあります。薬の効果や副作用を観察研究で評価するときに、特に注意が必要な交絡です。
SSRIと自殺リスク:病気そのものの重症度をどう扱うか
精神科領域では、抗うつ薬と自殺リスクの関係を解釈する際に、適応による交絡と重症度による交絡が大きな問題になります。SSRIを処方される人は、そもそも抑うつ症状が強い、希死念慮がある、過去に自殺企図があるなど、薬を処方されない人とは背景が異なります。したがって、SSRI使用者で自殺行動が多く見えたとしても、それが薬の副作用なのか、うつ病そのものの重症度なのかを区別する必要があります。
このような研究では、処方前の症状、過去の自殺念慮、自殺企図歴、併存疾患、精神科受診歴、薬の種類や用量、治療開始からの時間経過などを丁寧に考慮する必要があります。ここでも重要なのは、医師の処方行動がランダムではないことです。安全性が高いと考えられる薬が、むしろリスクの高い患者に選ばれることもあります。観察研究では、治療選択の背景を理解しなければ、薬の効果と病気の重症度を混同してしまいます。
9. よくある誤解:交絡因子を正しく扱うために
誤解①「交絡は統計で完全に消せる」
統計解析で調整できるのは、原則として測定されている交絡因子だけです。重要な背景因子が測定されていなければ、どれほど高度な解析でも残余交絡が残ります。
誤解②「変数は多く調整するほどよい」
中間因子やコライダーまで調整すると、真の効果を消したり、偽の関連を作ったりします。調整する前に、その変数が因果構造のどこにあるかを考える必要があります。
誤解③「大規模データなら交絡は問題にならない」
大規模データは推定を安定させますが、交絡そのものを自動的に消すわけではありません。偏ったデータが大量にあると、誤った結論が精密に出るだけです。
誤解④「遺伝子研究なら交絡は少ない」
遺伝的バリアント自体は生まれたときから決まっていますが、祖先集団、診断されやすさ、検査を受ける背景などが交絡になります。GWASや遺伝子型-表現型相関でも注意が必要です。
よくある質問(FAQ)
🏥 遺伝子検査・研究結果の解釈で迷ったときは
遺伝子検査の結果や医学研究の数字は、背景因子を含めて読むことで意味が変わります。
検査結果の受け止め方、ご家族への説明、研究結果の解釈で迷う場合は、
臨床遺伝専門医による遺伝カウンセリングをご活用ください。
参考文献
- [1] Rothman KJ, Greenland S. Causation and causal inference in epidemiology. American Journal of Public Health. 2005. [PMC1733185]
- [2] Hernán MA, Robins JM. Causal Inference: What If. Boca Raton: Chapman & Hall/CRC. 2020. [Harvard Book Page]
- [3] Greenland S, Pearl J, Robins JM. Causal diagrams for epidemiologic research. Epidemiology. 1999. [PubMed 9888278]
- [4] Pearl J. Causal diagrams for empirical research. Biometrika. 1995. [UCLA PDF]
- [5] Hernán MA, Hernández-Díaz S, Robins JM. A structural approach to selection bias. Epidemiology. 2004. [PubMed 15308962]
- [6] VanderWeele TJ. Mediation Analysis: A Practitioner’s Guide. Annual Review of Public Health. 2016. [PubMed 26653405]
- [7] Austin PC. An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies. Multivariate Behavioral Research. 2011. [PMC3144483]
- [8] Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects. Biometrika. 1983. [Oxford Academic]
- [9] Vandenbroucke JP, Pearce N. Test-negative designs: differences and commonalities with other case-control studies with “other patient” controls. Epidemiology. 2019. [PubMed 30856606]
- [10] Price AL, Zaitlen NA, Reich D, Patterson N. New approaches to population stratification in genome-wide association studies. Nature Reviews Genetics. 2010. [PubMed 20084004]
- [11] Davey Smith G, Ebrahim S. “Mendelian randomization”: can genetic epidemiology contribute to understanding environmental determinants of disease? International Journal of Epidemiology. 2003. [PubMed 12689998]
- [12] Lawlor DA, Harbord RM, Sterne JAC, Timpson N, Davey Smith G. Mendelian randomization: using genes as instruments for making causal inferences in epidemiology. Statistics in Medicine. 2008. [PubMed 17886233]



