InstagramInstagram

連鎖不平衡(LD)とは?GWAS・ハプロタイプ解析・PRSを支える仕組みを遺伝専門医が解説

目次

仲田洋美 医師

この記事の監修:仲田洋美(臨床遺伝専門医)

のべ10万人以上の意思決定に伴走。2025年国際誌『Global Woman Leader』表紙抜擢など、世界基準の出生前診断と遺伝カウンセリングを提供。

「連鎖不平衡(LD)」は、ゲノム上の異なる場所にある遺伝子の組み合わせが、偶然では説明できないほど偏って一緒に受け継がれる現象です。一見すると専門家だけの統計用語に見えますが、じつはGWAS(ゲノムワイド関連解析)・ポリジェニックリスクスコア(PRS)・遺伝子診断の精度を根底で支える、ヒト遺伝医学の最重要概念のひとつです。この記事では、LDの正体から、よく似て混同されがちな2つの指標「D’」と「r²」の違い、そして「なぜ病気の原因となる本当の変異を見つけにくくするのか」までを、一般の方にも遺伝診療に関わる方にもわかるように、遺伝専門医がやさしく解説します。

この記事でわかること
📖 読了時間:約18分
🧬 連鎖不平衡・GWAS・PRS
臨床遺伝専門医監修

Q. 連鎖不平衡(LD)とは何ですか?まず結論だけ知りたいです

A. 連鎖不平衡(LD)とは、ゲノム上の別々の場所にある対立遺伝子(アレル)が、集団のなかで独立に組み合わさらず、統計的に偏って一緒に出現する現象です。「近いから一緒に遺伝する」という物理的なつながりだけでなく、組換え・遺伝的浮動・選択・集団の混合といった集団の歴史がゲノムに残した痕跡でもあります。GWASやPRS、遺伝子診断はこのLDを利用して病気に関わる領域を見つけますが、同時にLDは「本当の原因変異」をぼかしてしまうため、単独では因果性の証拠にはなりません。

  • LDの正体 → 物理的な近さではなく、組換え・浮動・選択・混合が作る集団遺伝学的な「相関」
  • D’とr²の違い → D’は「歴史的な組換えの少なさ」、r²は「一方から他方をどれだけ予測できるか」
  • GWASでの役割 → 原因変異そのものでなく、それに連動する目印(タグSNP)で病気の領域を探す
  • 因果変異同定の壁 → 有意になった目印の多くは「原因変異とLDにあるだけ」のことが多い
  • 祖先集団による違い → LDの形は集団ごとに異なり、PRSの予測精度の移植性を左右する

\ 遺伝子検査・遺伝カウンセリングについて専門医に相談したい方へ /

📅 遺伝カウンセリングを予約する

遺伝子検査に関するご相談:遺伝子検査について

1. 連鎖不平衡(LD)とは何か:「近いから一緒に」だけではない

連鎖不平衡(linkage disequilibrium、略してLD)とは、ゲノム上の異なる遺伝子座にある対立遺伝子(アレル)が、集団のなかで独立に組み合わさらず、統計的に偏って一緒に存在する現象を指します。少しかみくだくと、「Aという場所にこのタイプがあると、離れたBという場所でもこのタイプが一緒に来やすい」という特定の組み合わせの“出やすさ”の偏りのことです。多くの人が「連鎖(リンケージ)」という言葉から「染色体上で近いから一緒に遺伝する」というイメージを持ちますが、LDが表しているのはそれだけではありません。

LDは、染色体上の物理的な距離そのものではなく、組換え(くみかえ)・遺伝的浮動・自然選択・移住や集団の混合・人口構造・ボトルネック・突然変異の歴史といった、集団がたどってきた歴史的なできごとがゲノムに残した“痕跡”です。つまりLDは、目の前の1人の遺伝子型を見て決まるものではなく、その人が属する集団全体のハプロタイプ(同じ染色体上に並ぶアレルの並び)の相関として定義される、集団レベルの性質なのです。だからこそLDは、後で述べるGWAS(ゲノムワイド関連解析)やハプロタイプ解析、インピュテーション、fine-mapping、ポリジェニックリスクスコアといった、現代のヒト遺伝医学のほぼすべての解析の基盤になっています。

💡 用語解説:対立遺伝子(アレル)とハプロタイプ

対立遺伝子(アレル)とは、ゲノムの同じ位置(遺伝子座)に存在しうる、塩基配列のバリエーションのことです。たとえば、ある場所が人によって「A」だったり「G」だったりするとき、そのAとGがアレルにあたります。

ハプロタイプとは、同じ1本の染色体の上に並んでいるアレルの“セット”のことです。父由来・母由来それぞれの染色体に並ぶアレルの組み合わせを指し、LDは「どのハプロタイプ(組み合わせ)が、偶然の予想よりも多く/少なく出ているか」を測る考え方だと理解すると分かりやすくなります。

ここで臨床的にもっとも大切なポイントを先に押さえておきます。GWASなどで「病気と強く関連する」と報告される目印(lead SNPと呼ばれる代表的な一塩基多型)の多くは、病気を引き起こしている“本当の原因変異”そのものではなく、その原因変異とLDの関係にある“代理(プロキシ)”であることがほとんどです。つまりLDは、病気に関わる領域を見つける力(発見力)を大きく高めてくれる一方で、「どの変異が本当の犯人なのか」をぼかしてしまう側面も持っています。LDは候補領域を絞り込む強力な統計的道具ですが、それ単独では因果性の証拠にはならない——この二面性が、この記事を貫くいちばん重要なテーマです。

ハーディ・ワインベルグ平衡(HWE)との違い

LDとよく一緒に語られる概念に、ハーディ・ワインベルグ平衡(HWE)があります。両者は混同されがちですが、見ているものがまったく違います。HWEは1つの遺伝子座に注目し、ランダムな交配のもとで期待される遺伝子型の頻度になっているかを見る指標です。一方、LDは2つ以上の遺伝子座のあいだの組み合わせ(ハプロタイプ構造)を見ています。

この違いは実務でも効いてきます。たとえば、各遺伝子座がそれぞれHWEを満たしていても、2つの座のあいだに強いLDが存在することは十分にありえます。さらに、ランダム交配が起きればHWEは原理的にわずか1世代で回復しますが、LDは組換えに依存して世代を追うごとに少しずつしか減りません。中立的な2座位では、世代ごとにおよそ「(1−組換え率)」の割合で幾何級数的に減衰していきます。つまりHWEは“いまの交配のしかた”の指標、LDは“過去から積み重なった歴史的なハプロタイプ構造”の指標なのです。だからこそ、LDのパターンを読むことは、その集団がたどってきた歴史を読むことにもつながります。

2. D’とr²の違い:LDを測る2つのものさし

LDは「ある」「ない」の二択ではなく、強さを数値で測ります。その出発点になるのが係数Dです。2つの座のアレルの組み合わせ(ハプロタイプ)の実際の頻度が、それぞれのアレル頻度をかけ合わせた“もし独立ならこうなるはず”という期待値から、どれだけずれているかを表したものがDです。ずれが大きいほどLDが強い、というのが基本的な考え方です。ただしDは、関係するアレル頻度の影響を強く受けるため、そのままでは異なる座どうしの比較に向きません。そこで実務で広く使われるのが、Dを正規化したD’(ディー・プライム)と、相関の二乗であるr²(アールの二乗)の2つです。この2つは似ているようでいて、意味するところがはっきり異なります。

D'とr²の違いを示す比較図

D’は「歴史的にどれだけ組換えが少なかったか」を、r²は「片方のSNPからもう片方をどれだけ予測できるか」を主に表す。高いD’は高いr²を保証しない点が、解釈上きわめて重要。

D’:歴史的な「組換えの少なさ」のものさし

D’は、遺伝学者ルウォンティンが提案した正規化の指標で、Dをその時点のアレル頻度のもとで理論上とりうる最大値で割ったものです。値は0から1のあいだに収まり、1に近いほど「この2つの座のあいだでは、歴史的に組換えがほとんど起きていない」ことを意味します。言いかえれば、D’は「現在のアレル頻度という条件のもとで、過去にどれだけ組換えが少なかったか」を読む指標です。注意したいのは、希少なアレル(集団のなかでまれにしか見られないタイプ)を含むと、D’は高い値になりやすいという性質があることです。そのため「D’が高い=予測に使える」と短絡してしまうと、解釈を誤ることがあります。

r²:一方から他方を「どれだけ予測できるか」のものさし

一方のr²は、2つの座のあいだの相関係数を二乗したもので、「1つのマーカー(目印のSNP)が、もう一方のSNPをどれだけ言い当てられるか」、すなわちタグとしての予測力を表します。GWASの検出力、タグSNPの選択、LDの間引き(LD pruning)、そしてPRSの構築では、このr²が特に重要になります。なぜなら、私たちが実際に測定したSNPから、測定していない原因変異の状態を推し量れるかどうかは、まさにこのr²にかかっているからです。

ここで決定的に大事なのが、D’が高くてもr²が低い、という状況がごく普通に起こるという事実です。r²はアレル頻度の不一致に強く制約されるため、2つのSNPのアレル頻度が大きく食い違っていると、たとえD’がほぼ1でもr²は低い値にとどまります。これは「歴史的な組換えは少ないけれど、統計的な予測力としては弱い」という状態を意味します。逆に、r²が高い場合は通常D’も高くなります。つまり高いD’は高いr²を保証しないが、高いr²は高いD’をほぼ含意するという非対称な関係があるのです。この性質を知らないと、「D’が高いのだから、このSNPは原因変異のよい代理になるはずだ」と誤って判断してしまいます。

💡 用語解説:タグSNPとは

タグSNPとは、近くにある複数のSNPを“代表”して、それらの状態をまとめて言い当てられる目印のSNPのことです。LDが強い領域では、いくつものSNPが連動して動くため、すべてを測らなくても、代表となる1つを測れば残りの状態をかなり正確に推測できます。これにより、検査するSNPの数を大きく減らしながら、ゲノム全体を効率よくカバーできます。タグSNPがどれだけ“仕事”をしてくれるかは、原因変異とのあいだのr²の高さで決まります。

3. LDを生み、変形させる要因:ゲノムに刻まれた集団の歴史

LDの強さや広がりは、ひとつの要因で決まるわけではありません。組換えによってLDが崩れていく力と、歴史的・人口学的なできごとがLDを生み出し維持する力の、せめぎ合いのバランスで決まります。ヒトでは特に、組換え率が場所によって大きく異なること、集団のサイズが時代とともに変化してきたこと、異なる集団が混ざり合ってきたこと、そして集団ごとに祖先構造が違うことが、医学的に重要なLDのパターンを作り出しています。順に見ていきましょう。

要因 LDへの典型的な影響 ヒト遺伝医学での意味
突然変異 新しい変異は発生した瞬間、特定のハプロタイプの上に乗るため局所的なLDを作る まれな病的変異や構造変異は、近くのSNPでは十分にタグできないことがある
組換え 世代を追うごとにLDを減衰させる。ホットスポットはLDの急な切れ目を作る タグSNPの移植性が下がり、fine-mappingの境界条件になる
遺伝的浮動 有限の集団では偶然でアレルの組み合わせが偏り、近い座でも遠い座でもLDが生じうる 小集団・孤立集団では広いLDが残り、探索の分解能と検出力の両方に影響
自然選択 選択スイープは有利な変異の周囲に広く伸びたLDを増やす 選択のシグナルを病因と取り違えないため、機能・集団史の検証が必要
移住・混合 最近の混合(admixture)はしばしば長距離に及ぶLDを作る 局所祖先を無視すると、LD参照・インピュテーション・GWAS解釈が歪む
人口構造 サブ集団を混ぜると、独立な座でも見かけ上のLDが立つ 偽陽性・偽陰性の主要因。祖先補正や層別解析が必要
ボトルネック・創始者効果 集団の急減や少数の創始者からの出発はLDの範囲を広げやすい 孤立集団は病因座位の探索に有利な場合があるが、一般集団への外挿は別問題

組換え:LDを崩していく主役

減数分裂のときに父由来・母由来の染色体が部分的に入れ替わる「組換え」は、隣り合うアレルの結びつきを断ち切り、世代を追うごとにLDを少しずつ崩していきます。重要なのは、ヒトでは組換えが起こりやすさは場所によって大きく異なり、組換えが集中して起こる「ホットスポット」が存在することです。ホットスポットはLDの急峻な切れ目を作るため、その境界をまたいだ領域では、ある集団で有効だったタグSNPが別の集団ではうまく機能しなくなることがあります。これが、後で述べるfine-mappingの難しさや、祖先集団をまたいだときの予測精度の低下の根っこにあります。

💡 用語解説:組換え(くみかえ)と組換えホットスポット

組換えとは、卵子や精子が作られる減数分裂の過程で、ペアになった染色体どうしが一部を交換し合う現象です。これによって、親が持っていたアレルの並びがシャッフルされ、新しい組み合わせのハプロタイプが生まれます。組換えが特に頻繁に起こるゲノム上の狭い領域を「組換えホットスポット」と呼び、そこを境にLDがスパッと途切れることが知られています。LDが世代とともに薄れていくのは、この組換えが繰り返し起こるからです。

遺伝的浮動・創始者効果・人口構造:LDを生み出し維持する力

一方で、LDを生み出し、長く維持する側の力もあります。遺伝的浮動は、有限の大きさの集団で偶然によってアレルの組み合わせが偏る現象で、物理的に連鎖していてもいなくてもLDを生じさせます。小規模な集団や、海や山で隔てられた孤立集団では、広い範囲にわたってLDが残りやすく、疾患遺伝子を探すときの分解能と検出力の両方に影響します。創始者効果やボトルネック(集団の急激な縮小)も、同じようにLDの範囲を広げる方向に働きます。

さらに見落とされやすいのが人口構造(集団の階層性)です。本来は独立しているはずの2つの座でも、遺伝的背景の異なるサブ集団を混ぜて1つのサンプルとして解析すると、見かけ上のLDが立ってしまいます。これはGWASにおける偽陽性・偽陰性の主要な原因であり、祖先の補正や層別解析でていねいに対処しなければなりません。集団の混合によって生じるこうした見かけの相関は、交絡因子として関連解析の結果を歪める典型例です。総じて、LDは「低い組換え × 小さい実効集団サイズ × 混合・構造・選択」が重なったときに強くなりやすく、逆に大きな集団で高い組換え・長い時間が経過した領域では、LDは短い距離で急速に崩れます。だからこそヒトゲノムのLDは均一ではなく、領域による差・集団による差が大きいのです。

4. GWASとの関係:LDがあるから病気の領域が見つかる

GWAS(ゲノムワイド関連解析)の本質は、病気の原因変異そのものを直接つかまえることではなく、その近くにあってLDを共有しているマーカー(目印)を手がかりに、病気に関連する領域を見つけ出すことにあります。もしLDという現象がなければ、ゲノム上のすべての変異を1つずつ測らなければ関連を見つけられません。しかしLDのおかげで、代表となるタグSNPを測るだけで、その周囲の測っていない変異の状態まで推し量れるのです。これが、限られた数のSNPでゲノム全体を効率よくスキャンできる理由です。

国際的なハプロタイプ地図プロジェクトであるHapMapは、ヒトゲノムの多くの領域が「ブロック状」のLD構造を持ち、高いタグ性能を持つことを示しました。この成果が、商用のSNPアレイ(多数のSNPを一度に測るチップ)やインピュテーション、そしてGWASの設計の根拠になりました。HapMapの第2世代の解析では、測っていない一般的な変異(common variant)を平均で最大0.9〜0.96程度の高い精度で捉えられる一方、組換えホットスポットなどの影響で、一般的な変異の最大1%程度はどうしてもタグできない(untaggable)ことも示されています。LDは万能ではなく、捉えきれない変異が一定数残ることを、最初から織り込んでおく必要があります。

ハプロタイプ解析:単一SNPでは見えない背景を読む

ハプロタイプ解析は、ひとつのSNPだけでは表現しにくい背景情報をまとめて扱うのに役立ちます。LDが強い領域では、病気のリスクはしばしば「単一の変異」ではなく「ハプロタイプという背景の組み合わせ」として観測されるからです。代表例がHLA(主要組織適合遺伝子複合体)領域です。HLA領域は免疫に関わる多くの疾患(自己免疫疾患や薬剤過敏症など)と関連しますが、きわめて強いLD構造を持つため、「どの変異が本当の原因か」を精密に同定することが難しいことが知られています。同様に、認知症との関連で有名なAPOE遺伝子の周辺でも、APOEのε4型だけでは説明しきれない、非コード領域のハプロタイプによる効果が報告されており、単一SNPの統計的有意性だけで臨床的な解釈を確定すべきではない、という教訓を与えてくれます。

5. PRS(ポリジェニックリスクスコア)とLD:予測の精度を左右する

LDは、病気のなりやすさ(感受性)を推定する場面にも直接関わってきます。ここで正確に言葉を選ぶと、LDそのものが「病気の頻度」を推定するわけではありません。LDを使って、ゲノム全体に散らばった病気の感受性に関する遺伝情報を圧縮・推定し、個人の遺伝的な発症確率や相対リスクの予測を改善する、というのが正しい理解です。この考え方を体現するのがポリジェニックリスクスコア(PRS)です。

💡 用語解説:ポリジェニックリスクスコア(PRS)とは

PRS(多遺伝子リスクスコア)とは、ひとつの病気に関わるたくさんの変異の効果を、ゲノム全体にわたって足し合わせて、その人の遺伝的なかかりやすさを1つのスコアにまとめたものです。多くの一般的な病気(生活習慣病や精神疾患など)は、効果の小さなたくさんの変異が積み重なって発症リスクが決まるため、1つの変異ではなく多数をまとめて評価する必要があります。PRSは研究や一部の予測に使われていますが、結果の解釈には集団による精度の差など注意点もあり、慎重な扱いが求められます。

PRSを作るとき、LDを明示的にモデルに組み込むと精度が上がることが分かっています。たとえばLDpredと呼ばれる手法は、単純にLDの強いSNPを間引いたり、統計的なしきい値で機械的にふるい落としたりするやり方では捨ててしまう情報を保持することで、統合失調症や多発性硬化症といった病気の予測性能を改善しました。これはLDがノイズではなく、うまく扱えば予測精度を高める“資源”になりうることを示す好例です。

ただし、その性能は祖先集団のあいだで一様ではありません。これがPRSの最大の課題のひとつです。主にヨーロッパ系集団のデータから作られたPRSは、非ヨーロッパ系集団、特にアフリカ系集団で予測精度が低下しやすいことが繰り返し報告されています。その本質的な原因のひとつが、集団ごとにLDの構造とアレル頻度が異なることです。ある集団で原因変異をよく代理していたタグSNPが、別の集団では組換えの歴史が違うために、もはやよい代理ではなくなってしまう——この「LDのずれ」が、予測性能の移植性を損なう主因になります。PRSを公平に役立てるためには、この祖先差の問題に正面から取り組む必要があります。

仲田洋美院長

🩺 院長コラム【「あなたの遺伝的リスクは高い」と言われる前に】

遺伝子検査やPRSの結果を持って相談にいらっしゃる方が、少しずつ増えてきました。なかには「アプリでリスクが高いと出たのですが」と、強い不安を抱えて来られる方もいます。私がいつもお伝えするのは、PRSはあくまで集団の統計から導かれた“傾向”であり、その精度は、どの集団のデータをもとに作られたかに大きく左右される、ということです。

特に日本人を含む東アジア系の方にとって、ヨーロッパ系集団中心のデータで作られたスコアは、そのまま当てはまるとは限りません。連鎖不平衡という、いっけん地味な集団遺伝学の概念が、こうして一人ひとりの検査結果の信頼性に直結しているのです。数字の大小だけに振り回されず、その数字がどんな前提の上に成り立っているのかを一緒に確かめることを、私は遺伝カウンセリングで大切にしています。

6. 因果変異同定の難しさ:LDは諸刃の剣

ここまで見てきたように、LDは病気に関わる領域を見つける力を与えてくれます。しかし同時に、LDは「本当の原因変異」を特定するうえで最大の障害のひとつでもあります。GWASで有意になった座位には、しばしば数十から数百もの候補変異が、ほとんど同じくらいの統計量で横並びになっています。そして、その多くは単に本当の原因変異とLDの関係にあるだけ——つまり「犯人と一緒に歩いていただけの通行人」なのです。この通行人たちの中から真犯人を見つけ出す作業を、fine-mapping(ファインマッピング)と呼びます。

💡 用語解説:fine-mapping(ファインマッピング)とは

fine-mappingとは、GWASで「この領域が病気と関連する」と分かった後に、その領域に並ぶたくさんの候補変異の中から、本当に原因として働いている変異(あるいはその有力候補の集合)を絞り込む解析のことです。LD行列(変異どうしのLDの強さを並べた表)、それぞれの効果の大きさ、ゲノム上の機能の注釈(その場所が遺伝子の働きを調節する領域かどうかなど)、そして集団による違いを総合して、「信頼できる候補のまとまり(credible set)」を作ります。LDによって相関した候補をどう切り分けるかが、fine-mappingの中心的な課題です。

多祖先解析:LDの「違い」を武器にする

この難問に対して、近年とても強力なアプローチとして注目されているのが多祖先(マルチアンセストリー)解析です。発想を逆転させた点が見事で、これまで「ノイズ」「やっかいもの」と見なされがちだった集団間のLDの違いを、むしろ解像度を上げる“資源”として活用します。異なる祖先集団ではLDのパターンが異なるため、たとえ同じ原因変異であっても、それと連動する代理SNPの組み合わせが集団ごとに変わります。この「ずれ」をうまく使うと、複数の集団のデータを重ね合わせたときに、本当の原因変異だけが共通して残り、通行人たちはふるい落とされやすくなるのです。

実際に、SuSiExと呼ばれる手法は、集団に特有のアレル頻度とLDのパターンを明示的にモデル化することで、イギリスのUK Biobankと台湾のTaiwan Biobank、さらには統合失調症の東アジア・ヨーロッパのGWASにおいて、fine-mappingの精度を改善しました。これはLDの「違い」がノイズではなく、解像度向上のための情報源になりうることを、はっきりと示した成果です。日本人を含むアジア集団のGWASも、ヨーロッパ集団では見えにくいLD構造を持つため、新しいシグナルの検出や機能候補の絞り込みに独自の貢献ができます。たとえば全身性強皮症(皮膚や内臓が硬くなる自己免疫疾患)の日本人GWASでは、代表SNPと完全なLDにあるSNPが、ある遺伝子の発現を調節する領域に位置することが報告され、LDが単なるノイズではなく、機能的な変異候補を指し示す手がかりにもなりうることが示されています。

偽陽性と偽陰性:両方のリスクに目を配る

臨床遺伝学の観点からLDを解釈するときのリスクは、偽陽性(本当はないのに関連があるように見える)偽陰性(本当はあるのに見逃す)の両方にあります。偽陽性は、人口構造や長距離に及ぶLD、局所的な祖先の違い、共変量とのLDによる交絡などから生じます。偽陰性は、原因変異がそもそも測定されていない場合、近くのマーカーとのr²が低い場合、あるいは参照パネルの祖先が合っていなくてタグの仕組みが崩れる場合に起こります。人口構造は偽陽性と本物の関連の見逃しの両方を招きうること、そして集団間のLDの差が検出力とPRSの移植性を落とすことは、複数の研究で繰り返し示されてきました。LDは強力な道具であるからこそ、この二方向のリスクを常に意識しておくことが大切です。

LDの測定とツール:何をどう測るか

LDの推定方法は、ハプロタイプの位相(どのアレルが同じ染色体上にあるか)が分かっているかどうかで変わります。位相が既知なら、ハプロタイプ頻度からD・D’・r²を直接計算できます。位相が分からない場合は、HWEを仮定した制約付きの最尤推定や、EM型の推定、遺伝子型の共分散を使う推定などが用いられます。サンプルサイズも本質的に重要で、有限のサンプルではr²にバイアスが入り、特に小さな標本では補正が欠かせません。前述のとおり、低いMAF(まれなアレル)やアレル頻度の不一致は、r²がとりうる理論上の上限そのものを下げてしまうため、「r²が低い=組換えが多い」と単純に読むことはできません。

実務では、目的に応じてツールを使い分けます。大規模なコホートの前処理やLDの間引きには高速なPLINK、局所的な可視化や教育用途には見やすいHaploview、祖先集団ごとのLDをその場で照会するにはウェブベースのLDlink、VCFファイルを直接扱う前後処理にはvcftools、といった役割分担が自然です。LD解析の前提として、欠測率やサンプルの取り違え、近縁性、性別の不一致、バッチ効果、アレルの反転、異常なHWE逸脱といった品質管理(QC)を丁寧に行うことも欠かせません。これらを放置すると、LDのヒートマップがもっともらしい“人工的な構造”を描き出してしまうことがあるからです。

7. 臨床と診断への接続:LDは遺伝診療のどこに関わるか

連鎖不平衡は、一見すると研究室の中だけの統計用語に思えるかもしれません。けれども実際には、遺伝子診断・遺伝形式の理解・遺伝カウンセリングのそれぞれに、静かに、しかし確実に関わっています。ここでは、LDが臨床の現場とどうつながっているのかを整理します。

遺伝子診断との関わり:目印と原因を取り違えない

GWASやPRSの結果を診療の文脈で読むとき、もっとも大切な原則は「lead SNP(代表となる目印)を、病原性変異そのものと同一視しない」ことです。LDは候補となる領域を絞り込むための統計的な道具であって、病原性の分類や具体的な管理方針を確定するには、それだけでは足りません。確定のためには、少なくとも、直接そのSNPをタイピング(測定)またはシーケンスすること、祖先の合ったfine-mapping、機能データ、既知の生物学的知見、家系の情報のいずれかを追加して、総合的に判断する必要があります。特に、HLAのように強いLDを持つ領域、APOEのように複雑なハプロタイプ効果を持つ領域、そして周辺のSNPとのLDが弱くなりやすい構造変異(CNVなど)では、この原則がとりわけ重要になります。

遺伝形式・集団差との関わり:日本人にとっての意味

LDの構造が集団ごとに異なるという事実は、日本人を含む東アジア系の人々にとって、けっして他人事ではありません。前述のとおり、ヨーロッパ系集団のデータで作られた予測モデルやタグSNPが、日本人にそのまま当てはまるとは限らないからです。これは検査結果の信頼性や、リスク予測の精度に直結する問題です。一方で、日本人集団に固有のLD構造は、ヨーロッパ集団では見つけにくかった病気の関連シグナルを照らし出す“強み”にもなります。だからこそ、自分たちの集団に合った参照データと解析を用いることが、公正で精度の高い遺伝医療には欠かせません。

遺伝カウンセリングとの関わり:数字の前提を共有する

遺伝子検査やPRSの結果を受け取った方が、その数字の意味を正しく理解し、自分にとっての位置づけを納得して選び取っていくためには、ていねいな遺伝カウンセリングが欠かせません。LDという概念は、「そのスコアがどの集団のデータをもとに、どんな前提で計算されたのか」「目印と原因の関係はどこまで確かなのか」という、結果の信頼性そのものに関わります。ミネルバクリニックでは、臨床遺伝専門医が、こうした前提を分かりやすく共有しながら、一人ひとりの状況に応じた情報提供を行っています。なお、PRSや多くのGWASの知見は、現時点では研究的な性格が強い領域も多く含むため、確定的な断定を避け、エビデンスの段階を正直にお伝えすることを大切にしています。

8. よくある誤解

誤解①「LDは“近いから一緒に遺伝する”だけのこと」

物理的な近さはLDの一因にすぎません。実際には組換え・遺伝的浮動・選択・集団の混合・人口構造といった集団の歴史が複雑にからみ合って生じます。だからこそ、独立な座でも見かけのLDが立つことがあるのです。

誤解②「D’が高ければ予測にも使える」

D’が高くてもr²が低いことは普通に起こります。予測力・タグ性能を見たいなら、見るべきはr²です。アレル頻度が大きく食い違うと、D’がほぼ1でもr²は低くとどまります。

誤解③「有意なSNP=病気の原因変異」

GWASで有意になった目印の多くは、原因変異とLDにあるだけの“代理”です。本当の原因を確定するには、fine-mappingや機能データ、直接のシーケンスなどの追加検証が必要です。

誤解④「海外のPRSは日本人にもそのまま使える」

LDの構造は集団ごとに異なるため、ヨーロッパ系中心のPRSは別の集団で精度が落ちやすいことが知られています。祖先に合った参照データと解析が、公正な予測には欠かせません。

9. 臨床遺伝専門医からのメッセージ

仲田洋美院長

🩺 院長コラム【目印と犯人を、混同しないために】

連鎖不平衡は、遺伝医学を学び始めた人が最初につまずきやすい概念のひとつです。けれども、その本質は意外とシンプルで、「目印(マーカー)と本当の犯人(原因変異)は別物だ」という一点に尽きると、私は思っています。GWASが指し示すのは、たいてい犯人と一緒に歩いていた通行人であって、犯人そのものではありません。

この区別を曖昧にしたまま「有意だから原因だ」と決めつけてしまうと、患者さんやご家族に誤った見通しを伝えてしまいかねません。だからこそ、私たち臨床遺伝専門医は、統計の有意性だけでなく、機能の裏づけや集団による違い、家系の情報まで含めて、ていねいに証拠を積み重ねます。連鎖不平衡という概念を正しく理解することは、遺伝情報を過大にも過小にも評価しないための、静かで確かな足場になってくれるのです。

よくある質問(FAQ)

Q1. 連鎖不平衡(LD)と「連鎖(リンケージ)」は同じものですか?

いいえ、別の概念です。「連鎖」は染色体上で物理的に近い遺伝子座が一緒に受け継がれやすいという物理的なつながりを指します。一方「連鎖不平衡(LD)」は、集団のなかでアレルの組み合わせが偶然の予想より偏って出現する統計的な現象で、物理的な近さだけでなく、組換え・遺伝的浮動・選択・集団の混合といった歴史的な要因によっても生じます。物理的に連鎖していなくても、人口構造などによって見かけのLDが立つことがあります。

Q2. D’とr²は、結局どちらを見ればよいのですか?

目的によります。「歴史的にどれだけ組換えが少なかったか」を知りたいときはD’が向いていますが、「片方のSNPからもう片方をどれだけ予測できるか(タグ性能)」を知りたいときはr²を見ます。GWASの検出力、タグSNPの選択、PRSの構築では、予測力を表すr²が特に重要です。注意点として、D’が高くてもr²が低いことは普通に起こるため、D’の高さだけで「予測に使える」と判断しないことが大切です。

Q3. GWASで有意になったSNPは、病気の原因と考えてよいですか?

必ずしもそうとは限りません。有意になった代表SNP(lead SNP)の多くは、本当の原因変異とLDの関係にある“代理(プロキシ)”であることがほとんどです。1つの領域に数十から数百もの候補変異が同じくらいの統計量で並ぶことも珍しくありません。本当の原因変異を絞り込むには、fine-mappingや機能データ、祖先の合った解析、直接のシーケンスなどを組み合わせた追加検証が必要です。

Q4. 海外で作られた遺伝的リスクスコア(PRS)は、日本人にもそのまま使えますか?

そのまま当てはまるとは限りません。LDの構造とアレル頻度は集団ごとに異なるため、主にヨーロッパ系集団のデータから作られたPRSは、東アジア系やアフリカ系など別の集団では予測精度が低下しやすいことが報告されています。ある集団で原因変異をよく代理していたタグSNPが、別の集団では組換えの歴史が違うために、もはやよい代理ではなくなってしまうことが主な理由です。祖先に合った参照データと解析を用いることが重要です。

Q5. なぜHLA領域では原因の特定が難しいのですか?

HLA(主要組織適合遺伝子複合体)領域は、きわめて強いLD構造を持つことで知られています。多くのアレルが固く連動して動くため、病気と関連するシグナルが出ても、その中のどの変異が本当の原因なのかを切り分けることが難しくなります。HLA領域は免疫に関わる多くの疾患と関連するため臨床的に重要ですが、強いLDのために、単一SNPの統計的有意性だけで解釈を確定すべきではない代表的な領域です。

Q6. 連鎖不平衡を学ぶと、遺伝子検査の何が分かるようになりますか?

遺伝子検査やリスク予測の結果を「どこまで信頼してよいか」を見極める目が養われます。LDを理解すると、検査が見ているのが原因変異そのものなのか、それとも代理の目印なのか、そしてその結果がどの集団のデータを前提にしているのかを意識できるようになります。これは数字の大小に振り回されず、結果を冷静に位置づけるうえで役立ちます。具体的な結果の解釈については、臨床遺伝専門医による遺伝カウンセリングでご相談いただけます。

Q7. ハーディ・ワインベルグ平衡(HWE)とLDは何が違うのですか?

HWEは「1つの遺伝子座」に注目し、ランダム交配のもとで期待される遺伝子型の頻度になっているかを見る指標です。一方LDは「2つ以上の遺伝子座のあいだ」のハプロタイプ構造を見ます。各座がそれぞれHWEを満たしていても、座と座のあいだに強いLDがあることはありえます。また、HWEはランダム交配で1世代で回復しうるのに対し、LDは組換えに依存して少しずつしか減衰しません。HWEは“いまの交配のしかた”、LDは“歴史的なハプロタイプ構造”の指標だと整理できます。

Q8. 集団によってLDが違うことは、デメリットばかりですか?

いいえ、使い方しだいで大きな強みにもなります。確かに、集団間のLDの違いはPRSの移植性を下げるなどの課題を生みます。しかし、異なる集団ではLDのパターンが違うことを逆手に取ると、複数集団のデータを重ねたときに本当の原因変異だけが共通して残りやすくなり、fine-mappingの精度が上がります。実際、集団に特有のアレル頻度とLDを明示的にモデル化する手法が、因果候補の絞り込みを改善した例が報告されています。LDの「違い」は、ノイズにも資源にもなりうるのです。

🏥 遺伝子検査・遺伝カウンセリングのご相談

GWASやポリジェニックリスクスコア(PRS)の結果の読み方、
遺伝子検査に関する疑問やご不安は、
臨床遺伝専門医が在籍するミネルバクリニックにお気軽にご相談ください。

参考文献

  • [1] Slatkin M. Linkage disequilibrium — understanding the evolutionary past and mapping the medical future. Nature Reviews Genetics. 2008. [PubMed 18427557]
  • [2] Pritchard JK, Przeworski M. Linkage disequilibrium in humans: models and data. American Journal of Human Genetics. 2001. [PubMed 11410837]
  • [3] Reich DE, et al. Linkage disequilibrium in the human genome. Nature. 2001. [PubMed 11346797]
  • [4] The International HapMap Consortium. A haplotype map of the human genome. Nature. 2005. [Nature]
  • [5] The International HapMap Consortium. A second generation human haplotype map of over 3.1 million SNPs. Nature. 2007. [Nature]
  • [6] Wray NR. Allele frequencies and the r² measure of linkage disequilibrium: impact on design and interpretation of association studies. Twin Research and Human Genetics. 2005. [PubMed 15901470]
  • [7] VanLiere JM, Rosenberg NA. Mathematical properties of the r² measure of linkage disequilibrium. Theoretical Population Biology. 2008. [PubMed 18572214]
  • [8] Uffelmann E, et al. Genome-wide association studies. Nature Reviews Methods Primers. 2021. [Nature]
  • [9] Schaid DJ, Chen W, Larson NB. From genome-wide associations to candidate causal variants by statistical fine-mapping. Nature Reviews Genetics. 2018. [Nature]
  • [10] Vilhjálmsson BJ, et al. Modeling linkage disequilibrium increases accuracy of polygenic risk scores. American Journal of Human Genetics. 2015. [PubMed 26430803]
  • [11] Duncan L, et al. Analysis of polygenic risk score usage and performance in diverse human populations. Nature Communications. 2019. [Nature Communications]
  • [12] Yuan K, et al. Fine-mapping across diverse ancestries drives the discovery of putative causal variants underlying human complex traits and diseases. Nature Genetics. 2024. [Nature Genetics]
  • [13] Wigginton JE, Cutler DJ, Abecasis GR. A note on exact tests of Hardy-Weinberg equilibrium. American Journal of Human Genetics. 2005. [PubMed 15789306]
  • [14] The 1000 Genomes Project Consortium. A global reference for human genetic variation. Nature. 2015. [Nature]

関連記事

用語解説GWAS(ゲノムワイド関連解析)LDを利用して病気に関わる領域を見つけるGWASの仕組みを解説します。用語解説ハプロタイプ同じ染色体上に並ぶアレルのセット。LDが観測される基本単位です。用語解説ポリジェニックリスクスコア(PRS)多数の変異の効果を足し合わせて遺伝的リスクを評価する手法を解説。用語解説SNP(一塩基多型)LDの測定対象となる、ゲノム上の1塩基の個人差を解説します。用語解説ハーディ・ワインベルグ平衡LDと混同されやすい、単一座位の遺伝子型頻度の平衡を解説します。用語解説遺伝的浮動偶然によってLDを生み出す集団遺伝学的な要因のひとつを解説します。

仲田洋美 医師(臨床遺伝専門医)

この記事の監修・執筆者:仲田 洋美

(臨床遺伝専門医/がん薬物療法専門医/総合内科専門医)

ミネルバクリニック院長。1995年に医師免許を取得後、 臨床遺伝学・内科学・腫瘍学を軸に診療を続けてきました。 のべ10万人以上のご家族の意思決定と向き合ってきた臨床遺伝専門医です。

出生前診断(NIPT・確定検査・遺伝カウンセリング)においては、 検査結果の数値そのものだけでなく、 「結果をどう受け止め、どう生きるか」までを医療の責任と捉え、 一貫した遺伝カウンセリングと医学的支援を行っています。

ハイティーンの時期にベルギーで過ごし、 日本人として異文化の中で生活した経験があります。 価値観や宗教観、医療への向き合い方が国や文化によって異なることを体感しました。 この経験は現在の診療においても、 「医学的に正しいこと」と「その人にとって受け止められること」の両立を考える姿勢の基盤となっています。

また、初めての妊娠・出産で一卵性双生児を妊娠し、 36週6日で一人を死産した経験があります。 その出来事は、妊娠・出産が女性の心身に与える影響の大きさ、 そして「トラウマ」となり得る体験の重みを深く考える契機となりました。 現在は、女性を妊娠・出産のトラウマから守る医療を使命の一つとし、 出生前診断や遺伝カウンセリングに取り組んでいます。

出生前診断は単なる検査ではなく、 家族の未来に関わる重要な意思決定です。 年齢や統計だけで判断するのではなく、 医学的根拠と心理的支援の両面から、 ご家族が後悔の少ない選択をできるよう伴走することを大切にしています。

日本人類遺伝学会認定 臨床遺伝専門医/日本内科学会認定 総合内科専門医/ 日本臨床腫瘍学会認定 がん薬物療法専門医。 2025年には APAC地域における出生前検査分野のリーダーとして国際的評価を受け、 複数の海外メディア・専門誌で特集掲載されました。

お電話での受付可能
診療時間
午前 10:00~14:00
(最終受付13:30)
午後 16:00~20:00
(最終受付19:30)
休診 火曜・水曜

休診日・不定休について

クレジットカードのご利用について

publicブログバナー
 
medicalブログバナー
 
NIPTトップページへ遷移