目次
「連鎖不平衡(LD)」は、ゲノム上の異なる場所にある遺伝子の組み合わせが、偶然では説明できないほど偏って一緒に受け継がれる現象です。一見すると専門家だけの統計用語に見えますが、じつはGWAS(ゲノムワイド関連解析)・ポリジェニックリスクスコア(PRS)・遺伝子診断の精度を根底で支える、ヒト遺伝医学の最重要概念のひとつです。この記事では、LDの正体から、よく似て混同されがちな2つの指標「D’」と「r²」の違い、そして「なぜ病気の原因となる本当の変異を見つけにくくするのか」までを、一般の方にも遺伝診療に関わる方にもわかるように、遺伝専門医がやさしく解説します。
Q. 連鎖不平衡(LD)とは何ですか?まず結論だけ知りたいです
A. 連鎖不平衡(LD)とは、ゲノム上の別々の場所にある対立遺伝子(アレル)が、集団のなかで独立に組み合わさらず、統計的に偏って一緒に出現する現象です。「近いから一緒に遺伝する」という物理的なつながりだけでなく、組換え・遺伝的浮動・選択・集団の混合といった集団の歴史がゲノムに残した痕跡でもあります。GWASやPRS、遺伝子診断はこのLDを利用して病気に関わる領域を見つけますが、同時にLDは「本当の原因変異」をぼかしてしまうため、単独では因果性の証拠にはなりません。
- ➤LDの正体 → 物理的な近さではなく、組換え・浮動・選択・混合が作る集団遺伝学的な「相関」
- ➤D’とr²の違い → D’は「歴史的な組換えの少なさ」、r²は「一方から他方をどれだけ予測できるか」
- ➤GWASでの役割 → 原因変異そのものでなく、それに連動する目印(タグSNP)で病気の領域を探す
- ➤因果変異同定の壁 → 有意になった目印の多くは「原因変異とLDにあるだけ」のことが多い
- ➤祖先集団による違い → LDの形は集団ごとに異なり、PRSの予測精度の移植性を左右する
1. 連鎖不平衡(LD)とは何か:「近いから一緒に」だけではない
連鎖不平衡(linkage disequilibrium、略してLD)とは、ゲノム上の異なる遺伝子座にある対立遺伝子(アレル)が、集団のなかで独立に組み合わさらず、統計的に偏って一緒に存在する現象を指します。少しかみくだくと、「Aという場所にこのタイプがあると、離れたBという場所でもこのタイプが一緒に来やすい」という特定の組み合わせの“出やすさ”の偏りのことです。多くの人が「連鎖(リンケージ)」という言葉から「染色体上で近いから一緒に遺伝する」というイメージを持ちますが、LDが表しているのはそれだけではありません。
LDは、染色体上の物理的な距離そのものではなく、組換え(くみかえ)・遺伝的浮動・自然選択・移住や集団の混合・人口構造・ボトルネック・突然変異の歴史といった、集団がたどってきた歴史的なできごとがゲノムに残した“痕跡”です。つまりLDは、目の前の1人の遺伝子型を見て決まるものではなく、その人が属する集団全体のハプロタイプ(同じ染色体上に並ぶアレルの並び)の相関として定義される、集団レベルの性質なのです。だからこそLDは、後で述べるGWAS(ゲノムワイド関連解析)やハプロタイプ解析、インピュテーション、fine-mapping、ポリジェニックリスクスコアといった、現代のヒト遺伝医学のほぼすべての解析の基盤になっています。
💡 用語解説:対立遺伝子(アレル)とハプロタイプ
対立遺伝子(アレル)とは、ゲノムの同じ位置(遺伝子座)に存在しうる、塩基配列のバリエーションのことです。たとえば、ある場所が人によって「A」だったり「G」だったりするとき、そのAとGがアレルにあたります。
ハプロタイプとは、同じ1本の染色体の上に並んでいるアレルの“セット”のことです。父由来・母由来それぞれの染色体に並ぶアレルの組み合わせを指し、LDは「どのハプロタイプ(組み合わせ)が、偶然の予想よりも多く/少なく出ているか」を測る考え方だと理解すると分かりやすくなります。
ここで臨床的にもっとも大切なポイントを先に押さえておきます。GWASなどで「病気と強く関連する」と報告される目印(lead SNPと呼ばれる代表的な一塩基多型)の多くは、病気を引き起こしている“本当の原因変異”そのものではなく、その原因変異とLDの関係にある“代理(プロキシ)”であることがほとんどです。つまりLDは、病気に関わる領域を見つける力(発見力)を大きく高めてくれる一方で、「どの変異が本当の犯人なのか」をぼかしてしまう側面も持っています。LDは候補領域を絞り込む強力な統計的道具ですが、それ単独では因果性の証拠にはならない——この二面性が、この記事を貫くいちばん重要なテーマです。
ハーディ・ワインベルグ平衡(HWE)との違い
LDとよく一緒に語られる概念に、ハーディ・ワインベルグ平衡(HWE)があります。両者は混同されがちですが、見ているものがまったく違います。HWEは1つの遺伝子座に注目し、ランダムな交配のもとで期待される遺伝子型の頻度になっているかを見る指標です。一方、LDは2つ以上の遺伝子座のあいだの組み合わせ(ハプロタイプ構造)を見ています。
この違いは実務でも効いてきます。たとえば、各遺伝子座がそれぞれHWEを満たしていても、2つの座のあいだに強いLDが存在することは十分にありえます。さらに、ランダム交配が起きればHWEは原理的にわずか1世代で回復しますが、LDは組換えに依存して世代を追うごとに少しずつしか減りません。中立的な2座位では、世代ごとにおよそ「(1−組換え率)」の割合で幾何級数的に減衰していきます。つまりHWEは“いまの交配のしかた”の指標、LDは“過去から積み重なった歴史的なハプロタイプ構造”の指標なのです。だからこそ、LDのパターンを読むことは、その集団がたどってきた歴史を読むことにもつながります。
2. D’とr²の違い:LDを測る2つのものさし
LDは「ある」「ない」の二択ではなく、強さを数値で測ります。その出発点になるのが係数Dです。2つの座のアレルの組み合わせ(ハプロタイプ)の実際の頻度が、それぞれのアレル頻度をかけ合わせた“もし独立ならこうなるはず”という期待値から、どれだけずれているかを表したものがDです。ずれが大きいほどLDが強い、というのが基本的な考え方です。ただしDは、関係するアレル頻度の影響を強く受けるため、そのままでは異なる座どうしの比較に向きません。そこで実務で広く使われるのが、Dを正規化したD’(ディー・プライム)と、相関の二乗であるr²(アールの二乗)の2つです。この2つは似ているようでいて、意味するところがはっきり異なります。
D’は「歴史的にどれだけ組換えが少なかったか」を、r²は「片方のSNPからもう片方をどれだけ予測できるか」を主に表す。高いD’は高いr²を保証しない点が、解釈上きわめて重要。
D’:歴史的な「組換えの少なさ」のものさし
D’は、遺伝学者ルウォンティンが提案した正規化の指標で、Dをその時点のアレル頻度のもとで理論上とりうる最大値で割ったものです。値は0から1のあいだに収まり、1に近いほど「この2つの座のあいだでは、歴史的に組換えがほとんど起きていない」ことを意味します。言いかえれば、D’は「現在のアレル頻度という条件のもとで、過去にどれだけ組換えが少なかったか」を読む指標です。注意したいのは、希少なアレル(集団のなかでまれにしか見られないタイプ)を含むと、D’は高い値になりやすいという性質があることです。そのため「D’が高い=予測に使える」と短絡してしまうと、解釈を誤ることがあります。
r²:一方から他方を「どれだけ予測できるか」のものさし
一方のr²は、2つの座のあいだの相関係数を二乗したもので、「1つのマーカー(目印のSNP)が、もう一方のSNPをどれだけ言い当てられるか」、すなわちタグとしての予測力を表します。GWASの検出力、タグSNPの選択、LDの間引き(LD pruning)、そしてPRSの構築では、このr²が特に重要になります。なぜなら、私たちが実際に測定したSNPから、測定していない原因変異の状態を推し量れるかどうかは、まさにこのr²にかかっているからです。
ここで決定的に大事なのが、D’が高くてもr²が低い、という状況がごく普通に起こるという事実です。r²はアレル頻度の不一致に強く制約されるため、2つのSNPのアレル頻度が大きく食い違っていると、たとえD’がほぼ1でもr²は低い値にとどまります。これは「歴史的な組換えは少ないけれど、統計的な予測力としては弱い」という状態を意味します。逆に、r²が高い場合は通常D’も高くなります。つまり高いD’は高いr²を保証しないが、高いr²は高いD’をほぼ含意するという非対称な関係があるのです。この性質を知らないと、「D’が高いのだから、このSNPは原因変異のよい代理になるはずだ」と誤って判断してしまいます。
💡 用語解説:タグSNPとは
タグSNPとは、近くにある複数のSNPを“代表”して、それらの状態をまとめて言い当てられる目印のSNPのことです。LDが強い領域では、いくつものSNPが連動して動くため、すべてを測らなくても、代表となる1つを測れば残りの状態をかなり正確に推測できます。これにより、検査するSNPの数を大きく減らしながら、ゲノム全体を効率よくカバーできます。タグSNPがどれだけ“仕事”をしてくれるかは、原因変異とのあいだのr²の高さで決まります。
3. LDを生み、変形させる要因:ゲノムに刻まれた集団の歴史
LDの強さや広がりは、ひとつの要因で決まるわけではありません。組換えによってLDが崩れていく力と、歴史的・人口学的なできごとがLDを生み出し維持する力の、せめぎ合いのバランスで決まります。ヒトでは特に、組換え率が場所によって大きく異なること、集団のサイズが時代とともに変化してきたこと、異なる集団が混ざり合ってきたこと、そして集団ごとに祖先構造が違うことが、医学的に重要なLDのパターンを作り出しています。順に見ていきましょう。
組換え:LDを崩していく主役
減数分裂のときに父由来・母由来の染色体が部分的に入れ替わる「組換え」は、隣り合うアレルの結びつきを断ち切り、世代を追うごとにLDを少しずつ崩していきます。重要なのは、ヒトでは組換えが起こりやすさは場所によって大きく異なり、組換えが集中して起こる「ホットスポット」が存在することです。ホットスポットはLDの急峻な切れ目を作るため、その境界をまたいだ領域では、ある集団で有効だったタグSNPが別の集団ではうまく機能しなくなることがあります。これが、後で述べるfine-mappingの難しさや、祖先集団をまたいだときの予測精度の低下の根っこにあります。
💡 用語解説:組換え(くみかえ)と組換えホットスポット
組換えとは、卵子や精子が作られる減数分裂の過程で、ペアになった染色体どうしが一部を交換し合う現象です。これによって、親が持っていたアレルの並びがシャッフルされ、新しい組み合わせのハプロタイプが生まれます。組換えが特に頻繁に起こるゲノム上の狭い領域を「組換えホットスポット」と呼び、そこを境にLDがスパッと途切れることが知られています。LDが世代とともに薄れていくのは、この組換えが繰り返し起こるからです。
遺伝的浮動・創始者効果・人口構造:LDを生み出し維持する力
一方で、LDを生み出し、長く維持する側の力もあります。遺伝的浮動は、有限の大きさの集団で偶然によってアレルの組み合わせが偏る現象で、物理的に連鎖していてもいなくてもLDを生じさせます。小規模な集団や、海や山で隔てられた孤立集団では、広い範囲にわたってLDが残りやすく、疾患遺伝子を探すときの分解能と検出力の両方に影響します。創始者効果やボトルネック(集団の急激な縮小)も、同じようにLDの範囲を広げる方向に働きます。
さらに見落とされやすいのが人口構造(集団の階層性)です。本来は独立しているはずの2つの座でも、遺伝的背景の異なるサブ集団を混ぜて1つのサンプルとして解析すると、見かけ上のLDが立ってしまいます。これはGWASにおける偽陽性・偽陰性の主要な原因であり、祖先の補正や層別解析でていねいに対処しなければなりません。集団の混合によって生じるこうした見かけの相関は、交絡因子として関連解析の結果を歪める典型例です。総じて、LDは「低い組換え × 小さい実効集団サイズ × 混合・構造・選択」が重なったときに強くなりやすく、逆に大きな集団で高い組換え・長い時間が経過した領域では、LDは短い距離で急速に崩れます。だからこそヒトゲノムのLDは均一ではなく、領域による差・集団による差が大きいのです。
4. GWASとの関係:LDがあるから病気の領域が見つかる
GWAS(ゲノムワイド関連解析)の本質は、病気の原因変異そのものを直接つかまえることではなく、その近くにあってLDを共有しているマーカー(目印)を手がかりに、病気に関連する領域を見つけ出すことにあります。もしLDという現象がなければ、ゲノム上のすべての変異を1つずつ測らなければ関連を見つけられません。しかしLDのおかげで、代表となるタグSNPを測るだけで、その周囲の測っていない変異の状態まで推し量れるのです。これが、限られた数のSNPでゲノム全体を効率よくスキャンできる理由です。
国際的なハプロタイプ地図プロジェクトであるHapMapは、ヒトゲノムの多くの領域が「ブロック状」のLD構造を持ち、高いタグ性能を持つことを示しました。この成果が、商用のSNPアレイ(多数のSNPを一度に測るチップ)やインピュテーション、そしてGWASの設計の根拠になりました。HapMapの第2世代の解析では、測っていない一般的な変異(common variant)を平均で最大0.9〜0.96程度の高い精度で捉えられる一方、組換えホットスポットなどの影響で、一般的な変異の最大1%程度はどうしてもタグできない(untaggable)ことも示されています。LDは万能ではなく、捉えきれない変異が一定数残ることを、最初から織り込んでおく必要があります。
ハプロタイプ解析:単一SNPでは見えない背景を読む
ハプロタイプ解析は、ひとつのSNPだけでは表現しにくい背景情報をまとめて扱うのに役立ちます。LDが強い領域では、病気のリスクはしばしば「単一の変異」ではなく「ハプロタイプという背景の組み合わせ」として観測されるからです。代表例がHLA(主要組織適合遺伝子複合体)領域です。HLA領域は免疫に関わる多くの疾患(自己免疫疾患や薬剤過敏症など)と関連しますが、きわめて強いLD構造を持つため、「どの変異が本当の原因か」を精密に同定することが難しいことが知られています。同様に、認知症との関連で有名なAPOE遺伝子の周辺でも、APOEのε4型だけでは説明しきれない、非コード領域のハプロタイプによる効果が報告されており、単一SNPの統計的有意性だけで臨床的な解釈を確定すべきではない、という教訓を与えてくれます。
5. PRS(ポリジェニックリスクスコア)とLD:予測の精度を左右する
🔍 関連記事:ポリジェニックリスクスコア(PRS)とは/GWAS/SNP
LDは、病気のなりやすさ(感受性)を推定する場面にも直接関わってきます。ここで正確に言葉を選ぶと、LDそのものが「病気の頻度」を推定するわけではありません。LDを使って、ゲノム全体に散らばった病気の感受性に関する遺伝情報を圧縮・推定し、個人の遺伝的な発症確率や相対リスクの予測を改善する、というのが正しい理解です。この考え方を体現するのがポリジェニックリスクスコア(PRS)です。
💡 用語解説:ポリジェニックリスクスコア(PRS)とは
PRS(多遺伝子リスクスコア)とは、ひとつの病気に関わるたくさんの変異の効果を、ゲノム全体にわたって足し合わせて、その人の遺伝的なかかりやすさを1つのスコアにまとめたものです。多くの一般的な病気(生活習慣病や精神疾患など)は、効果の小さなたくさんの変異が積み重なって発症リスクが決まるため、1つの変異ではなく多数をまとめて評価する必要があります。PRSは研究や一部の予測に使われていますが、結果の解釈には集団による精度の差など注意点もあり、慎重な扱いが求められます。
PRSを作るとき、LDを明示的にモデルに組み込むと精度が上がることが分かっています。たとえばLDpredと呼ばれる手法は、単純にLDの強いSNPを間引いたり、統計的なしきい値で機械的にふるい落としたりするやり方では捨ててしまう情報を保持することで、統合失調症や多発性硬化症といった病気の予測性能を改善しました。これはLDがノイズではなく、うまく扱えば予測精度を高める“資源”になりうることを示す好例です。
ただし、その性能は祖先集団のあいだで一様ではありません。これがPRSの最大の課題のひとつです。主にヨーロッパ系集団のデータから作られたPRSは、非ヨーロッパ系集団、特にアフリカ系集団で予測精度が低下しやすいことが繰り返し報告されています。その本質的な原因のひとつが、集団ごとにLDの構造とアレル頻度が異なることです。ある集団で原因変異をよく代理していたタグSNPが、別の集団では組換えの歴史が違うために、もはやよい代理ではなくなってしまう——この「LDのずれ」が、予測性能の移植性を損なう主因になります。PRSを公平に役立てるためには、この祖先差の問題に正面から取り組む必要があります。
6. 因果変異同定の難しさ:LDは諸刃の剣
ここまで見てきたように、LDは病気に関わる領域を見つける力を与えてくれます。しかし同時に、LDは「本当の原因変異」を特定するうえで最大の障害のひとつでもあります。GWASで有意になった座位には、しばしば数十から数百もの候補変異が、ほとんど同じくらいの統計量で横並びになっています。そして、その多くは単に本当の原因変異とLDの関係にあるだけ——つまり「犯人と一緒に歩いていただけの通行人」なのです。この通行人たちの中から真犯人を見つけ出す作業を、fine-mapping(ファインマッピング)と呼びます。
💡 用語解説:fine-mapping(ファインマッピング)とは
fine-mappingとは、GWASで「この領域が病気と関連する」と分かった後に、その領域に並ぶたくさんの候補変異の中から、本当に原因として働いている変異(あるいはその有力候補の集合)を絞り込む解析のことです。LD行列(変異どうしのLDの強さを並べた表)、それぞれの効果の大きさ、ゲノム上の機能の注釈(その場所が遺伝子の働きを調節する領域かどうかなど)、そして集団による違いを総合して、「信頼できる候補のまとまり(credible set)」を作ります。LDによって相関した候補をどう切り分けるかが、fine-mappingの中心的な課題です。
多祖先解析:LDの「違い」を武器にする
この難問に対して、近年とても強力なアプローチとして注目されているのが多祖先(マルチアンセストリー)解析です。発想を逆転させた点が見事で、これまで「ノイズ」「やっかいもの」と見なされがちだった集団間のLDの違いを、むしろ解像度を上げる“資源”として活用します。異なる祖先集団ではLDのパターンが異なるため、たとえ同じ原因変異であっても、それと連動する代理SNPの組み合わせが集団ごとに変わります。この「ずれ」をうまく使うと、複数の集団のデータを重ね合わせたときに、本当の原因変異だけが共通して残り、通行人たちはふるい落とされやすくなるのです。
実際に、SuSiExと呼ばれる手法は、集団に特有のアレル頻度とLDのパターンを明示的にモデル化することで、イギリスのUK Biobankと台湾のTaiwan Biobank、さらには統合失調症の東アジア・ヨーロッパのGWASにおいて、fine-mappingの精度を改善しました。これはLDの「違い」がノイズではなく、解像度向上のための情報源になりうることを、はっきりと示した成果です。日本人を含むアジア集団のGWASも、ヨーロッパ集団では見えにくいLD構造を持つため、新しいシグナルの検出や機能候補の絞り込みに独自の貢献ができます。たとえば全身性強皮症(皮膚や内臓が硬くなる自己免疫疾患)の日本人GWASでは、代表SNPと完全なLDにあるSNPが、ある遺伝子の発現を調節する領域に位置することが報告され、LDが単なるノイズではなく、機能的な変異候補を指し示す手がかりにもなりうることが示されています。
偽陽性と偽陰性:両方のリスクに目を配る
臨床遺伝学の観点からLDを解釈するときのリスクは、偽陽性(本当はないのに関連があるように見える)と偽陰性(本当はあるのに見逃す)の両方にあります。偽陽性は、人口構造や長距離に及ぶLD、局所的な祖先の違い、共変量とのLDによる交絡などから生じます。偽陰性は、原因変異がそもそも測定されていない場合、近くのマーカーとのr²が低い場合、あるいは参照パネルの祖先が合っていなくてタグの仕組みが崩れる場合に起こります。人口構造は偽陽性と本物の関連の見逃しの両方を招きうること、そして集団間のLDの差が検出力とPRSの移植性を落とすことは、複数の研究で繰り返し示されてきました。LDは強力な道具であるからこそ、この二方向のリスクを常に意識しておくことが大切です。
LDの測定とツール:何をどう測るか
LDの推定方法は、ハプロタイプの位相(どのアレルが同じ染色体上にあるか)が分かっているかどうかで変わります。位相が既知なら、ハプロタイプ頻度からD・D’・r²を直接計算できます。位相が分からない場合は、HWEを仮定した制約付きの最尤推定や、EM型の推定、遺伝子型の共分散を使う推定などが用いられます。サンプルサイズも本質的に重要で、有限のサンプルではr²にバイアスが入り、特に小さな標本では補正が欠かせません。前述のとおり、低いMAF(まれなアレル)やアレル頻度の不一致は、r²がとりうる理論上の上限そのものを下げてしまうため、「r²が低い=組換えが多い」と単純に読むことはできません。
実務では、目的に応じてツールを使い分けます。大規模なコホートの前処理やLDの間引きには高速なPLINK、局所的な可視化や教育用途には見やすいHaploview、祖先集団ごとのLDをその場で照会するにはウェブベースのLDlink、VCFファイルを直接扱う前後処理にはvcftools、といった役割分担が自然です。LD解析の前提として、欠測率やサンプルの取り違え、近縁性、性別の不一致、バッチ効果、アレルの反転、異常なHWE逸脱といった品質管理(QC)を丁寧に行うことも欠かせません。これらを放置すると、LDのヒートマップがもっともらしい“人工的な構造”を描き出してしまうことがあるからです。
7. 臨床と診断への接続:LDは遺伝診療のどこに関わるか
🔍 関連記事:遺伝カウンセリングとは/臨床遺伝専門医とは/ヒトゲノムとは
連鎖不平衡は、一見すると研究室の中だけの統計用語に思えるかもしれません。けれども実際には、遺伝子診断・遺伝形式の理解・遺伝カウンセリングのそれぞれに、静かに、しかし確実に関わっています。ここでは、LDが臨床の現場とどうつながっているのかを整理します。
遺伝子診断との関わり:目印と原因を取り違えない
GWASやPRSの結果を診療の文脈で読むとき、もっとも大切な原則は「lead SNP(代表となる目印)を、病原性変異そのものと同一視しない」ことです。LDは候補となる領域を絞り込むための統計的な道具であって、病原性の分類や具体的な管理方針を確定するには、それだけでは足りません。確定のためには、少なくとも、直接そのSNPをタイピング(測定)またはシーケンスすること、祖先の合ったfine-mapping、機能データ、既知の生物学的知見、家系の情報のいずれかを追加して、総合的に判断する必要があります。特に、HLAのように強いLDを持つ領域、APOEのように複雑なハプロタイプ効果を持つ領域、そして周辺のSNPとのLDが弱くなりやすい構造変異(CNVなど)では、この原則がとりわけ重要になります。
遺伝形式・集団差との関わり:日本人にとっての意味
LDの構造が集団ごとに異なるという事実は、日本人を含む東アジア系の人々にとって、けっして他人事ではありません。前述のとおり、ヨーロッパ系集団のデータで作られた予測モデルやタグSNPが、日本人にそのまま当てはまるとは限らないからです。これは検査結果の信頼性や、リスク予測の精度に直結する問題です。一方で、日本人集団に固有のLD構造は、ヨーロッパ集団では見つけにくかった病気の関連シグナルを照らし出す“強み”にもなります。だからこそ、自分たちの集団に合った参照データと解析を用いることが、公正で精度の高い遺伝医療には欠かせません。
遺伝カウンセリングとの関わり:数字の前提を共有する
遺伝子検査やPRSの結果を受け取った方が、その数字の意味を正しく理解し、自分にとっての位置づけを納得して選び取っていくためには、ていねいな遺伝カウンセリングが欠かせません。LDという概念は、「そのスコアがどの集団のデータをもとに、どんな前提で計算されたのか」「目印と原因の関係はどこまで確かなのか」という、結果の信頼性そのものに関わります。ミネルバクリニックでは、臨床遺伝専門医が、こうした前提を分かりやすく共有しながら、一人ひとりの状況に応じた情報提供を行っています。なお、PRSや多くのGWASの知見は、現時点では研究的な性格が強い領域も多く含むため、確定的な断定を避け、エビデンスの段階を正直にお伝えすることを大切にしています。
8. よくある誤解
誤解①「LDは“近いから一緒に遺伝する”だけのこと」
物理的な近さはLDの一因にすぎません。実際には組換え・遺伝的浮動・選択・集団の混合・人口構造といった集団の歴史が複雑にからみ合って生じます。だからこそ、独立な座でも見かけのLDが立つことがあるのです。
誤解②「D’が高ければ予測にも使える」
D’が高くてもr²が低いことは普通に起こります。予測力・タグ性能を見たいなら、見るべきはr²です。アレル頻度が大きく食い違うと、D’がほぼ1でもr²は低くとどまります。
誤解③「有意なSNP=病気の原因変異」
GWASで有意になった目印の多くは、原因変異とLDにあるだけの“代理”です。本当の原因を確定するには、fine-mappingや機能データ、直接のシーケンスなどの追加検証が必要です。
誤解④「海外のPRSは日本人にもそのまま使える」
LDの構造は集団ごとに異なるため、ヨーロッパ系中心のPRSは別の集団で精度が落ちやすいことが知られています。祖先に合った参照データと解析が、公正な予測には欠かせません。
9. 臨床遺伝専門医からのメッセージ
よくある質問(FAQ)
🏥 遺伝子検査・遺伝カウンセリングのご相談
GWASやポリジェニックリスクスコア(PRS)の結果の読み方、
遺伝子検査に関する疑問やご不安は、
臨床遺伝専門医が在籍するミネルバクリニックにお気軽にご相談ください。
参考文献
- [1] Slatkin M. Linkage disequilibrium — understanding the evolutionary past and mapping the medical future. Nature Reviews Genetics. 2008. [PubMed 18427557]
- [2] Pritchard JK, Przeworski M. Linkage disequilibrium in humans: models and data. American Journal of Human Genetics. 2001. [PubMed 11410837]
- [3] Reich DE, et al. Linkage disequilibrium in the human genome. Nature. 2001. [PubMed 11346797]
- [4] The International HapMap Consortium. A haplotype map of the human genome. Nature. 2005. [Nature]
- [5] The International HapMap Consortium. A second generation human haplotype map of over 3.1 million SNPs. Nature. 2007. [Nature]
- [6] Wray NR. Allele frequencies and the r² measure of linkage disequilibrium: impact on design and interpretation of association studies. Twin Research and Human Genetics. 2005. [PubMed 15901470]
- [7] VanLiere JM, Rosenberg NA. Mathematical properties of the r² measure of linkage disequilibrium. Theoretical Population Biology. 2008. [PubMed 18572214]
- [8] Uffelmann E, et al. Genome-wide association studies. Nature Reviews Methods Primers. 2021. [Nature]
- [9] Schaid DJ, Chen W, Larson NB. From genome-wide associations to candidate causal variants by statistical fine-mapping. Nature Reviews Genetics. 2018. [Nature]
- [10] Vilhjálmsson BJ, et al. Modeling linkage disequilibrium increases accuracy of polygenic risk scores. American Journal of Human Genetics. 2015. [PubMed 26430803]
- [11] Duncan L, et al. Analysis of polygenic risk score usage and performance in diverse human populations. Nature Communications. 2019. [Nature Communications]
- [12] Yuan K, et al. Fine-mapping across diverse ancestries drives the discovery of putative causal variants underlying human complex traits and diseases. Nature Genetics. 2024. [Nature Genetics]
- [13] Wigginton JE, Cutler DJ, Abecasis GR. A note on exact tests of Hardy-Weinberg equilibrium. American Journal of Human Genetics. 2005. [PubMed 15789306]
- [14] The 1000 Genomes Project Consortium. A global reference for human genetic variation. Nature. 2015. [Nature]



