InstagramInstagram

ハーディ・ワインベルグ平衡とは?遺伝子型頻度の基準モデルと検定法をわかりやすく解説

目次

仲田洋美 医師

この記事の監修:仲田洋美(臨床遺伝専門医)

のべ10万人以上の意思決定に伴走。国際医療誌『Medical Care Review APAC』『Global Woman Leader』の2誌で表紙を飾り、「Top Prenatal Testing Service in APAC 2025」に選出されるなど、世界基準の遺伝医療を提供。

ハーディ・ワインベルグ平衡(Hardy–Weinberg equilibrium, HWE)は、1908年に英国の数学者G. H. Hardyとドイツの医師Wilhelm Weinbergが独立に示した、集団遺伝学の土台となる基準モデルです。「ランダム交配・選択なし・突然変異なし」などの条件が満たされるとき、集団の遺伝子型頻度はアレル頻度だけから計算できるという法則で、現代ではGWAS(全ゲノム関連解析)の品質管理、保因者スクリーニングにおける罹患頻度の推算、NIPTのアレル頻度解析、法医学の確率計算まで幅広く使われています。「現実の集団が常に満たすべき法則」ではなく、そこからの逸脱を解釈するための帰無モデルであることが本質です。

この記事でわかること
📖 読了時間:約20分
🧬 集団遺伝学・HWE・遺伝子検査QC
臨床遺伝専門医監修

Q. ハーディ・ワインベルグ平衡とは何ですか?まず結論だけ知りたいです

A. ランダム交配・有限集団・選択なし等の条件下では、集団の遺伝子型頻度(AA・Aa・aa)はアレル頻度 p・q から p²:2pq:q² の比で予測できるというモデルです。重要なのは「現実の集団がいつも満たす」法則ではなく、ここからの逸脱が選択・近交・集団構造・ジェノタイピング誤差を示すシグナルになるという点です。遺伝子検査の品質管理や保因者頻度の推算など、臨床遺伝の現場に直結する概念です。

  • 基本の数式 → p² + 2pq + q²=1。1世代のランダム交配で到達し、条件が守られれば永続する
  • 逸脱の原因 → 自然選択・遺伝的浮動・近交・集団構造(Wahlund効果)・ジェノタイピング誤差
  • 検定法 → カイ二乗検定・正確検定(exact test)・mid-p・尤度比検定のそれぞれの適用場面
  • 臨床応用 → 保因者頻度の推算、GWAS品質管理、NIPTアレル頻度解析、法医学の確率計算
  • 実務上の注意 → 混合集団での一括検定は擬陽性が増える。大規模biobank では固定閾値の乱用に要注意

\ 遺伝子検査・遺伝カウンセリングについてご相談したい方へ /

📅 遺伝カウンセリングを予約する

出生前診断・遺伝子検査に関するご相談:遺伝子検査について

1. ハーディ・ワインベルグ平衡とは何か:歴史と本質

1900年代初頭、メンデルの法則が再発見されると、ある誤解が広まりました。「優性の遺伝子は世代を重ねるごとに増え、劣性遺伝子は減っていくのではないか」という考えです。この誤解に対して、英国の数学者G. H. Hardy(1908年)と、ドイツの産婦人科医Wilhelm Weinberg(1908年)が独立に明快な答えを示しました。「ランダム交配が行われる大きな集団では、対立遺伝子(アレル)の頻度は世代が替わっても変化しない。遺伝子型頻度はアレル頻度だけから計算できる」という、いまでいうハーディ・ワインベルグ平衡(HWE)です。

Hardyの論文は1908年に『Science』誌に短報として掲載されました。Weinbergは同年、ドイツ語論文(Jahreshefte des Vereins für vaterländische Naturkunde in Württemberg)で独立に同値の命題を提示しています。英語圏での認知はHardy側が先行しましたが、Weinbergの優先性は後年の歴史研究で十分に評価されました。[3] 実は両者の発見は数学的には「二項定理にすぎない」と言われますが、「観測値を解釈するためのゼロモデルを与えた」という生物学的意義が本質です。HWEがあってこそ、選択・突然変異・近交・偶然効果などの影響を検出・定量できるようになりました。

💡 用語解説:帰無モデル(きむもでる)とは

「何も特別なことが起きていない場合に期待される状態」を示す基準点のモデルのことです。HWEは「選択も近交も集団混合もジェノタイピング誤差もない理想集団」を前提にしています。実際の集団がHWEからどれだけ外れているかを測ることで、「何か特別なことが起きている(選択・近交・誤差など)」かどうかを統計的に検定できます。野球のバッターでたとえると、打率 .250 が「理論上の期待値(帰無モデル)」だとして、ある打者が .350 なら「何か特別な要因がある」と解釈するようなイメージです。

HWEが臨床遺伝に直結する理由

HWEは純粋な基礎科学にとどまらず、遺伝診療の現場に深く根付いています。保因者スクリーニングでは、HWEを前提として病気の頻度(例:嚢胞性線維症の発症率 1/2500)から保因者頻度を逆算します(保因者頻度 ≈ 2pq ≈ 1/25)。NIPTで使われるアレル頻度解析も同様です。また大規模なゲノム解析(GWAS)では、HWEからの逸脱が大きいマーカーはジェノタイピング誤差の可能性があるとして品質管理(QC)フィルタにかけられます。HWEを知らないまま遺伝子検査の結果を解釈することはできない、それほど基礎的かつ実用的な概念なのです。

2. HWEの数理的基盤:p²+2pq+q² の導出と成立条件

二対立遺伝子座位の基本モデル

常染色体の1つの遺伝子座位に、対立遺伝子(アレル)AとaがあるとするとAの頻度を p、aの頻度を q(p+q=1)とおきます。現世代の遺伝子型が AA・Aa・aa の3種類あり、それぞれの頻度を P・H・R とします(P+H+R=1)。[1]

ここでランダム交配(受精がランダムな配偶子の結合と同値)を仮定します。ランダムな配偶子プールでは、A の配偶子が頻度 p、a の配偶子が頻度 q で存在します。次世代の接合体(受精卵)は配偶子を無作為に2個引いたものなので:

遺伝子型 計算式 意味
AA(ホモ接合・優性) A配偶子 × A配偶子の確率
Aa(ヘテロ接合) 2pq A×a と a×A の2通りの確率の和
aa(ホモ接合・劣性) a配偶子 × a配偶子の確率

p² + 2pq + q² = (p+q)² = 1² = 1 となり、これがハーディ・ワインベルグ比です。重要なのは、どのような初期遺伝子型頻度から出発しても、常染色体の1座位では1世代のランダム交配でこの比に達するという点です。[2]

💡 用語解説:ホモ接合体とヘテロ接合体

ホモ接合体(Homozygote)は同じ対立遺伝子を2つ持つ状態(AA または aa)。ヘテロ接合体(Heterozygote)は異なる対立遺伝子を1つずつ持つ状態(Aa)。HWEでは、ヘテロ接合体の頻度 2pq が観測値と期待値で大きくずれるとき(ヘテロ接合体不足またはヘテロ接合体過剰)が「逸脱」のシグナルとなります。遺伝診療では、保因者(キャリア)はヘテロ接合体のことが多く、この概念の理解は保因者頻度の計算に直結します。

多対立遺伝子への拡張

現実の遺伝子座位は2種類のアレルしか持たないとは限りません。k 個のアレル A₁, …, Aₖ が存在するとき、それぞれの頻度を p₁, …, pₖ とすれば、HWE下の期待遺伝子型頻度は以下のように二項分布を多項分布に一般化した形で表されます。[2]

  • ホモ接合体(AᵢAᵢ)の期待頻度:pᵢ²
  • ヘテロ接合体(AᵢAⱼ, i≠j)の期待頻度:2pᵢpⱼ

血液型(ABO 型:A・B・O の3アレル)でイメージすると分かりやすいでしょう。日本人集団の A・B・O それぞれの頻度が既知なら、AA・AO・BB・BO・AB・OO 各遺伝子型の期待頻度がすぐに計算できます。ジェノタイピングの現場では、多アレル STR(短鎖反復配列)マーカーなどで頻繁に登場します。

HWEが成立するための6つの条件

HWEは以下の理想的条件を前提とします。これらは「逸脱の原因を読み解くための解釈フレーム」であり、現実の集団が全て満たすと仮定するわけではありません。[4]

仮定 破れたときに起こりやすいこと 典型的な HWE シグナル
ランダム交配 近交・同類交配・異類交配 ヘテロ接合体不足(近交)またはヘテロ接合体過剰(異類交配)
十分な集団サイズ 遺伝的浮動(Genetic drift) 反復間での頻度変動・固定化・HWE逸脱の増大
単一集団(移住なし) 集団混合・集団層別化 Wahlund効果によるヘテロ接合体不足
突然変異なし 高変異率マーカー・突然変異-浮動非平衡 通常は微小。STR では無視できないことがある
自然選択なし 生存・繁殖適応度の差 成体サンプルで HWE 逸脱(ヘテロ接合体過剰・不足どちらも)
正確なジェノタイピング アレルドロップアウト・クロスハイブリダイゼーション・CNV 極端なヘテロ接合体不足や過剰・欠測率との相関

💡 用語解説:Wahlund効果(ワールンド効果)

異なるアレル頻度を持つ複数の下位集団を1つにまとめて解析すると、各下位集団の内部では HWE が成立していても、全体ではヘテロ接合体が「期待より少ない」(ヘテロ接合体不足)として現れる現象です。例えば日本人と欧米人が混在するデータセットを区別せずに HWE 検定すると、民族の違いによる頻度差だけで有意な逸脱が出てしまいます。GWAS・NGS 解析では集団層別化をしてから HWE 検定をかけることが必須です。[6]

X染色体と常染色体の違い

常染色体では1世代のランダム交配で HWE に到達しますが、X染色体では雌雄で初期頻度が異なると振動しながら収束します。したがってX染色体マーカーには常染色体用のカイ二乗検定をそのまま適用できません。X連鎖遺伝子の解析では性別を分けた専用の検定が必要で、これを見落とすと誤った QC フラグが立つ原因になります。[2]

3. HWE逸脱の原因と意味:「異常」ではなく「シグナル」として読む

HWE逸脱は「データが悪い」というシグナルだけではありません。Waples(2015)は「研究者がしばしば HWE の目的・検出力・多重検定・原因の識別を十分理解しないまま機械的に使ってしまう」と問題視しています。[4] 以下の各原因ごとに、逸脱の方向と対処法が異なります。

① 自然選択(Selection)

生存選択が働くと、接合体段階では HWE でも、選択後に観察した成体サンプルでは HWE から外れます。単一座位選択モデルでは各遺伝子型に適応度 Wᵢⱼ を掛け、平均適応度で正規化した後が実際の観察値になります。Abramovs ら(2020)は gnomAD 規模のデータで、ヘテロ接合体過剰を示す変異が常染色体劣性(潜性)疾患関連遺伝子に濃縮され、HBBやCFTRでヘテロ接合体優位(雑種強勢)を示唆するパターンを報告しています。[7] つまり HWE 逸脱が「遺伝子検査の精度問題」ではなく「生物学的に重要な選択圧のシグナル」である可能性があります。

💡 用語解説:雑種強勢(ざっしゅきょうせい)

ヘテロ接合体(Aa)が、ホモ接合体(AA または aa)よりも生存・繁殖上有利になる現象です。鎌状赤血球症の原因となる HBB 遺伝子変異がその典型例で、マラリア流行地ではヘテロ接合体キャリアがマラリアに抵抗性を持つため自然選択上有利になります。このためアフリカ系集団では HWE の期待より多い頻度でヘテロ接合体が見られ、HWE 逸脱として統計に現れることがあります。

② 遺伝的浮動と有限集団サイズ

有限集団では、ランダム交配が行われていても世代ごとの標本誤差(遺伝的浮動)が無視できず、反復間で遺伝子型頻度が揺らぐため、実際のサンプルが HWE から有意に外れることがあります。ボトルネック効果(集団サイズが極端に縮小した後に拡大)が起きた集団では、特定のアレルが偶然固定・消失し、HWE から外れることが典型的です。小標本では逸脱が増えやすく、HWE 逸脱の「有意性」と「生物学的意義」を区別する必要があります。[2]

③ 移住・集団混合・Wahlund効果

異なるアレル頻度を持つ下位集団をまとめて解析すると、全体ではヘテロ接合体不足として現れます(Wahlund効果)。Pearman ら(2022)は RADseq の実データと in silico データで、下位集団を混ぜたまま HWE 逸脱座位を除去すると、集団構造推定そのものが歪むことを示しました。[8] 「HWE フィルタを何となく掛ける」慣習に再考を迫る重要な知見です。

④ 非ランダム交配(近交・同類交配)

近交(血縁者間の交配)や正の同類交配(表現型・民族性・社会的要因に基づく同じ群内での交配選好)は通常ヘテロ接合体不足とホモ接合体過剰をもたらします。Yengo らはヒトゲノム規模データで、同類交配が因果座位で HWE 逸脱とホモ接合性増加を引き起こしうることを示しています。[5]

⑤ ジェノタイピング誤差(最も実務的に重要な原因)

技術的アーチファクトは HWE 逸脱の最も重要な実務的原因の一つです。Hosking ら(2004)は、HWE 検定がジェノタイピング誤差検出に有効であることを実証。Chen ら(2017)は大規模 ExAC/1000 Genomes 解析から、ヘテロ接合体過剰はジェノタイピング誤差を示唆しやすく、ヘテロ接合体不足は集団下位構造やコピー数変動(deletion polymorphism)を示唆しやすいという実務上有用なパターンを報告しています。[9]

💡 用語解説:アレルドロップアウトとコピー数変動(CNV)

アレルドロップアウトとは、PCR増幅時に片方のアレルだけが増幅されず、ヘテロ接合体がホモ接合体として誤認される技術的誤差です。低品質の DNA サンプルや設計の悪いプライマーで起こりやすく、結果として HWE 検定でヘテロ接合体不足として現れます。コピー数変動(Copy Number Variation, CNV)は、染色体の一部が重複または欠失してゲノムコピー数が2以外になる状態。CNV 領域にある SNP では、コピー数が異常な個体が誤った遺伝子型として記録され、HWE 逸脱の原因となります。

HWE 逸脱を発見した際は「除外して終わり」ではなく、クラスタープロット・欠測率・CNV を確認してから判断することが最善です。[5]

仲田洋美院長

🩺 院長コラム【HWE逸脱を「品質不良の証拠」と即断しないでほしい理由】

臨床遺伝専門医として遺伝カウンセリングを行う立場から、一つお伝えしたいことがあります。大規模な遺伝子解析データを使った研究を見ていると、「HWE からずれたマーカーは全て品質不良として除外」という処理が機械的に行われていることがあります。でもそれは、生物学的に重要な選択圧のシグナルを丸ごと捨てていることにもなりかねません。

HBB(鎌状赤血球)や CFTR(嚢胞性線維症)のように、ヘテロ接合体優位の選択が働いている遺伝子座では、HWE 逸脱は「エラー」ではなく「自然選択の痕跡」です。逸脱を見つけたら除外で終わらせず、その原因を追うことが、集団の遺伝的背景を理解する上でも、保因者頻度の正確な推算のためにも不可欠です。

4. HWE検定法の種類と使い分け:カイ二乗・正確検定・mid-p・尤度比

HWE からの統計的逸脱を評価する検定法には、Pearson のカイ二乗検定・条件付き正確検定(exact test)・mid-p 値・尤度比検定(LRT)の4つが主に用いられます。[3] どれを選ぶかは標本サイズとマイナーアレル頻度(MAF)に依存します。

① Pearsonのカイ二乗検定

最も古典的で計算が速い手法です。観測カウント Oᵍ と HWE 下期待カウント Eᵍ を比べる統計量を使います:

χ² = Σ (Oᵍ − Eᵍ)² / Eᵍ

二対立遺伝子・常染色体なら自由度 1 で検定します。ただし期待度数が5未満のセルが出る場合(低 MAF・小標本)はカイ二乗近似が不安定になりやすく、Wigginton ら(2005)は exact test のほうが第I種過誤(偽陽性)を守りやすいと示しています。[3]

💡 用語解説:自由度と第I種過誤

自由度(degrees of freedom, df)は「カテゴリ数からパラメータ推定数を引いた値」です。3遺伝子型(AA・Aa・aa)のカテゴリ数は3ですが、アレル頻度 p を標本から推定するため、自由度は 3−1−1=1 となります。第I種過誤(Type I error)は「本当は HWE なのに有意差ありと判定してしまう(偽陽性)確率」のこと。有意水準 α を下回るはずが実際はそれを超えてしまう状態を「名目水準を守れていない」と表現します。

カイ二乗検定は漸近近似に基づくため、期待度数が小さい(≒ MAF が低い・標本が小さい)条件では近似が崩れ、第I種過誤が膨らみやすくなります。

② 条件付き正確検定(Exact Test)

二対立遺伝子座位では、総標本数 N とA対立遺伝子数 nA を固定したとき、ヘテロ接合体数 nAB の条件付き確率は Levene–Haldane 分布に従います。Wigginton ら(2005)の定式化では、観測標本と同じかそれ以下の条件付き確率を持つ全構成の確率和として両側 exact p 値を計算します。[3]

exact test の強みは小標本・低 MAF に強く、nominal level を安定して守ることです。弱点は離散的な分布の性質から保守的(p 値が大きめに出やすい)になりやすいこと。PLINK 1.9/2.0 では実務上 mid-p の利用を推奨しています。[10]

③ mid-p 値

Graffelman と Moreno(2013)は、mid-p 値(標準的な exact p 値から観測事象の確率の半分を引いた値)が standard exact よりも nominal level に近い振る舞いを示すことを報告しました。[6] SNP QC の実務では「保守性を少し緩めつつ exact の利点を生かす」折衷案として広く使われています。

④ 尤度比検定(LRT)

HWEの制約付きモデルと、遺伝子型頻度を自由に推定する飽和モデルを比較する検定です。統計量 G² = 2Σ Oᵍ log(Oᵍ/Eᵍ) は漸近的にカイ二乗分布に従い、十分な標本サイズではカイ二乗検定と非常に近い結果になります。大標本・中等度アレル頻度では両者の差は小さく、どちらを使っても結論は変わりません。[3]

多対立遺伝子での exact test

多対立遺伝子では全構成の完全列挙が急激に重くなるため、Guo と Thompson(1992)は Markov chain/Monte Carlo ベースの実用的 exact algorithm を提案しました。[11] STR(マイクロサテライト)や ABO 血液型のようなマルチアレル系では特にこのアルゴリズムが重要です。

検定法 強み 限界 向いている状況
カイ二乗検定 速い・説明しやすい 低 MAF・小標本で不安定 中〜大標本・期待度数が十分なとき
正確検定(Exact) 低 MAF・小標本に強い 保守的になりやすい 低 MAF・QC 用途全般
mid-p exact 名目水準に近い・実務的 厳密な保守性を失う SNP QC・PLINK 実務
尤度比検定(LRT) モデル比較として自然 疎なセルでは漸近の問題 中〜大標本・モデル志向の解析

大規模データでの落とし穴

UK Biobank のような数十万人規模のデータでは、固定閾値(例:p < 10⁻⁶)の一律 HWE フィルタが本物の関連シグナルまで除去しうることが近年繰り返し警告されています。PLINK 2.0 が sample-size-aware 閾値を導入したのもこのためです。[10] また構造的多様性の高い admixed サンプル(多民族混合集団)では、Kwong ら(2021)の RUTH のように集団構造とジェノタイピング不確実性を同時に調整した手法が推奨されます。[12]

5. 数値計算例で完全理解:χ²・LRT・exact test を手で解く

二対立遺伝子座位の例

常染色体一座位で、200人のサンプルから得た観測遺伝子型数が以下のとおりだったとします:AA=95、Aa=70、aa=35、N=200[3]

ステップ1:アレル頻度を計算する

p = (2×95+70) / (2×200) = 260/400 = 0.65、q = 0.35

ステップ2:HWE 期待カウントを計算する

E(AA) = 200×0.65² = 84.5、E(Aa) = 200×2×0.65×0.35 = 91.0、E(aa) = 200×0.35² = 24.5

ステップ3:カイ二乗値を計算する

χ² = (95−84.5)²/84.5 + (70−91.0)²/91.0 + (35−24.5)²/24.5 ≈ 1.30+4.85+4.50 = 10.65

自由度1の χ² 分布で p 値は約 0.0011(有意)。尤度比検定 G² ≈ 10.49 で p ≈ 0.0012 とほぼ同じ結論です。exact test の両側 p 値は約 0.0017、mid-p 値は約 0.0014 となります。いずれの検定でも有意で、ヘテロ接合体(観測70 vs 期待91)の不足が主なシグナルです。

📌 この結果の解釈フロー

  • ヘテロ接合体が期待より少ない(観測70 < 期待91)→ 近交・集団混合(Wahlund)・ヘテロ接合体を検出できないジェノタイピング誤差のいずれかを疑う
  • 次の確認ステップ:欠測率のチェック・クラスタープロット確認・他マーカーとの比較・サンプルの民族構成の確認
  • 「有意差=即除外」は最悪の実務判断。原因が生物学的なら貴重な情報を捨てることになる

三対立遺伝子座位の例

三対立遺伝子 A・B・C をもつ座位で、N=100 のサンプルから得た観測値:AA=25、AB=20、AC=24、BB=18、BC=9、CC=4。

アレル頻度:pA=94/200=0.47、pB=65/200=0.325、pC=41/200=0.205。期待カウント:E(AA)≈22.09、E(AB)≈30.55、E(AC)≈19.27、E(BB)≈10.56、E(BC)≈13.33、E(CC)≈4.20。χ²≈11.84、自由度 df=3(三対立遺伝子の場合)、p≈0.008 となります。

注意点として E(CC)=4.20 と小さく、カイ二乗近似はやや不安定。実務では Guo–Thompson 型の多対立遺伝子 exact test または permutation を用いて確認するのが望ましいです。[11]

6. 臨床・医療遺伝への応用:GWAS QC・症例対照研究・法医学

GWAS(全ゲノム関連解析)における HWE の役割

GWAS では数十万〜数百万のSNPについて、疾患との関連を統計的に検定します。その前処理ステップの一つが HWE 品質管理フィルタです。対照群(コントロール)での HWE 逸脱が大きいマーカーはジェノタイピング誤差の可能性が高いとして除外するのが一般的な実務です。[9]

ただし、Salanti ら(2005)は遺伝的関連研究の論文で HWE の報告と解釈がしばしば不十分であることを実証し、報告の厳密化を求めています。[13] 報告すべき情報として:どの群(症例群・対照群・両方)で検定したか、どの検定法を使ったか、閾値はいくつか、逸脱した座位をどう処理したか、の明示が求められます。

💡 用語解説:GWAS(全ゲノム関連解析)とは

ゲノム全体にわたる数十万〜数百万の SNP について、ある疾患を持つ群と持たない群で頻度差を一括検定する研究手法です。例えば2型糖尿病では2023年時点で700を超えるリスク座位が同定されています。HWE 逸脱マーカーの QC フィルタリングは GWAS の信頼性を左右する重要なステップで、PLINK などのツールで自動化されています。

症例対照研究での注意事項

症例対照研究において、HWE の報告は主として対照群で行うことが推奨されます。症例群は疾患によって選択されているため、疾患アレルの頻度が期待値と異なる可能性があり、症例群での HWE 逸脱は生物学的に意味があるシグナルである場合があります。対照群での逸脱がジェノタイピング誤差の検出に最も有用です。

法医学における HWE

法医学では HWE は単一座位の遺伝子型頻度計算と、多座位 DNA プロファイルのランダム一致確率(積則: product rule)の基礎にあります。二対立遺伝子座位で HWE が成立すれば、ホモ接合体 p²、ヘテロ接合体 2pq を用いて単一座位頻度が計算できます。[14] ただし法医学の現場でも、集団の層別化・null allele・突然変異・silent allele の存在から、θ補正などの集団遺伝学的調整が実務上必要とされます。

7. 保因者頻度の推算とNIPT:HWEが遺伝診療に直結する場面

常染色体潜性(劣性)疾患の保因者頻度計算

保因者スクリーニングの設計において、HWE は「疾患頻度 → 保因者頻度」の推算に不可欠です。常染色体潜性(劣性)遺伝では、疾患を発症するのは aa ホモ接合体のみです。

疾患の例 発症頻度(q²) 病因アレル頻度 q 保因者頻度(≈2q)
嚢胞性線維症(白人) 1/2,500 1/50 = 0.02 約1/25(4%)
脊髄性筋萎縮症(SMA) 1/10,000 1/100 = 0.01 約1/50(2%)
フェニルケトン尿症(PKU) 1/10,000〜1/15,000 1/100〜1/122 約1/50〜1/60

この計算はHWE が成立していることを前提としています。実際には、創始者効果が強い民族集団(アシュケナージ系ユダヤ人、日本人の特定集団など)や、選択圧が大きく異なる集団では、この単純計算が保因者頻度を過小評価または過大評価する可能性があります。ミネルバクリニックの拡大版保因者スクリーニング(女性787遺伝子・男性714遺伝子)では、実際の遺伝子配列を直接調べるため、HWE 近似に頼らない直接的な評価が可能です。

NIPTとHWE:アレル頻度の直接計測

NIPT(新型出生前診断)の中でも、SNP ベースの解析法(COATE 法など)では、母体血液中の cfDNA から胎児由来のアレル頻度を直接計測します。COATE 法(COordinative Allele-aware Target Enrichment)では母体のアレル頻度との比較から胎児の染色体異常や単一遺伝子疾患を高精度で検出します。このアレル頻度解析の背景には、集団における HWE のアレル分布の理解があります。

当院のインペリアルプラン(154遺伝子・218疾患)では、常染色体劣性(潜性)疾患を含む広範な遺伝子を対象とします。保因者カップルが共に同じ疾患遺伝子の変異を持つ場合、HWE に基づく確率計算が親子間の遺伝リスクを理解する基礎となります。

仲田洋美院長

🩺 院長コラム【「1/25の確率で保因者」という計算の裏にあるもの】

遺伝カウンセリングで保因者頻度を説明するとき、「嚢胞性線維症は白人で約25人に1人が保因者です」とお伝えします。この「25人に1人」という数字の背後には、HWE という数学的モデルが静かに働いています。発症率 1/2500 という疫学データから逆算して q=1/50 → 保因者頻度 2pq ≈ 2×(1/50) = 1/25 という計算です。

ただし臨床遺伝専門医として常に意識しているのは、「この計算は集団平均であり、あなたの民族的背景・家族歴・実際の遺伝子配列の結果によって、本当のリスクは大きく変わりうる」ということです。HWEはあくまで「帰無モデル」。実際の遺伝カウンセリングでは、その人固有のデータで補正した個別化されたリスク評価が必要です。

8. よくある誤解:HWEについて正しく理解するために

誤解①「HWEは現実の集団が満たすべき法則」

HWEはあくまで帰無モデルです。現実の集団が満たしているかどうかとは別の話で、「そこからの逸脱を解釈する基準点」として機能します。すべての集団が常に HWE を満たすと仮定することは誤りです。[4]

誤解②「HWE逸脱=データの品質不良」

逸脱の原因は①選択(生物学的シグナル)②近交③集団構造④ジェノタイピング誤差と多様です。自然選択や雑種強勢の存在でも逸脱は起きます。「逸脱=除外」の機械的処理は生物学的に重要な情報を捨てる危険があります。[7]

誤解③「混合集団をまとめて HWE 検定してよい」

混合集団をまとめて検定すると Wahlund 効果で擬陽性(偽の逸脱)が大量に発生します。集団層別化後に検定する、または RUTH のような構造調整法を使うことが実務の正解です。[8]

誤解④「X染色体も同じ方法で検定できる」

X染色体では雌雄でアレルのコピー数が異なるため、常染色体用のカイ二乗検定をそのまま適用することは不適切です。性別を分けた専用の検定が必要です。[2]

よくある質問(FAQ)

Q1. ハーディ・ワインベルグ平衡は一般の人にも関係がありますか?

はい、直接関係します。保因者スクリーニング(妊娠前・妊娠中の遺伝子検査)で「この疾患の保因者は約○人に1人」という数値の多くは HWE を前提に計算されています。また NIPT(新型出生前診断)のアレル頻度解析の背景にも HWE の考え方があります。「遺伝の確率を科学的に計算する基盤」と捉えると、遺伝診療と日常が直結していることが分かります。

Q2. HWEが成立しない条件はどれか1つだけ覚えるとしたら?

臨床遺伝の現場で最も頻繁に問題になるのは集団混合(Wahlund効果)ジェノタイピング誤差の2つです。混合集団をそのまま解析すると、民族差によるアレル頻度の違いが「近交係数があるように見える」Wahlund効果で HWE 逸脱が擬陽性で出ます。また遺伝子検査の技術的なエラー(アレルドロップアウト・CNV)も HWE 逸脱を引き起こします。この2つを常に念頭に置いて逸脱を解釈してください。

Q3. カイ二乗検定と正確検定(exact test)、どちらを使えばよいですか?

標本が小さい(n < 50〜100 程度)、またはマイナーアレル頻度(MAF)が低い(期待度数が5未満のセルが出る)場合は正確検定(exact test)または mid-pを使うことが推奨されます。PLINK などの主要ツールのデフォルト設定でも mid-p が採用されています。中等度以上の MAF で標本サイズが十分(n > 500 程度)であれば、カイ二乗検定でも LRT でも結論は変わりません。

Q4. 症例対照研究では症例群と対照群のどちらで HWE を検定すべきですか?

主として対照群(コントロール)での HWE を報告することが推奨されます。症例群は疾患によって選択されているため、疾患関連アレルが頻度から外れている可能性があり、そこでの HWE 逸脱は生物学的に意味がある場合があります。対照群での逸脱がジェノタイピング誤差を検出するのに最も有用な指標となります。必要に応じて症例群でも報告し、両方の結果と解釈を明記するのが最善です。

Q5. 嚢胞性線維症の保因者が「25人に1人」という計算はどこから来ていますか?

HWE を使った逆算です。白人での嚢胞性線維症の発症頻度は約 1/2,500 で、これが aa ホモ接合体の頻度 q² に相当します。q = √(1/2500) = 1/50 = 0.02。HWE 下でのヘテロ接合体(保因者)の頻度は 2pq ≈ 2×0.98×0.02 ≈ 0.04 = 約1/25 となります。この計算は「HWE が成立している」という前提に基づくため、創始者効果が強い集団や実際の遺伝子検査で確認した頻度とは若干異なる場合があります。

Q6. GWAS品質管理でHWEフィルタをかけるとき、閾値はどう設定すればよいですか?

標準的には対照群で p < 10⁻⁶〜10⁻⁴ 程度が使われますが、PLINK 2.0 は標本サイズを考慮した sample-size-aware 閾値を導入しています。大規模 biobank(数十万人規模)では固定閾値を一律適用すると、本物の選択シグナルを含む座位を誤って除外するリスクがあります。また admixed サンプル(多民族混合集団)では RUTH のような構造調整法の利用が推奨されます。混合集団に対してはまず集団層別化(主成分分析など)を行ってから検定するのが正しい手順です。

Q7. ヘテロ接合体過剰(ヘテロが期待より多い)はどんな状況で起きますか?

主な原因は2つです。一つはジェノタイピング誤差(ホモ接合体がヘテロ接合体と誤認される技術的問題、例:CNV 領域での重複)。もう一つは雑種強勢(超優性)です。HBB 遺伝子(鎌状赤血球変異)のように、ヘテロ接合体キャリアが特定の環境(マラリア流行地)で生存上有利になる場合、集団内のヘテロ接合体頻度が HWE の期待値より高くなります。Chen ら(2017)はヘテロ接合体過剰がジェノタイピング誤差を示唆しやすいと報告していますが、生物学的シグナルの可能性も念頭に置いて解釈することが重要です。

Q8. HWEと遺伝的多様性・エピジェネティクスはどう関係しますか?

HWE は DNA 塩基配列レベルのアレル頻度を扱うモデルで、エピゲノム(DNAメチル化・ヒストン修飾など、配列を変えない遺伝子発現制御)は直接扱いません。ただし遺伝的多様性(どのくらいアレルの種類が集団にあるか)の背景には HWE が存在し、ヘテロ接合度(多様性の指標)は期待ヘテロ接合度 H=2pq という HWE の式で近似されます。エピジェネティクス由来の表現型変異は HWE の枠外ですが、ゲノムインプリンティングのような座位ではアレル頻度の解釈に注意が必要です。

🏥 遺伝子検査・遺伝カウンセリングのご相談

保因者スクリーニング・NIPT・遺伝性疾患に関する
遺伝子検査・遺伝カウンセリングは
臨床遺伝専門医が在籍するミネルバクリニックにお気軽にご相談ください。

参考文献

  • [1] Hardy GH. Mendelian Proportions in a Mixed Population. Science. 1908;28(706):49–50. doi: 10.1126/science.28.706.49. [PubMed]
  • [2] Weinberg W. Über den Nachweis der Vererbung beim Menschen. Jahreshefte des Vereins für vaterländische Naturkunde in Württemberg. 1908;64:368–382. 原資料は Wellcome Collection に所蔵。
  • [3] Crow JF. Hardy, Weinberg and language impediments. Genetics. 1999;152(3):821–825. doi: 10.1093/genetics/152.3.821. [PubMed 10388804]
  • [4] Waples RS. Testing for Hardy–Weinberg Proportions: Have We Lost the Plot? J Hered. 2015;106(1):1–19. doi: 10.1093/jhered/esu062. [Oxford Academic]
  • [5] Wigginton JE, Cutler DJ, Abecasis GR. A note on exact tests of Hardy-Weinberg equilibrium. Am J Hum Genet. 2005;76(5):887–893. doi: 10.1086/429864. [PDF]
  • [6] Graffelman J, Moreno V. The mid p-value in exact tests for Hardy-Weinberg equilibrium. Stat Appl Genet Mol Biol. 2013;12(4):433–448. doi: 10.1515/sagmb-2012-0039. [PDF]
  • [7] Abramovs N, Brass A, Tassabehji M. Hardy-Weinberg Equilibrium in the Large Scale Genomic Sequencing Era. Front Genet. 2020;11:210. doi: 10.3389/fgene.2020.00210. [Frontiers]
  • [8] Pearman WS, Urban L, Alexander A. Commonly used Hardy–Weinberg equilibrium filtering schemes impact population structure inferences using RADseq data. Mol Ecol Resour. 2022;22(7):2599–2613. doi: 10.1111/1755-0998.13646. [Wiley]
  • [9] Chen B, Cole JW, Grond-Ginsbach C. Departure from Hardy Weinberg Equilibrium and Genotyping Error. Front Genet. 2017;8:167. doi: 10.3389/fgene.2017.00167. [Frontiers]
  • [10] PLINK 2.0 公式ドキュメント(HWEフィルタ・mid-p)。[PLINK 2.0 filter]
  • [11] Guo SW, Thompson EA. Performing the exact test of Hardy-Weinberg proportion for multiple alleles. Biometrics. 1992;48(2):361–372. doi: 10.2307/2532296. [ResearchGate]
  • [12] Kwong AM, Blackwell TW, LeFaive J, et al. Robust, flexible, and scalable tests for Hardy-Weinberg equilibrium across diverse ancestries. Genetics. 2021;218(1):iyab044. doi: 10.1093/genetics/iyab044. [PMC]
  • [13] Salanti G, Amountza G, Ntzani EE, Ioannidis JPA. Hardy–Weinberg equilibrium in genetic association studies: an empirical evaluation of reporting, deviations, and power. Eur J Hum Genet. 2005;13:840–848. doi: 10.1038/sj.ejhg.5201410. [Nature]
  • [14] NIJ/NIST Population Genetics and Statistics for Forensic Analysts. Hardy-Weinberg Principle. [NIJ]

関連記事

仲田洋美 医師(臨床遺伝専門医)

この記事の監修・執筆者:仲田 洋美

(臨床遺伝専門医/がん薬物療法専門医/総合内科専門医)

ミネルバクリニック院長。1995年に医師免許を取得後、 臨床遺伝学・内科学・腫瘍学を軸に診療を続けてきました。 のべ10万人以上のご家族の意思決定と向き合ってきた臨床遺伝専門医です。

出生前診断(NIPT・確定検査・遺伝カウンセリング)においては、 検査結果の数値そのものだけでなく、 「結果をどう受け止め、どう生きるか」までを医療の責任と捉え、 一貫した遺伝カウンセリングと医学的支援を行っています。

ハイティーンの時期にベルギーで過ごし、 日本人として異文化の中で生活した経験があります。 価値観や宗教観、医療への向き合い方が国や文化によって異なることを体感しました。 この経験は現在の診療においても、 「医学的に正しいこと」と「その人にとって受け止められること」の両立を考える姿勢の基盤となっています。

また、初めての妊娠・出産で一卵性双生児を妊娠し、 36週6日で一人を死産した経験があります。 その出来事は、妊娠・出産が女性の心身に与える影響の大きさ、 そして「トラウマ」となり得る体験の重みを深く考える契機となりました。 現在は、女性を妊娠・出産のトラウマから守る医療を使命の一つとし、 出生前診断や遺伝カウンセリングに取り組んでいます。

出生前診断は単なる検査ではなく、 家族の未来に関わる重要な意思決定です。 年齢や統計だけで判断するのではなく、 医学的根拠と心理的支援の両面から、 ご家族が後悔の少ない選択をできるよう伴走することを大切にしています。

日本人類遺伝学会認定 臨床遺伝専門医/日本内科学会認定 総合内科専門医/ 日本臨床腫瘍学会認定 がん薬物療法専門医。 2025年には APAC地域における出生前検査分野のリーダーとして国際的評価を受け、 複数の海外メディア・専門誌で特集掲載されました。

お電話での受付可能
診療時間
午前 10:00~14:00
(最終受付13:30)
午後 16:00~20:00
(最終受付19:30)
休診 火曜・水曜

休診日・不定休について

クレジットカードのご利用について

publicブログバナー
 
medicalブログバナー
 
NIPTトップページへ遷移