目次
📍 クイックナビゲーション
遺伝子検査の結果説明やゲノム医学の論文で必ず登場する「マイナーアレル頻度(MAF)」という言葉。これは、ある遺伝的な個性(バリアント)が集団のなかでどれくらいの割合で見られるかを示す、シンプルですが極めて重要な数値です。このMAFは、見つかった遺伝子の違いが「ありふれた個性(良性)」なのか「病気の原因(病的)」なのかを見分ける、最初の手がかりになります。本記事では、MAFとアレル頻度の基本から、臨床現場での使われ方、そして日本人のための大規模データベースまで、遺伝専門医がわかりやすく解説します。
Q. マイナーアレル頻度(MAF)とは何ですか?まず結論だけ知りたいです
A. MAFとは、ある遺伝子の特定の場所で見られる2種類の「型(アレル)」のうち、集団のなかで少数派のほうが占める割合のことです。例えば100人(=200本の染色体)を調べて、少数派の型が10本あればMAFは5%(0.05)です。この数値が5%以上ならありふれた「共通バリアント」、1%未満なら「希少バリアント」と分類され、遺伝子検査でその違いが病気の原因かどうかを判断する最初のフィルターになります。
- ➤MAFの正体 → 集団内で少数派のアレル(対立遺伝子)が占める頻度。0〜0.5の範囲をとる
- ➤バリアントの分類 → 5%以上=共通、1〜5%=低頻度、1%未満=希少(文献により多少異なる)
- ➤臨床での役割 → 頻度が高すぎる変異は「病気の原因にしては多すぎる=良性」と判断できる
- ➤集団による違い → アレル頻度は人種・集団ごとに異なり、創始者変異の誤判定を防ぐ鍵になる
- ➤日本人のデータ → gnomADや東北メディカル・メガバンクの日本人パネルが正確な解釈を支える
1. マイナーアレル頻度(MAF)とアレル頻度の基本
私たちの体の設計図であるDNAは、約30億の塩基対からなる長大な文字列です。ヒトのDNAは99.9%が共通していますが、残りのわずかな違いが、目の色や体質、そして病気のかかりやすさといった個人差を生み出しています。ゲノムのなかで、人によって文字(塩基)が異なる場所を「バリアブルサイト(多様な部位)」と呼び、そこに存在しうる複数の型のことをアレル(対立遺伝子)といいます。このアレルが集団のなかでどれくらいの割合で存在するかを示す数値が「アレル頻度(Allele Frequency: AF)」です。
💡 用語解説:アレル(対立遺伝子)とメジャー・マイナー
アレルとは、ゲノムの同じ位置に存在しうる「遺伝子の型」のことです。たとえばある場所が、ある人ではA(アデニン)、別の人ではG(グアニン)になっているとき、AとGがそれぞれアレルです。集団のなかで最も多く見られる型を「メジャーアレル」、2番目に多い少数派の型を「マイナーアレル」と呼びます。公共データベースでは、多くの場合この2種類だけが存在すること(二対立遺伝子=バイアレル)を前提に計算されるため、メジャーとマイナーの頻度の合計は必ず100%(=1)になります。
そして本記事の主役であるマイナーアレル頻度(Minor Allele Frequency: MAF)とは、この少数派のアレル(マイナーアレル)が集団内で占める割合のことです。定義上、MAFは必ず少数派の頻度を指すため、その値は0から0.5(50%)の範囲に収まります。なぜ最大が0.5かというと、もしある型が50%を超えれば、それはもはや多数派(メジャー)になってしまい、定義上「マイナー」ではなくなるからです。
MAFはどうやって計算するのか:具体例で理解する
MAFの計算自体はとてもシンプルです。ヒトは父親由来と母親由来で2本ずつ染色体を持つため、100人を調べると、ある場所には合計200本分のアレル(これをアレル総数:ANと呼びます)が存在します。このうち、少数派の型が何本あるか(これをアレルカウント:ACと呼びます)を数えて、ACをANで割れば、それがMAFです。たとえば200本中10本が少数派の型なら、10÷200=0.05、つまりMAFは5%となります。
💡 用語解説:AC(アレルカウント)とAN(アレルナンバー)
AN(Allele Number/アレル総数)は、調べた集団に含まれるアレルの総本数です。常染色体では1人あたり2本なので、検査した人数の約2倍になります。AC(Allele Count/アレルカウント)は、そのうち注目しているアレルが実際に観察された本数です。MAF=AC÷AN という関係になります。後で出てくる臨床判定では、このANが十分大きい(=たくさんの人を調べている)ことが、頻度を信頼するための条件になります。少人数しか調べていないと、偶然の偏りで頻度がぶれてしまうからです。
アレル頻度の背後には、集団遺伝学の基本法則であるハーディ・ワインベルグ平衡があります。これは、ランダムに交配が行われる十分大きな集団では、アレル頻度から各遺伝子型(AA・AG・GGなど)の出現割合を予測できるという法則です。たとえばマイナーアレルの頻度がqであれば、そのホモ接合体(両方とも少数派の型を持つ人)の割合はq²で予測できます。この法則は、後述する遺伝子検査の品質管理(データの異常検出)でも重要な役割を果たします。
歴史的にMAFが注目されてきた背景には、ゲノム解析技術の進歩があります。2000年代初頭の国際HapMapプロジェクトなどは、主にMAFが5%以上の「ありふれた」バリアントを捉えることを目的に設計されていました。しかし次世代シーケンシング(NGS)技術が発達し、1000人ゲノムプロジェクトのように数千人規模を網羅的に解読できるようになると、MAFが0.1%を下回るような極めて希少なバリアントまで高い解像度で検出・カタログ化できるようになりました。これにより、希少なバリアントほどタンパク質をコードする領域に多く、複雑な病気に対してより大きな影響力(効果量)を持ちやすいという集団遺伝学的な事実が明らかになっていきました。
2. 共通バリアントと希少バリアント:MAFによる分類
🔍 関連記事:遺伝子のバリアントとは/SNV(一塩基バリアント)/dbSNPとrsID
MAFは、ゲノム上の無数のバリアントを「ありふれているか、珍しいか」という軸で整理するための、最も基本的なものさしです。一般的に、MAFの値に応じてバリアントは次の3つに分類されます。なお、この境界線は研究分野によって多少の揺れがあり、絶対的な定義ではない点には注意が必要です。
この分類が単なる便宜的な区分にとどまらず、深い生物学的意味を持つのは、アレル頻度と「変異が生じた年代」「病気への影響の大きさ」が密接に関係しているからです。一般に、頻度の高い共通バリアントは人類の進化の歴史において古くに生まれ、長い時間をかけて世界中に広まったものです。一方、頻度の低い希少バリアントは比較的最近生じた、まだ広まる時間がなかった新しい変異であることが多いのです。
頻度と効果量の「シーソー関係」:浄化選択という進化の圧力
なぜ「珍しい変異ほど病気への影響が大きい」傾向があるのでしょうか。その鍵は「浄化選択(Purifying selection)」という進化のメカニズムにあります。健康に強い悪影響を与える変異は、その変異を持つ人が子孫を残しにくくなるため、世代を経るごとに集団から取り除かれていきます。つまり、有害な変異は頻度を上げることができず、いつまでも希少なままにとどまるのです。逆に、健康にほとんど影響しない変異は選択の圧力を受けないため、長い時間をかけて自由に頻度を高め、共通バリアントになり得ます。下の図は、この頻度と効果量の関係を概念的に表したものです。
MAFが低い希少バリアントほど効果量・浸透率が大きく(左上)、MAFが高い共通バリアントほど効果量が小さい(右下)という負の相関。この関係は、有害な変異を集団から取り除く浄化選択という進化的圧力に由来する。
この関係は臨床的にも極めて重要です。たとえば、ある患者さんから見つかった変異が「集団のなかで5%もの頻度で存在する共通バリアント」だった場合、それが重い遺伝病の単独原因である可能性は、進化の理屈から考えてほぼゼロといえます。逆に、ほとんど誰も持っていない極めて希少な変異であれば、病気の原因である可能性を真剣に検討する価値があります。MAFが、病的な変異を探し出すための「ふるい」として機能する根拠が、ここにあるのです。
3. GWASにおけるMAFと「失われた遺伝率」
🔍 関連記事:GWAS(ゲノムワイド関連解析)/SNPアレイ
GWAS(ゲノムワイド関連解析)は、糖尿病や高血圧のような「多因子疾患(多くの遺伝子と環境要因が関わる病気)」の遺伝的背景を探る主要な手法です。多数の人々のゲノムを網羅的に調べ、病気のある人とない人で頻度が異なるバリアントを統計的に探し出します。これまでのGWASの多くは「共通疾患・共通バリアント(CDCV)仮説」、つまり「ありふれた病気のリスクは、ありふれたバリアントの積み重ねで決まる」という考え方に基づいて設計されてきました。
💡 用語解説:遺伝率と「失われた遺伝率」
遺伝率(Heritability)とは、ある形質(身長や病気のかかりやすさなど)の個人差のうち、遺伝的要因でどれくらい説明できるかを示す割合です。双子研究などから、多くの病気で遺伝率はかなり高いと推定されてきました。ところが、何十万人もの大規模GWASを行っても、見つかった共通バリアントだけでは遺伝率のごく一部(多因子疾患では24%未満との指摘も)しか説明できませんでした。この「説明できない遺伝率の大部分はどこに消えたのか」という謎を「失われた遺伝率(Missing Heritability)」と呼びます。
この謎を説明する有力な仮説の一つが、「従来のSNPアレイを使ったGWASは共通バリアントしか捉えられておらず、低頻度・希少バリアントの寄与を見逃してきた」というものです。この見逃しを埋めるため、近年の研究は全エクソーム検査(WES)や全ゲノムシークエンス(WGS)へとシフトし、希少バリアントまで捉えようとしています。
MAFは品質管理(QC)のフィルターでもある
MAFは病気との関連を探すだけでなく、解析データの品質を保つ「フィルター」としても使われます。SNPアレイという装置は、蛍光シグナルの強さのパターンを読み取って、各人の遺伝子型を「両方とも多数派型」「両方少数派型」「ヘテロ(片方ずつ)」の3グループに振り分けます。ところが、MAFが極端に低い希少バリアントでは、少数派の型を持つ人がデータのなかにほとんど存在しないため、シグナルのまとまり(クラスター)がうまく形成されず、読み取りエラーが急増します。本当はヘテロなのに片方を読み落とす、データが欠損する、実際には1種類しかないのに2種類あると誤判定する、といった問題です。
こうしたノイズを除くため、従来の品質管理では、ハーディ・ワインベルグ平衡からの極端なずれや、データ欠損率の高さに加えて、MAFが一定の値(1%や5%など)を下回るバリアントをあらかじめ除外する処理が一般的に行われてきました。これは計算負荷や検定回数を減らす目的もあります。
フィルタリングのジレンマと「二段階」戦略
しかし近年、このMAFによる事前フィルタリングが、思わぬ副作用を持つことが分かってきました。直接調べていないバリアントを参照データから推定する「インピュテーション」という重要な手法において、事前に希少バリアントを削ってしまうと、推定に必要な情報(ハプロタイプ=染色体上のアレルの並び)が失われ、かえって全体の情報が損なわれてしまうのです。研究では、事前フィルタリングをしなくても品質の低いバリアントの推定精度は損なわれず、むしろ事前に削らないほうがよいことが示されています。
そのため現在では、インピュテーション前にはMAF基準をあえて緩く設定し、推定が終わった後に品質スコアで厳密に絞り込む「二段階フィルタリング」が推奨されています。また、MAFの低いバリアントをGWASに含めると、誤って「関連あり」と判定してしまう偽陽性が増えるため、有意性の判定基準(P値の閾値)もより厳しく設定する必要があることが、大規模なシミュレーションで示されています。
4. MAFが集団構造解析(PCA)に与える影響
MAFは病気の研究だけでなく、集団どうしの遺伝的な近さや成り立ち(集団構造)を調べる進化生物学・集団遺伝学でも重要です。集団間の遺伝的な違いを可視化する代表的な手法に主成分分析(PCA)がありますが、解析前にどのMAFのバリアントを使うかという選択が、結果を根本的に変えてしまうことが知られています。
💡 用語解説:主成分分析(PCA)とは
主成分分析(Principal Component Analysis: PCA)とは、たくさんの変数(ここでは無数のバリアント情報)を、情報をできるだけ保ったまま少数の軸に圧縮して、データの全体像を見やすくする統計手法です。集団遺伝学では、多数の人のゲノム情報をPCAにかけることで、「どの人たちが遺伝的に近いか」を平面上の点の散らばりとして可視化できます。出身地や民族集団ごとに点がまとまる様子が見えるため、人類集団の関係性を読み解く強力な道具になります。
興味深いことに、使用するバリアントを希少なものから共通なものへと変えていくと、PCAが描き出す集団の姿が連続的に変化します。これは「スケール効果」と呼ばれる現象です。希少バリアントだけを使うと、最近生じた変異に基づく局所的で細やかな集団のつながり(ローカルスケール)が鮮明になります。一方、共通バリアントだけを使うと、古い歴史に基づく大陸間のような広域的な関係(グローバルスケール)が浮かび上がります。前章で述べた「希少=新しい、共通=古い」という時間軸の違いが、ここでも効いてくるのです。
問題は、エラー除去のためにMAFの低いバリアントを機械的に一律カットすると、こうした微細な集団の違いを示すシグナルまで削ぎ落としてしまうことです。すると、本来は区別できたはずの近縁な集団どうしの境界が曖昧になってしまいます。逆に、データセット全体で一度しか現れない変異(シングルトン)まで含めると、情報不足から過学習が起き、解析が混乱することもあります。フィルタリングの影響は、対象集団がもともとどれくらい遺伝的に分かれているかによっても変わるため、研究者は単一の恣意的な閾値に頼らず、複数の条件を試して最終的な判断の根拠を明確に示すことが推奨されています。
5. 臨床バリアント解釈とアレル頻度の閾値
次世代シーケンスが日常的な診療ツールとなった今、臨床医が直面する最大の課題は、患者さんから検出される数万個もの膨大なバリアントのなかから、本当に病気を引き起こしている病的バリアントを、無害な大多数の良性バリアントから見分けることです。この困難な作業において、大規模データベースから得られるアレル頻度は、最も強力で客観的な「最初のふるい」として機能します。
ACMG/AMPガイドラインにおける頻度基準
米国臨床遺伝学・ゲノム学会(ACMG)と分子病理学会(AMP)は、2015年にバリアント解釈の標準ガイドラインを発表しました。このなかで、アレル頻度に基づく複数の判定基準が定められています。代表的なものを紹介します。
💡 用語解説:有病率と浸透率
有病率とは、ある時点で集団のなかにその病気の人がどれくらいいるかの割合です。浸透率とは、原因となる変異を持つ人のうち、実際に症状が現れる人の割合です。浸透率が100%なら変異を持てば必ず発症しますが、不完全浸透の場合は、変異を持っていても発症しない「無症候性キャリア」が集団に存在します。この浸透率は、後述する「許容される最大頻度」の計算に直接効いてきます。
重要なのは、これらの具体的な数値の閾値は、すべての病気で一律ではないという点です。疾患ごとの専門家パネルが、その病気の浸透率・有病率・遺伝形式(常染色体顕性〔優性〕か潜性〔劣性〕か)に応じて、閾値を細かく調整しています。たとえば、年齢を重ねてから発症するような遅発性の病気では、病的バリアントでも集団にある程度存在しうるため、希少性の閾値をより低く(許容的に)設定するといった工夫がなされています。さらに、フィンランド系やアシュケナージ・ユダヤ系のように創始者効果を強く受けた集団では、良性と判断するためにより高い頻度が要求されます。
なお、PM2(希少性を病的の証拠とする基準)については、当初は「中等度の証拠」とされていましたが、希少であることだけを重く見ると誤った判定(偽陽性)を招きやすいと判断され、専門家グループの分析により「支持的(Supporting)」という一段弱い証拠レベルに引き下げられました。これは、希少性への過度な依存を避け、より確実な証拠を重視する方向への進化を象徴しています。
「最大許容集団アレル頻度」という考え方
「あるバリアントが病気の原因と考えるには、集団のなかで頻度が高すぎる」という判断を、客観的な数式で定式化したのが、Whiffinら(2017年)のフレームワークです。彼らは、対象となる病気の特徴から、病的バリアントが一般集団に存在しうる「最大許容集団アレル頻度」を算出する方法を示しました。考え方の骨格は、おおむね次のようになります。
最大許容集団AF =
(病気の有病率 × そのバリアントの最大寄与率)
÷ 浸透率
病気が稀であるほど、また1つのバリアントが全体に占める寄与が小さいほど、許容される頻度は低くなります。逆に、浸透率が低い(発症しないキャリアが多い)病気では、許容される頻度は高めに設定されます。
このフレームワークの優れた点は、gnomADのような大規模データベースであっても、それが「全人類の完全なデータ」ではなく「有限のサンプル」に過ぎないという事実を数学的に処理していることです。サンプルのばらつき(偶然の偏り)を考慮するため、ポアソン分布というモデルを使い、観察されたアレル数から、真の頻度がとりうる95%信頼区間の上限を計算します。この洗練された考え方は、gnomADで「Filtering AF(フィルタリングアレル頻度)」というパラメータとして実装されています。臨床医は、計算した「最大許容頻度」とこの値を比べるだけで、候補バリアントが「病気の原因にしては頻度が高すぎる」かどうかを、解析の初期段階で安全に判断できるのです。
6. gnomADと日本人パネル:集団特異的データの重要性
🔍 関連記事:gnomAD/pLI/LOEUF/ClinVar/創始者効果
臨床でのバリアント解釈の精度は、基準となる参照集団データの規模・品質・多様性に完全に依存しています。現在、世界で最も広く使われている最大のアレル頻度リファレンスが、ブロード研究所を中心とするコンソーシアムが提供するgnomAD(Genome Aggregation Database)です。gnomADは、世界中のさまざまな研究から集めたエクソーム・全ゲノムデータを単一のパイプラインで再処理・調和させた巨大なリソースで、数十万人規模のデータをカタログ化しています。
gnomADでは、東アジア人やヨーロッパ系といった大分類がさらに細かなサブ集団に分けられ、それぞれの解像度でアレル頻度が提供されています。また前章で述べたFiltering AFは、複数の大陸規模のサブ集団それぞれで95%信頼区間を計算し、そのなかで最も高い値を採用する形で実装されています(この値は、かつてPopmaxと呼ばれ、現在はgrpmaxという名称に整理されています)。これにより、特定の集団でだけ頻度が高いバリアントを見落とさない仕組みになっています。
集団データの欠如が招いた誤分類の歴史
なぜ集団ごとのデータがこれほど重要なのでしょうか。それは、ある集団で独自に生まれ広まった創始者変異が存在するからです。世界平均の頻度だけを見ていると、その集団内では「ありふれた無害な個性」であるバリアントを、「極めて稀な病的バリアント」と誤認してしまう危険があります。
💡 用語解説:創始者効果(Founder effect)
少数の祖先集団から派生して大きくなった集団では、たまたまその祖先が持っていた特定の変異が、集団全体に高い頻度で受け継がれることがあります。これを創始者効果と呼びます。地理的に隔離された集団や、特定の歴史的経緯を持つ集団でよく見られ、その集団に特有の「創始者変異」を生み出します。世界全体では珍しくても、その集団内ではありふれている、という現象の原因になります。
実際、過去にClinVar(バリアント解釈のアーカイブ)などに「病的」と登録されたバリアントのうち、後に「良性」へ再分類されたものの多くは、アフリカ系・アジア系・ラテン系などの多様な集団データが不足していた時代に報告されたものでした。ヨーロッパ系中心の小さな対照群では見つからなかったために、誤って病的と結論づけられていたのです。アレル頻度データベースが遺伝的に多様であることが、いかに誤分類を防ぐ上で重要かを物語っています。日本人でも、日本人に特有の稀なバリアントが特定の検査値異常と強く関連する事例が報告されており、集団特異的な頻度情報なしに正確な因果関係を推定することはできません。
日本人のための全ゲノムリファレンスパネル:ToMMo
この課題に応え、日本人のゲノム医療の基盤を築いたのが、東北大学などが推進する東北メディカル・メガバンク機構(ToMMo)による全ゲノムリファレンスパネルです。東日本大震災の復興支援と個別化医療の開発を目的に2012年に開始され、宮城県・岩手県の一般住民を対象とした大規模なコホート研究とバイオバンクが構築されてきました。
このパネルは、正確なアレル頻度を推定するため、親族関係にある人を厳密に除外し、頻度の偏りを排除するよう設計されています。規模は技術の進歩とともに拡大を続け、2015年の約1,000人規模(1KJPN)から始まり、2023年には血縁関係のない54,000人を厳選して構築された「54KJPN」が公開されました。これは合計69,014人という単一集団としては世界最大級の解析データから選ばれたもので、約1億8,700万個のSNVと約2,419万個のINDELという桁違いの遺伝的変異がカタログ化されています。
ToMMo日本人全ゲノムリファレンスパネルの規模拡大
解析人数の増加(おおよその規模)
14KJPN
38KJPN
54KJPN
解析人数の拡大に伴い、新たに同定されるバリアントの総数も増加。大規模化の真の価値は、日本人集団における極めて希少なバリアントの正確な頻度推定にある。
この大規模化の真の価値は、ありふれた共通バリアントの同定ではなく、数万人に一人しか持たないような極めて希少なバリアントの頻度を、日本人集団で正確に見積もれるようになった点にあります。初期の1KJPNの時点ですでに日本国内のMAF 1%超のバリアントの大部分を網羅していましたが、54KJPNの規模に達したことで、希少な疾患原因バリアントが日本人にどれほどの頻度で潜んでいるかを精密に評価できるようになりました。ToMMoはさらに、代謝物やタンパク質のデータを統合したマルチオミクス参照データベース「jMorp」も公開し、ゲノムの違いが実際の体質に与える影響の解明を進めています。
7. 遺伝診療との接続:MAFは何の役に立つのか
🔍 関連記事:遺伝カウンセリングとは/臨床遺伝専門医とは/クリニカルエクソーム検査
ここまで見てきたMAFという指標は、抽象的な統計の話に聞こえるかもしれませんが、実際の遺伝診療の現場では、検査結果を読み解くたびに使われている実践的な道具です。具体的には、遺伝子診断・遺伝形式の評価・遺伝カウンセリングのそれぞれの場面で、MAFが重要な役割を果たします。
遺伝子診断の場面では、検出された無数のバリアントから病的なものを絞り込む際、まずアレル頻度でふるいにかけます。頻度が高すぎるものを除外することで、検討すべき候補を現実的な数まで減らせます。遺伝形式の評価では、たとえば保因者(症状はないが変異を1つ持つ人)の集団内頻度から、夫婦がそろって同じ病気の保因者である確率を見積もる、といった計算にアレル頻度が使われます。これは妊娠前の保因者検査の結果解釈にも直結します。
そして遺伝カウンセリングの場面では、見つかったバリアントが「ありふれた個性なのか」「病気に関わる可能性があるのか」を、根拠をもって説明する際にMAFの情報が欠かせません。とりわけ、意義のはっきりしないVUS(意義不明変異)の取り扱いを考えるうえで、集団頻度は重要な手がかりの一つになります。パネル検査で結論が出ない場合にクリニカルエクソーム検査へ進む際も、同じく頻度フィルターが活躍します。
💡 用語解説:VUS(意義不明のバリアント)
VUS(Variant of Uncertain Significance)とは、現時点の情報では「病的」とも「良性」とも判断できないバリアントのことです。遺伝子検査では珍しくないもので、頻度情報や機能的なデータ、家系内での共分離などの証拠が今後増えることで、将来「良性」または「病的」に再分類される可能性があります。集団でのアレル頻度は、このVUSを評価し直すときの大切な材料の一つです。
8. よくある誤解
誤解①「珍しい変異=必ず病気の原因」
頻度が低いことは病的の手がかりの一つですが、それだけで原因と断定はできません。誰もが多くの希少バリアントを無害に持っています。専門家グループも、希少性だけを重く見ると誤判定が増えるとして、希少性の証拠レベルをあえて引き下げました。機能的な証拠や家系内の情報など、総合的な評価が必要です。
誤解②「世界平均の頻度を見れば十分」
世界平均だけを見ると、ある集団でありふれた無害なバリアントを「稀な病的変異」と誤認する危険があります。創始者効果により、特定の集団でだけ頻度が高い変異が存在するためです。だからこそ、日本人なら日本人のデータ(ToMMoなど)を参照する集団特異的な視点が欠かせません。
誤解③「MAFの閾値はどの病気も同じ」
良性・病的を分ける頻度の境界線は、病気ごとに大きく異なります。有病率・浸透率・遺伝形式に応じて、疾患ごとの専門家パネルが閾値を細かく調整しています。「5%なら一律良性」のような単純なルールがすべてに当てはまるわけではありません。
誤解④「データベースの頻度は絶対に正確」
大規模データベースも「有限のサンプル」であり、特に希少バリアントでは偶然の偏り(サンプリング誤差)が無視できません。そのため臨床では、点としての頻度ではなく、信頼区間を考慮した値(Filtering AF)を用いて、慎重に判断する仕組みが取り入れられています。
よくある質問(FAQ)
🏥 遺伝子検査・バリアント解釈のご相談
遺伝子検査の結果に出てくるアレル頻度やバリアントの意味について
もっと詳しく知りたい方は
臨床遺伝専門医が在籍するミネルバクリニックにお気軽にご相談ください。
参考文献
- [1] Manolio TA, et al. Finding the missing heritability of complex diseases. Nature. 2009. [PMC2831613]
- [2] Lee S, et al. Rare-variant association analysis: study designs and statistical tests. Am J Hum Genet. 2014. [PMC8267277]
- [3] Impact of pre- and post-variant filtration strategies on imputation. NAR Genom Bioinform / PMC. [PMC7973508]
- [4] A quality control algorithm for filtering SNPs in genome-wide association studies. Bioinformatics / PMC. [PMC2894516]
- [5] Linck E, Battey CJ. Minor allele frequency thresholds strongly affect population structure inference with genomic data sets. Mol Ecol Resour. 2019. [PubMed 30659755]
- [6] Population structure at different minor allele frequency levels. PMC. [PMC4143691]
- [7] Richards S, et al. Standards and guidelines for the interpretation of sequence variants (ACMG/AMP). Genet Med. 2015. [PMC6885382]
- [8] Ghosh R, et al. Updated recommendation for the benign stand-alone ACMG/AMP criterion (BA1). Hum Mutat / PMC. [PMC6188666]
- [9] Whiffin N, et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genet Med. 2017. [PubMed 28518168]
- [10] Using High-Resolution Variant Frequencies Empowers Clinical Genome Interpretation and Enables Investigation of Genetic Architecture. PMC. [PMC6323549]
- [11] Gudmundsson S, et al. Variant interpretation using population databases: Lessons from gnomAD. Hum Mutat / PMC. [PMC9160216]
- [12] ClinVar and HGMD genomic variant classification accuracy has improved over time. PMC. [PMC10347827]
- [13] The analysis of the whole genome sequence of 69,000 individuals has been completed, and 54KJPN is now available. Tohoku University / ToMMo. [ToMMo]
- [14] Tadaka S, et al. jMorp: Japanese Multi-Omics Reference Panel update report 2023. Nucleic Acids Res. 2024. [Nucleic Acids Research]
- [15] GWAS significance thresholds in large cohorts of European ancestry. Genetics (Oxford Academic). [Oxford Academic]



