目次
- 1 1. SNP(一塩基多型)とは?DNAの1文字違いとして理解する
- 2 2. SNPとSNVの違い:SNPはSNVの一部です
- 3 3. SNPはどこにある?コード領域・非コード領域・調節領域
- 4 4. トランジションとトランスバージョン:SNPが生じる分子メカニズム
- 5 5. dbSNPとrsID:SNPを世界共通の番号で扱うしくみ
- 6 6. SNPアレイとDNAシークエンス:SNPをどう調べるのか
- 7 7. GWASとSNP:病気の「なりやすさ」を全ゲノムから探す
- 8 8. 連鎖不平衡(LD)とハプロタイプ:なぜSNPは一緒に動くのか
- 9 9. ポリジェニックリスクスコア(PRS):多数のSNPを足し合わせる考え方
- 10 10. SNPと薬理ゲノミクス:薬の効き方が人によって違う理由
- 11 11. AIとSNP解析:AlphaMissenseは何を評価しているのか
- 12 12. SNPと遺伝子診断・遺伝カウンセリングの関係
- 13 よくある質問(FAQ)
- 14 まとめ
- 15 参考文献
- 16 関連記事
SNP(一塩基多型)は、ヒトゲノムの中に存在する最も身近で、最も数が多い遺伝的多様性です。DNAの文字が1か所だけ違うという小さな差ですが、体質、薬の効き方、病気へのなりやすさ、祖先集団の違い、ゲノムワイド関連解析(GWAS)の結果解釈など、遺伝医学のあらゆる領域に関係します。ただし、SNPがある=病気という意味ではありません。多くのSNPは正常な個人差であり、臨床で重要なのは「その一塩基の違いが、どの頻度で、どの場所にあり、どの程度機能に影響するのか」を文脈と一緒に読むことです。
Q. SNP(一塩基多型)とは何ですか?まず結論だけ知りたいです
A. SNPとは、DNA配列の1文字だけが人によって異なり、その違いが集団内で比較的よく見られるものです。現在は「一塩基の違い」全体をSNV(一塩基バリアント)と呼び、そのうち集団頻度が高いものをSNPと呼ぶ整理が重要です。SNPは病気そのものではなく、正常な多様性、薬剤反応、疾患リスク推定、GWAS、祖先解析、個別化医療を理解するための基本単位です。
- ➤SNPとSNVの違い → SNVは一塩基変化全体、SNPは集団内で比較的よく見られるSNV
- ➤病気との関係 → SNPの多くは無害だが、薬剤反応・疾患リスク・遺伝子機能に関わることがある
- ➤GWASでの意味 → 関連SNPは原因変異そのものではなく、連鎖不平衡を介した目印であることが多い
- ➤臨床応用 → CYP2C19・CYP2D6・HLAなどの多型は薬の効き方や副作用リスクに関係する
- ➤検査技術 → SNPアレイ、DNAシークエンス、全ゲノムシーケンスで読み取り方が異なる
1. SNP(一塩基多型)とは?DNAの1文字違いとして理解する
SNP(一塩基多型、Single Nucleotide Polymorphism)は、DNA配列の中で、A・T・C・Gという4種類の塩基のうち1文字だけが人によって異なる場所を指します。たとえば、ある人の配列が「A」なのに、別の人では同じ位置が「G」になっている、というような違いです。人間のヒトゲノムは約30億塩基対から構成されますが、その大部分は人類に共通しています。その中に散らばるわずかな違いが、個人差や体質の一部を形作っています。
SNPは「変異」という言葉で説明されることがありますが、一般の方にはここで誤解が生じやすいところです。SNPは、それだけで病気を意味する言葉ではありません。むしろ多くのSNPは、人類集団の中に普通に存在する正常な遺伝的多様性です。血液型の違いや体質の違いと同じように、DNA上にある「個人差の目印」と考えると理解しやすいです。
💡 用語解説:塩基とは?
塩基とは、DNAを構成する「文字」にあたる化学物質です。A(アデニン)、T(チミン)、C(シトシン)、G(グアニン)の4種類があり、この並び方によって遺伝情報が書かれています。SNPはこの4文字のうち、ある1か所だけが人によって違う状態です。文章でたとえると、「からだ」という言葉の1文字だけが変わって「からた」になるようなものですが、実際のゲノムではその違いが無害なことも、機能に影響することもあります。
SNPは遺伝子の中にも、遺伝子と遺伝子の間にも存在します。タンパク質を作る領域にあるSNPは、アミノ酸を変えることがあります。一方で、タンパク質を作らない領域にあるSNPも、遺伝子の発現量、スプライシング、エンハンサー活性などに関わることがあります。したがって、SNPの意味を考えるときは「1文字違う」という事実だけでなく、その場所がどこか、頻度がどのくらいか、周囲の遺伝子機能とどう関係するかを一緒に判断する必要があります。
SNPは「よくある一塩基の違い」
古典的には、SNPは「集団内で1%以上の頻度で見られる一塩基の違い」と説明されます。この1%という基準は、病的変異と正常多型をきれいに二分する絶対的な境界ではありませんが、遺伝学の実務では非常に重要な目安です。ある一塩基の違いが多くの人に見られる場合、それは多くの場合、生命に大きな不利益を与えない多型である可能性が高くなります。一方で、非常にまれな一塩基の違いは、疾患との関連を慎重に検討する対象になります。
💡 用語解説:多型とは?
多型とは、集団の中に複数のタイプが比較的よく存在している状態です。たとえば、あるDNAの位置でAを持つ人もいればGを持つ人もいる、という状態です。多型は「異常」という意味ではありません。むしろ人類集団に自然に存在する多様性です。ただし、一部の多型は病気のなりやすさや薬の効き方に影響するため、遺伝医学では重要な情報として扱われます。
平均的な個人のゲノムには、参照配列と異なる一塩基の違いや小さな挿入・欠失を含めて、およそ数百万個のバリアントが存在します。ここで注意したいのは、「400万〜500万個のSNP」と単純に言い切るよりも、約400万〜500万個のゲノムバリアントがあり、その大部分に一塩基変化が含まれると表現した方が正確です。現在の臨床遺伝学では、SNP、SNV、希少バリアント、病的バリアントを区別して扱うことが重要になっています。
2. SNPとSNVの違い:SNPはSNVの一部です
SNPを理解するうえで、もっとも大切なのがSNV(一塩基バリアント)との違いです。SNVとは、頻度や臨床的意味にかかわらず、DNAの1文字が変わっている状態全体を指します。つまり、SNVは「一塩基の違い」という形そのものを表す広い言葉です。一方でSNPは、そのSNVのうち、集団の中で比較的よく見られるものを指します。
この整理は、臨床検査の結果を読むときにとても重要です。検査会社の報告書では「variant」「SNV」「SNP」「mutation」という言葉が文脈によって使い分けられます。古い文献では病的変化もSNPと呼ばれていることがありますが、現在の臨床遺伝学では、まずSNVという広い概念で一塩基の違いを捉え、頻度・機能・臨床的証拠によってSNP、良性バリアント、病的バリアント、VUSなどに整理するのが自然です。
💡 用語解説:バリアントとは?
バリアントとは、参照配列と比べてDNA配列が異なる場所を指す中立的な言葉です。「変異」という日本語は病気を連想させやすいのですが、バリアントには良性のものも、病的なものも、まだ意味がわからないものも含まれます。臨床遺伝学では、まず「バリアント」として記載し、その後に良性・おそらく良性・意義不明・おそらく病的・病的といった分類を行います。
「SNP=安全」「希少SNV=危険」と単純化しない
頻度が高いSNPは一般に強い病的影響を持ちにくいと考えられますが、これは「絶対に安全」という意味ではありません。たとえば薬剤代謝に関わる遺伝子の多型は、集団内で一定頻度で見られるにもかかわらず、特定の薬の効き方や副作用リスクを大きく変えることがあります。逆に、希少SNVであっても、タンパク質機能に影響しない良性バリアントであることもあります。
そのため、遺伝子検査では頻度だけで判断せず、以下のような情報を総合して解釈します。
- ➤集団頻度:そのバリアントが一般集団にどれくらい存在するか
- ➤遺伝子上の位置:エクソン、イントロン、スプライス部位、プロモーター、エンハンサーなど
- ➤タンパク質への影響:ミスセンス、ナンセンス、同義変異など
- ➤臨床データベース:ClinVarやgnomADに登録されている情報
- ➤患者さんの表現型:実際の症状、家族歴、遺伝形式、検査目的との整合性
3. SNPはどこにある?コード領域・非コード領域・調節領域
SNPはゲノム全体に広く分布しています。一般の方は「遺伝子の中にある変化」と考えがちですが、ヒトゲノムのうちタンパク質を直接コードする領域はごく一部です。実際には、多くのSNPはイントロンや遺伝子間領域など、タンパク質を直接作らない場所に存在します。それでも、非コード領域のSNPが意味を持たないわけではありません。遺伝子のスイッチ、発現量、RNAの作られ方、クロマチン状態に影響することがあります。
💡 用語解説:エクソンとイントロン
エクソンは、最終的にRNAに残り、タンパク質の設計図として使われる部分です。イントロンは、いったんRNAに写し取られた後に切り取られる部分です。昔はイントロンを「不要な部分」と説明することもありましたが、現在ではスプライシングや遺伝子発現の制御に関わる重要な領域もあることがわかっています。SNPがイントロンにあるからといって、常に意味がないとは限りません。
ミスセンス変異・同義変異・非コードSNP
エクソン内にあるSNPのうち、アミノ酸を変えるものをミスセンス変異と呼びます。たとえば、タンパク質のある位置で「グリシン」が「アルギニン」に変わるような場合です。アミノ酸が変わると、タンパク質の折りたたみ、酵素活性、他の分子との結合に影響することがあります。一方、塩基は変わってもアミノ酸が変わらないものを同義変異、またはサイレント変異と呼びます。ただし、同義変異でもスプライシングやRNA安定性に影響することがあり、必ずしも完全に無意味とは限りません。
💡 用語解説:ミスセンス変異とは?
ミスセンス変異とは、DNAの1文字の違いによって、タンパク質を作るアミノ酸が別の種類に置き換わる変化です。たとえるなら、料理のレシピで「塩」と書くべきところが「砂糖」に変わるようなものです。ただし、置き換わる場所やアミノ酸の性質によって影響は大きく異なります。重要な機能部位で起これば病気に関係することがありますが、影響がほとんどない場合もあります。
非コード領域のSNPは、かつては解釈が難しい領域でした。しかしGWASが発展すると、多くの疾患関連シグナルがタンパク質を直接コードしない領域に見つかることが明らかになりました。これは、疾患リスクの一部が「タンパク質の形を壊す」だけでなく、遺伝子をいつ、どこで、どれくらい働かせるかという調節の違いによって生じることを示しています。
4. トランジションとトランスバージョン:SNPが生じる分子メカニズム
SNPは「DNAの1文字違い」と説明できますが、その1文字の変わり方には一定の偏りがあります。DNAの塩基は、化学構造によってプリン塩基(A・G)とピリミジン塩基(C・T)に分けられます。プリン同士、またはピリミジン同士で置き換わる変化をトランジション(transition、遷移)、プリンとピリミジンの間で置き換わる変化をトランスバージョン(transversion、塩基転換)と呼びます。
理論上は、1つの塩基から見たとき、トランスバージョンの候補はトランジションの候補より多くなります。しかし実際のヒトゲノムでは、トランジションの方が多く観察されます。理由の一つは、メチル化されたCpG部位のシトシンが自然脱アミノ化を受け、チミンに変わりやすいことです。この変化が修復されないまま複製されると、CからTへのトランジションとして固定されます。
💡 用語解説:CpGとメチル化
CpGとは、DNA配列中でC(シトシン)の次にG(グアニン)が並ぶ場所です。哺乳類ではCpGのシトシンがメチル化されることが多く、メチル化シトシンは自然にチミンへ変わりやすい性質があります。このためCpG部位は変異のホットスポットになりやすく、ヒトゲノムの進化や疾患関連バリアントを理解するうえで重要です。
さらに、トランジションは遺伝暗号の性質上、アミノ酸を変えない同義置換になりやすい傾向があります。生存に大きな不利益を与えにくい変化は集団内に残りやすいため、結果としてトランジションが多く観察されます。つまり、SNPの分布は単なる偶然ではなく、DNAの化学的性質、修復機構、自然選択、コドンの縮重が重なった結果といえます。
5. dbSNPとrsID:SNPを世界共通の番号で扱うしくみ
🔍 関連記事:dbSNPとrsID(rs番号)/ClinVar/マイナーアレル頻度
SNPを医学・研究・検査の世界で共有するためには、「どの染色体の、どの位置の、どの塩基の違いか」を正確に示す必要があります。そこで重要になるのがdbSNPとrsID(rs番号)です。rsIDはReference SNP IDの略で、SNPや小さなバリアントに付けられる世界共通の識別番号です。たとえば「rs429358」のように、rsの後に数字が続く形で表記されます。
💡 用語解説:rsID(rs番号)とは?
rsIDは、dbSNPに登録されたバリアントに付く識別番号です。住所のような役割を持ち、研究論文、DTC遺伝子検査、GWAS、薬理ゲノミクス、臨床データベースで同じバリアントを指し示すために使われます。ただし、rs番号があるからといって、そのバリアントが病的であるとは限りません。rs番号は「登録番号」であり、「病気の番号」ではありません。
dbSNPはもともと一塩基多型のデータベースとして始まりましたが、現在はSNPだけでなく、小さな挿入・欠失、複数塩基の置換なども含む、より広いsmall variantsのリポジトリとして機能しています。そのため「dbSNPにある=SNPである」と単純に考えるのではなく、登録されているバリアントの種類、頻度、臨床的注釈を確認する必要があります。
Reference allele、Alternative allele、Major allele、Minor allele
SNPを読むときには、アレルという言葉も必要です。アレルとは、同じゲノム位置に存在する塩基のタイプのことです。参照ゲノムに載っている塩基をReference allele、参照配列と異なる塩基をAlternative alleleと呼びます。一方、集団内で頻度が高い方をMajor allele、低い方をMinor alleleと呼びます。ここで注意したいのは、Reference alleleが常にMajor alleleとは限らないという点です。
💡 用語解説:アレル頻度とMAF
アレル頻度とは、ある集団の中で特定のアレルがどのくらい存在するかを示す割合です。マイナーアレル頻度(MAF)は、その位置で少数派のアレルがどれくらい見られるかを示します。SNPを「よくある多型」として扱うか、「希少バリアント」として慎重に見るかを考えるうえで、MAFは非常に重要です。
6. SNPアレイとDNAシークエンス:SNPをどう調べるのか
🔍 関連記事:SNPアレイ/DNAシークエンス/全ゲノムシーケンス(WGS)
SNPを調べる方法には、大きく分けてSNPアレイとDNAシークエンスがあります。SNPアレイは、あらかじめ選ばれた多数のSNPを一度に調べる方法です。ガラスやチップ上に固定されたプローブを使い、サンプルDNAがどのアレルを持つかを判定します。既知のSNPを効率よく調べられるため、大規模研究、GWAS、祖先解析、コピー数解析などで広く使われてきました。
一方、DNAシークエンスは、DNA配列そのものを読み取る方法です。全エクソームシーケンス(WES)はタンパク質をコードする領域を中心に解析し、全ゲノムシーケンス(WGS)はゲノム全体を対象にします。SNPアレイが「既知の地点を調べる地図」だとすれば、WGSは「地図全体を読み直す方法」に近いといえます。
💡 用語解説:ジェノタイピングとは?
ジェノタイピングとは、ある遺伝子座で、その人がどのアレルを持っているかを調べることです。たとえば、あるSNPでA/A、A/G、G/Gのどれかを判定するような検査です。SNPアレイは大量のSNPを一度にジェノタイピングする技術です。一方、シークエンスは配列そのものを読んで、新しいバリアントも見つけられる点が異なります。
インピュテーション:見ていないSNPを統計的に補う
SNPアレイでは、チップに搭載されたSNPだけを直接測定します。しかしヒトゲノムには測定されていない多数のバリアントがあります。そこで使われるのがインピュテーションです。インピュテーションとは、参照パネルに含まれるハプロタイプ構造を使って、直接測定していないSNPの遺伝子型を統計的に推定する方法です。
この技術により、過去に取得されたSNPアレイデータでも、より高密度な解析に近づけることができます。ただし、推定精度は参照パネルが対象集団にどれだけ合っているかに強く依存します。ヨーロッパ系集団のデータを中心に作られた参照パネルを、別の祖先集団にそのまま使うと、頻度推定や予測精度に偏りが生じることがあります。これはGWASやPRSの解釈でも重要な問題です。
7. GWASとSNP:病気の「なりやすさ」を全ゲノムから探す
🔍 関連記事:GWAS(ゲノムワイド関連解析)/連鎖不平衡(LD)/ハプロタイプ
SNPが現代医学で大きな役割を持つようになった理由の一つが、GWAS(ゲノムワイド関連解析)です。GWASとは、病気のある人とない人、または身長・血圧・血糖値のような形質の違いを持つ人たちを多数集め、ゲノム全体のSNPを比較する研究方法です。どのSNPが特定の病気や体質と統計的に関連しているかを、全ゲノム規模で探索します。
GWASの特徴は、候補遺伝子を最初から決め打ちしない点です。従来の研究では「この遺伝子が関係していそうだ」と仮説を立てて調べることが多かったのですが、GWASでは数十万から数百万のSNPを一斉に調べます。そのため、糖尿病、心血管疾患、自己免疫疾患、精神疾患、身長、血圧など、複雑な形質に関わる多数のゲノム領域が見つかってきました。
💡 用語解説:GWASとは?
GWASはGenome-Wide Association Studyの略で、日本語ではゲノムワイド関連解析と呼ばれます。病気や体質と関連するSNPを、ゲノム全体から統計的に探す方法です。たとえるなら、30億文字のゲノムの中から「この体質を持つ人に少し多く見られる目印」を探す大規模な比較研究です。ただし、見つかったSNPが必ず原因そのものとは限りません。
GWASで見つかるSNPは「原因」ではなく「目印」のことが多い
ここは非常に重要です。GWASで「あるSNPが病気と関連した」と言われても、そのSNP自体が病気を直接起こしているとは限りません。むしろ多くの場合、GWASで検出されるSNPは、真の原因バリアントと近くにあって一緒に受け継がれやすい「目印」です。この背景にあるのが、次に説明する連鎖不平衡(LD)です。
たとえば、ある地域に火災が多いことを調べたとき、「消防車が多い地域ほど火災が多い」という関連が見えたとします。しかし、消防車が火災を起こしているわけではありません。消防車は火災が多い場所に集まる「目印」です。GWASの関連SNPもこれに似ています。関連SNP=原因変異と短絡すると、医学的解釈を誤る危険があります。
GWASで見つかるSNPの意味
① SNPを比較
患者群と対照群で数十万〜数百万SNPを比較
② 関連SNPを検出
統計的に病気と関連するSNPを発見
③ 原因とは限らない
真の原因バリアントの近くにある目印かもしれない
GWASの結果は「この領域が関係していそう」という強い手がかりです。そこから真の原因バリアントや機能的メカニズムを絞り込むには、ファインマッピング、機能解析、発現解析などの追加研究が必要です。
8. 連鎖不平衡(LD)とハプロタイプ:なぜSNPは一緒に動くのか
ヒトの染色体は、親から子へ受け継がれるとき、全てが完全にバラバラに混ざるわけではありません。近い位置にあるDNA配列は、減数分裂の組換えで切り離されにくく、まとまって受け継がれやすい傾向があります。このため、近くにある複数のSNPは独立に存在するのではなく、一定の組み合わせで一緒に見つかることがあります。この現象が連鎖不平衡(LD)です。
💡 用語解説:連鎖不平衡(LD)とは?
連鎖不平衡とは、近くにある複数の遺伝的バリアントが、偶然から期待される以上に一緒に受け継がれる状態です。SNP同士が「セット」で動くように見えるため、あるSNPを調べるだけで、その近くにある別のSNPや原因バリアントの存在をある程度推測できることがあります。GWASでタグSNPが使えるのは、このLDがあるためです。
LDが強い領域では、1つのSNPを調べるだけで、その周囲の複数のSNPの情報をある程度代表できます。この代表的なSNPをタグSNPと呼びます。SNPアレイが数千万個すべてのバリアントを直接調べなくても、全ゲノム規模の情報を効率よく得られるのは、タグSNPとLD構造を利用しているためです。
ハプロタイプ:染色体上のSNPの組み合わせ
ハプロタイプとは、同じ染色体上に並ぶ複数のSNPやバリアントの組み合わせです。私たちは父から1本、母から1本の染色体を受け取ります。そのため、同じ遺伝子領域でも、父由来の染色体上にあるSNPの組み合わせと、母由来の染色体上にある組み合わせが異なることがあります。
💡 用語解説:ハプロタイプとは?
ハプロタイプは、1本の染色体上に並ぶSNPの「並び方のセット」です。たとえば、ある領域に3つのSNPがあり、父由来の染色体ではA-G-C、母由来の染色体ではG-A-Tという組み合わせになっている場合、それぞれが別のハプロタイプです。ハプロタイプは、祖先解析、疾患関連解析、インピュテーション、薬理ゲノミクスで重要です。
ハプロタイプを考えると、なぜGWASで見つかったSNPが原因そのものとは限らないのかが理解しやすくなります。あるタグSNPが疾患と強く関連していても、そのタグSNPは同じハプロタイプ上にある別の機能的バリアントを代表しているだけかもしれません。そこで、GWASの後にはファインマッピングという作業が行われます。ファインマッピングは、関連領域の中から、実際に機能へ影響している可能性が高いバリアントを絞り込む解析です。
9. ポリジェニックリスクスコア(PRS):多数のSNPを足し合わせる考え方
多くの病気や体質は、1つの遺伝子変化だけで決まるわけではありません。糖尿病、高血圧、心筋梗塞、統合失調症、身長、BMIなどの複雑形質では、多数のSNPがそれぞれ非常に小さな効果を持ち、その合計がリスクや体質に影響します。この多数のSNP効果を足し合わせて、個人の遺伝的ななりやすさを数値化する考え方がポリジェニックリスクスコア(PRS)です。
💡 用語解説:ポリジェニックリスクスコア(PRS)
PRSは、病気や体質に少しずつ関係する多数のSNPを足し合わせて、遺伝的リスクを数値化する方法です。1つひとつのSNPの効果は小さくても、数千〜数百万のSNPを組み合わせることで、集団内で相対的にリスクが高い人・低い人を推定できます。ただし、PRSは診断ではなく、生活習慣・環境・年齢・家族歴などと合わせて見る補助情報です。
PRSを作るときにも、LDは重要です。強く連鎖しているSNPを何個も足し合わせると、同じリスク情報を何度も数えてしまうことがあります。そのため、PRSではLDを考慮して相関の高いSNPを整理するクランピングや、LD構造を統計モデルに組み込む方法が使われます。
また、PRSには祖先集団の問題があります。GWASの多くは歴史的にヨーロッパ系集団を中心に行われてきました。そのため、そこで作られたPRSをアジア系、アフリカ系、その他の集団にそのまま適用すると、予測精度が低下することがあります。これは集団によってアレル頻度やLD構造が異なるためです。PRSは便利な技術ですが、誰にでも同じ精度で使える万能なリスク予測ではありません。
10. SNPと薬理ゲノミクス:薬の効き方が人によって違う理由
🔍 関連記事:ファーマコゲノミクス(薬理ゲノミクス)/ClinVar
SNPは病気との関連だけでなく、「薬の効き方」にも大きく影響します。この分野をファーマコゲノミクス(薬理ゲノミクス)と呼びます。同じ薬を同じ量だけ服用しても、よく効く人もいれば、副作用が強く出る人もいます。その理由の一部は、薬を代謝する酵素や薬の標的となるタンパク質に存在するSNPにあります。
💡 用語解説:ファーマコゲノミクスとは?
ファーマコゲノミクスとは、遺伝情報を利用して薬の効果や副作用を予測する学問です。薬を分解する酵素や薬が作用する分子に存在するSNPを調べることで、「効きやすい人」「効きにくい人」「副作用が起こりやすい人」を推定できます。個別化医療の代表的な応用分野です。
CYP2C19・CYP2D6・HLAは代表例
薬理ゲノミクスで最も有名なのがCYP450酵素群です。たとえばCYP2C19のSNPは、抗血小板薬クロピドグレルやプロトンポンプ阻害薬(PPI)の代謝能力に影響します。代謝能力が低いタイプでは薬の効果や血中濃度が変化するため、治療効果や副作用に違いが生じます。
また、CYP2D6は抗うつ薬、抗精神病薬、オピオイドなど多数の薬剤代謝に関与しています。さらにHLA-B*15:02はカルバマゼピンによる重篤な皮膚障害との関連が知られており、特定集団では投与前の遺伝子検査が推奨されています。
11. AIとSNP解析:AlphaMissenseは何を評価しているのか
近年ではAIを用いたバリアント解釈も急速に進歩しています。代表例がGoogle DeepMindが開発したAlphaMissenseです。ただし、ここで誤解しやすい点があります。
重要ポイント
AlphaMissenseはSNP全体を評価しているAIではありません。評価対象はミスセンスSNVです。つまり、アミノ酸が置き換わる一塩基バリアントがタンパク質機能へどの程度影響するかを予測するAIです。
現在の臨床では、AIの予測だけで病原性を決めることはありません。ClinVar、集団頻度、家系解析、患者さんの症状、機能解析などを総合して解釈します。AIは強力な補助ツールですが、最終判断を置き換えるものではありません。
12. SNPと遺伝子診断・遺伝カウンセリングの関係
🔍 関連記事:臨床遺伝専門医/遺伝カウンセリングとは
SNPという言葉は研究でよく使われますが、実際の医療現場でも重要です。ただし、「SNPが見つかった=病気が確定した」ではありません。遺伝子検査では、SNPなのか希少SNVなのか、病的バリアントなのか、VUS(意義不明バリアント)なのかを区別しながら解釈します。
たとえば単一遺伝子疾患では、集団頻度が高いSNPは病因として除外されることが多く、一方で希少SNVや機能に影響するバリアントが原因候補になります。逆に生活習慣病や多因子疾患では、多数のSNPがわずかな影響を積み重ねて疾患リスクに関与します。したがって、疾患の種類によってSNPの意味は大きく異なります。
臨床で重要なポイント
- ✓SNPは正常な個人差であることが多い
- ✓病気との関連は頻度・機能・症状を合わせて判断する
- ✓薬理ゲノミクスではSNPが治療選択に役立つことがある
- ✓遺伝カウンセリングでは検査結果を生活や家族歴と合わせて説明する
よくある質問(FAQ)
まとめ
SNP(一塩基多型)は、ヒトゲノムに存在する最も一般的な遺伝的多様性です。現在の遺伝医学では、まずSNVという広い概念で一塩基変化を捉え、その中で集団内に比較的高頻度で存在するものをSNPとして扱います。
SNPは病気そのものではありません。しかし、GWASによる疾患関連解析、薬理ゲノミクス、祖先解析、個別化医療、遺伝子診断など、現代医学のさまざまな分野を支える重要な情報です。
一方で、GWASで見つかったSNPが必ず原因変異とは限らず、多くは連鎖不平衡(LD)によって原因バリアントを代表する「目印」です。また、AIによる病原性予測も発展していますが、臨床では集団頻度、機能解析、家系情報、患者さんの症状などを組み合わせて総合的に判断することが欠かせません。
SNPを正しく理解することは、ゲノム医学だけでなく、将来の個別化医療や遺伝子診断を理解する第一歩になります。
参考文献
- National Center for Biotechnology Information. dbSNP. www.ncbi.nlm.nih.gov/snp/
- The 1000 Genomes Project Consortium. A global reference for human genetic variation. Nature. 2015. Nature
- International HapMap Consortium. A haplotype map of the human genome. Nature. 2005. Nature
- Karczewski KJ, et al. The mutational constraint spectrum quantified from variation in humans. Nature. 2020. Nature
- Richards S, et al. Standards and guidelines for the interpretation of sequence variants. Genetics in Medicine. 2015. Genetics in Medicine
- ClinVar. NCBI. www.ncbi.nlm.nih.gov/clinvar/
- Genome-wide association studies. NHGRI. NHGRI



