遺伝子のバリアントとは

遺伝子バリアントの種類

一塩基バリアントのホットスポット

変異のホットスボットと呼ばれる場所があります。

DNAの配列が書き換わるときは、共通している骨格ではなく違いがある塩基のところでおこります。
プリン塩基(AG)同士(GがA、またはAがG)、またはピリミジン塩基(CT)同士(CがT、またはTがC)の置換による塩基の変化はトランジション(transition)と呼ばれます。一方、ピリミジンからプリン(またはその逆)への置換はトランスバージョン(tansversion)と呼ばれます。もし塩基置換がランダムに起こるとすると、トランスバージョンはトランジションの2倍起こるはずですよね?各塩基は2通りのトランスバージョンの可能性があるのですが、トランジションには1通りの可能性しかないからです。
ところが、さまざまな変異をみていくと、これらのいずれかの種類の塩基置換が選択的に引き起こされていることがわかります。例えば、トランジションは、遺伝性疾患の原因となる1塩基置換のなかに非常に多く存在します。

ヒトゲノムDNAの修飾として重要なものに、シトシン残基のメチル化(methylation 5-メチルシトシンを形成する)がありますが、特に、シトシン残基がグアニン残基のすぐ5′側にある場合(5′-CG-3’)に起こります。上の図のシトシンとチミンの構造を比較すると、シトシンがメチル化(赤丸のメチル基が付加される)されて脱アミノ(青〇のアミノ基が取れる)するとチミンになりますよね?CGのジヌクレオチドでの5-メチルシトシンからチミジンヘの脱アミン化は、C>TまたはG>Aトランジションを引き起こします。反対側のらせんの5′-CG-3′5′-TG-3′に置換され、最終的にはこちら側も相補的5′-GC-3’から5′-AC-3’にかわるからです。記載の仕方としてはC>TはCがTに替わってしまっている、という意味です。ですので、どちらのDNA鎖の5‐メチルシトシンが変異を受けるかにより、置換がおこる内容は変わるのですが。すべての一塩基置換の30%以上はこのタイプの変異として起こっていて、これは他の一塩基変異の25倍の頻度と言われています。したがってCGのジヌクレオチド部位は、ヒトゲノムにおける変異の真のホットスポットなのです。

1塩基多型

すべての多型の最も単純で最もありふれたものは一塩基多型 (singlenucleotide polymorphism :SNP)(スニップと読みます)と言われるものです。

*多型は集団のなかで1%以上の人が持っている正常な変異と定義されていましたが、混乱を招くため2015年の米国人類遺伝学会のガイドライン改訂により使用しないこととなりました。

【遺伝医学用語】バリアントの分類方法について1


突然変異ヌクレオチド配列の恒久的変化と定義され、多型は1%を超える頻度をもつ変異体と定義される。
しかし、広く使われている「突然変異」や「多型」という言葉は、しばしばそれぞれ病原性および良性作用の誤った仮定により混乱を招く。

したがって,両用語を「バリアント」という用語に置き換えて、
(1)病原性、(2)病原性の可能性が高い、(3)意義不明、(4)良性の可能性が高い、または(5)良性
の修飾語とすることが推奨される。
これらの修飾因子はすべてのヒトの表現型を扱うわけではないが、本ガイダンスで扱うメンデル病に関連する変異体の分類の5段階のシステムを構成する。

SNPによって特徴付けされる座位は、ゲノムの特定部位で塩基が一つ標準配列と違うものに置換されていて、わずか2つのアレルのみが通常は認められるものです。
SNP はありふれたもので、平均するとゲノムの1000塩基対ごとに1つ観察されます。しかし、SNPゲノム中に均ーに分布しているのではなく、多くのSNPイントロンや既知の遺伝子からいくらか離れた、ゲノムの非コード部分に検出されるので、遺伝子の産物であるタンパクの機能に影響はありません。とはいってもかなりの数のSNP遺伝子内や他のゲノム中の既知の機能的部分に存在していることになります。

タンパク質をコードする遺伝子では、10万個以上のエクソンSNPが現在までに報告されています。

これらのうちの約半数が翻訳されてもタンパクの予測されるアミノ酸配列が変わらない同義(synonymous)置換です。

遺伝子からmRNAの翻訳
コドン
については、リンク先を見てください。

塩基3つが一組のコドンとなりアミノ酸と対応しているので、C>TまたはG>Aがおこったところでコードしているアミノ酸は同じ、という組み合わせもコドン票を見ると結構ありますよね。

しかし、残りの半数はアミノ酸配列を変化させるもので非同義(nonsynonymous)置換と呼ばれるものとなります。
特に、この一塩基置換のために終止コドン(ここでタンパク合成をやめますという信号)を形成または変化させる(終止しないようになってしまう)もの、あるいは既知のスプライス部位を改変してしまうものがあり、そのようなSNPは重大な機能的影響をもたらす可能性があります。

RNAプロセシング


詳しくはリンク先をご覧ください。
5′末端の配列は9塩基からなりそのうちの2塩基はGT(RNA転写産物ではGU)で、スプライス部位に隣接するイントロンに位置します。
3′末端の配列はおよそ12塩基からなり、こちらもそのうち2塩基がAGで、イントロンエクソンの境界のすぐ5′側に存在します。
どちらも正常なスプライシングに不可欠です。この 5’GT AG3’ に書き換えがおこってしまうと、正常にスプライシングされなくなってしまいます。

大多数のSNPの健康への意義は未知で、解明する研究が進行中です。事実、SNPがありふれていることと健康または長寿に影響がないこととは別の次元の問題です。ありふれたSNPは深刻な病気を直接引き起こすのではなく疾患感受性(なりやすさ、なりにくさ)を変化させるものが多いようです。

挿入欠失多型

多型の類型の2つ目はl塩基対~千塩基対までがどこかに挿入(insertion)またはどこかから欠失(deletion)すること(in/delまたは単純にindelと表します)で引き起こされるバリエーションの結果によるものです。より大きなindelもよく報告されています。100万を超えるindelも報告されていて、どんな個人のゲノムにも集計すると数十万個のindelが認められることになります。(したがって正常なDNA塩基配列はなく、標準配列です)
すべてのindelの約半数が挿入または欠失された断片が存在する、しない、という2つのアレルのみを有する単純なindelです。

マイクロサテライト多型

その他のindelとして、特定の位置に縦列繰り返し挿入されるDNAの断片数が可変で多彩なアレルを有するものがあり、マイクロサテライト(microsatellite)と呼ばれています。これらは、TGTGTG、TAATAATAA、またはCCCTCCCTCCCTのように2、3、4個のヌクレオチドからなるDNAユニットが連続した構造をしていて、ゲノムの特定の場所で1回から数十回の間で反復されています。
マイクロサテライト多型における異なるアレルは、1つのマイクロサテライト内でのヌクレオチドユニットの繰り返しの回数が変わってしまうもので、時に短い縦列反復配列多型short tandem repeat (STR) polymorphismと呼ばれています。
1つのマイクロサテライト座位で、 しばしば多くのリピート長の違うアレルが見られ、これが個人識別や家族の関係性を推定するための標準的な検査手法となり、迅速に評価ができるようになっています。何万個ものマイクロサテライト多型座位がヒトゲノム全休に存在することが知られている。
マイクロサテライトはとりわけ有用なindelのグループで、複数のマイクロサテライト座位のアレルを決定することは今日では個人識別テストに利用されるDNAフィンガープリント法(DNA fingerprinting)として使われています。
米国の連邦捜査局FBIでは、そのような13座位のアレルの収集をDNAフィンガープリントパネルとして現在利用しているそうです。
一卵性双生児ではないある2個人が13座位のすべてで厳密に同じアレルを有していることはあり得ないことで、このパネルで2つの試料が同一人物由来であるのかどうかを確実に決定することができます。

可動遺伝因子の挿入多型

DNA“>ヒトゲノムのほとんど半分がゲノム全体に分散する反復配列のファミリーから成り立っています 。
反復配列コピーの多くはゲノム上の位置が変わらないものですが、一部は可動であり、レトロトランスポジション (retro transposition)と呼ばれる過程を通してヒトの遺伝学的多様性を作り出しています。
レトロトランスポジションの過程には、RNAへの転写およびゲノムの他の領域への挿入(転移)が含まれ、 偽遺伝子が形成される機構として重要となります。
2つの最もありふれた司動遺伝因子ファミリーはAluLINEファミリーのリピートであり、 異なる集団で約1万個の可動遺伝因子の挿入多型が報告されています。それぞれの多型座位では可動遺伝因子の挿入が存在する、しない、という2つのアレルがあることになります。
可動遺伝因子多型はすべてのヒト染色体上に見つかっており多くはゲノムの非遺伝子領域に見つかっていますが、遺伝子内にあるものもあります。こうした多型座位の少なくとも5千個についてはいろんな集団における挿入の頻度が10%を大きく上回っています。

コピー数バリアント

ヒトDNA多型として重要なものに、コピー数バリアント copy number variant(CNV)があります。
CNVは概念的にindelやマイクロサテライトと関連してはいるのですが、千塩基対から何十万塩基対といった大きなサイズのゲノム断片のコピー数のバリエーションです。50万塩基より大きなバリアントが一般集団の5~10%の個体で検出され、1Mb(100万塩基)以上の領域を含むバリアントも1~2%に検出されます。
最大のCNVは相同性の高い配列のブロックが反復する特徴がある分節重複(segmental duplicationもしくはsegdup)と呼ばれるゲノム領域で時折見受けられます。
このような領域の仲介で生じる重複や欠失は種々の染色体異常症候群で認められます。
小さなCNVはとりわけある断片が存在する、しない、という2つのアレルのみを持ちindelと同様と考えれれています。
大きなCNVは異なるコピー数のDNA断片が縦列に存在することによって多様なアレルを示す傾向があります。

個人間のゲノムの多様性という観点では、多様性のある個所はSNPが半数以上を占めるものの、その多様性に包まれるDNAの量ではCNVの方がSNPによるものよりもはるかに上回るため、CNV座位のコピー数の違いにより、任意の二人のゲノムの含有量は、50-100Mb以上の差異となり得ます。特に多くのCNV座位の可変領域では1個から数十個もの遺伝子が含まれていて、これによりCNVは、包含する遺伝子量を変化させ、形質に頻繁に影響を及ほします。CNVが多型と見なすことができるほど十分な頻度で存在するときはありふれたバリエーションと言え、患者にコピー数の変化があれば、それは適切に解釈されなければなりません。健康や疾患への感受性においてはCNVアレルの違いは重要であり、徹底的に研究されるべき課題です。

逆位多型

数塩基対から数Mbという大きなゲノム領域までのさまざまなサイズが異なる個体のゲノムにおいてその方向が異なっていることを言う。
逆位断片の両端に存在する配列相同性のある領域が特徴的で、逆位が相同組換えの過程で生じることを示唆するものです。
均衡型では逆位領域の方向によらず、DNAの重複や欠失は伴いません。
逆位多型(2つのアレルはそれぞれの方向に相当)は一般集団中で相当な頻度あるものです。
異常な組換えの結果として相同領域間に位置するDNAの重複や欠失が生じて臨床的な表現型(疾患)と関連していることもあります。

【関連記事】

遺伝病を理解するためのヒトゲノム入門編:索引にもどる

この記事の筆者

1995年医師免許取得。血液・呼吸器・感染症内科を経て、臓器別・疾患別の縦割りの医療の在り方に疑問を感じ、人を人として”全人的”に診療したいという思いを強くし、臓器を網羅した横断的専門医となり、2010年にがん薬物療法専門医取得(2019年現在全国1200人程度)。臓器を網羅すると遺伝性がんへの対策が必要と気づき、2011年に臨床遺伝専門医取得(2019年現在全国1000人程度)。遺伝相談はセンシティブな分野にもかかわらず、昼間の短い時間しか対応できない大病院のありかたに疑問を感じて、もっと必要な人がハードルを感じずに診療を受けられるようにしたいと2014年12月に開業。以来、全国から大学病院でも難しい内容の対応を求める人々を受け入れ、よろづお悩み相談所として多くの人々の様々な”家族(計画)の問題”を改善に導く。

著書に”女性のがんの本当の話”(ワニブックス)、”遺伝するがん・しないがん”(法研)がある。
少ない専門家で、正直で嘘のない言葉選びから週刊誌等の取材も多く、医療系の特集に時折コメントが掲載。(週刊現代、週刊ポスト、週刊新潮など)。
テレビ出演も時々あり、小林真央さんの病状を市川海老蔵さんが初めて記者会見した日、フジテレビの午後4時台のニュース番組に生出演して解説。その他TBS, AbemaTVなど出演。

一人一人の事情に合わせた個別対応をするべく、しっかり時間を取って本当のニーズは何かを聞き取りすることを大切にしている。短い時間でもお互いが出会ったことが相手の人生に大きな意味があるような医師患者関係の構築を理想として日々精進。

患者さんが抱えている問題を解決するにはどうしたらよいのかを考えて医師歴8年目に法学部に学士入学した程度に”凝り性”。女医が少なかった時代に3人の母親として難関専門医を3つ取得して社会進出を続けた経験から、女性のライフスタイルを医学以外の部分でも支援したいと願っている。
いろんな人生経験から心に響く言葉を投げかけるため、”会うと元気になる”ということで有名。飼いネコ3匹。

プロフィールはこちら

 

Pocket