目次
DNA転写因子とその調節
転写とは
タンパクをコードする遺伝子がRNAポリメラーゼⅡにより最終RNA産物の5′UTRの5’末端に相当する転写開始点から開始してRNAに合成される過程を転写といいます。
一次転写産物RNAの合成は5’→ 3′の方向になされます。RNA合成の鋳型として転写される遺伝子の鎖は実際には、デオキシリボースのホスホジェステル骨格に沿って3’→ 5’の方向に読み取られていきます。
DNA からmRNAへの転写はRNAポリメラーゼⅡによって触媒されます。DNAは二重らせん構造なので、RNAポリメラーゼは二重らせんをほどかないと転写できません。ほどきつつ、二本鎖のうち鋳型となる鎖の塩基の配列を読んで、これと相補的(complement)な塩基のヌクレオチドを結合します。RNA の鎖の合成は5’→3’の方向になされ、コード鎖と同じ塩基配列で、TがUとなっただけの相補的配列のmRNA ができあがります。
5’→ 3′ 方向の転写されないほうのDNA鎖をコード鎖、またはセンス鎖(sense strand)とよびます。また、3’→ 5’方向の転写される鋳型DNA鎖は、非コード鎖あるいはアンチセンス鎖(antisense strand)とよばれます。
遺伝子のイントロンとエクソンの部分が転写された後、転写は、成熟mRNAの3’末端に相当する位置を超えたところまで続きます。転写の3’側の転写終結部位が決められているかどうかはまだわかっていません。
一次転写産物RNAには5’末端に化学的にキャップと呼ばれる構造が付加され、3’末端はコード領域の終結点の下流にあるきまった特異的な部位で切断され、この2つの過程をプロセシングとよびます。RNAの3’末端はこのような切断を受けた後そこにポリAテールが付加されます。ポリAテールが付加されたポリアデニル化RNAは安定性が増すのだと考えられている。ポリアデニル化部位の配列は大体は、AAUAAA(もしくはこの変形)で、通常、RNA転写産物の3’非翻訳領域にあります。RNAスプライシングの過程とおなじく、転写後修飾はすべて核内で行われます。プロセシングが完了したRNAはmRNAとよばれ、次に細胞質に輸送され、細胞質で翻訳されます。
※ミトコンドリアについては別途記載する。
遺伝子発現の基礎
詳細に研究されているβグロビン遺伝子がよく例に挙げられます。
βグロビン鎖は146個のアミノ酸からなるポリペプチドで、11番染色体の短腕のおよそ1.6kbを占める遺伝子にコードされています。3つのエクソンと2つのイントロンをもち、βグロビン遺伝子が転写される方向はセントロメアからテロメアに向かう方向で、これはβグロビンクラスターを形成する他の遺伝子も同じですが、転写の方向は、ゲノム上の遺伝子ごとに異なり、DNA二重らせんのどちらの鎖がコード鎖であるかによって決まります。
βグロビン遺伝子の正確な転写開始に必要なDNA配列は、転写開始点から上流およそ200bpに位置するプロモーターにあります。
上の図はβグロビン遺伝子のこの領域の二本鎖DNA配列と、 それに対応するRNA配列、そして翻訳される最初の10アミノ酸の配列を示したものです。鋳型鎖として実際に転写されるのは3’→ 5’方向のDNA鎖なのですが、 5'→ 3’方向のDNA鎖は、mRNAの5’→ 3’方向の配列にUがTにかわっている点を除けば一致します。この対応のため、遺伝子の5’→ 3’方向のDNA鎖(転写されない鎖)が科学論文やデータベースで一般的に報告されている鎖となっています。
この決まりにしたがって11番染色体のβグロビン遺伝子の部分の完全な配列を見てみましょう。
目がちかちかしますよ!
この2.0kb内に、 βグロビン遺伝子をコードする配列、その発現の調節に必要な調節配列が大体含まれています。
βグロビン遺伝子の重要な構造的特徴も示されており、プロモーター配列、イントロンとエクソンの境界、5’および3’の非翻訳領域、RNAスプライス部位、 開始コドンと終止コドン、ポリアデニル化シグナルなどです。すべての部位での病的バリアントが、 βグロビン逍伝子が関与するさまざまな遺伝病で知られています。
転写の開始
遺伝子のプロモーターは比較的短い調節配列からなり、転写を制御する特異的なタンパク(転写因子transcription factor)と相互に作用します。
グロビン遣伝子の場合は、ヘモグロビン産生細胞である赤血球系細胞においてのみグロビン遺伝子群が発現するように転写因子が制御しています。
ゲノムには千以上の配列特異的なDNA結合転写因子があります。発現する場所は細胞の種類や組織を限っているものからすべての細胞で発現するものまで様々です。
TATAボックス
すべてではないが多くの遺伝子で見られる重要なプロモーター配列の1つがTATAボックス(TATAbox)と呼ばれる保存された(生物種などを超えて同じであることを保存されているといいます)配列で、転写開始部位のおよそ25~30bp(塩基対)上流に存在し、 アデニンとチミンが豊富な配列であるとなっています。TATAボックスは転写開始点の決定に重要ですが、5’側のこのおよそ50塩基対の配列は転写はされるのですが闘訳はされません。
他の遺伝子のなかには、この5’UTRがもっと長くて複数のイントロンによって分断されているというものもあります。
CATボックス
2つ目の保存された領域は、CATボックスとよばれるもので、実際の配列はCCAATとなっています、TATAボックスのさらに上流数十塩基対のところにあります。
転写因子の配列のバリアント
TATAボックスやCATボックス、あるいはこれらよりさらに上流に存在するその他の調節配列にバリアントが起こると、転写レベルが急激に低下します。したがってこれらの配列が正常な遺伝子発現に重要であることが伺われます。ヘモグロビン異常をきたす疾患であるβサラセミアの患者ではこれらの調節配列の変異が多数見つかっています。
CpGアイランド
すべての遺伝子のプロモーターがCATとTATAボックスを持つわけではなく、通常、CATやTATAボックスは組織特異的遺伝子に認められます。
一方、ハウスキーピング遺伝子とよばれるほぼすべての組織で構成的に発現している遣伝子にはCATやTATAボックスが認められないことが多く、これらのプロモーターには周囲のDNA配列に比べてシトシンとグアニンの割合が高いものが多くなっています。CGが農富なプロモーターは、CpGアイランド(CpG island)とよばれるゲノムの場所にあることが多くなっています。CpGのpは隣接塩基間のリン酸基を表しています。
CpGアイランドとはジヌクレオチドである5′-CpG-3’が多く集中している領域です。ゲノムには一般的にATが豊富なので、 CpGアイランドは目立つ存在です。
プロモーターでみられるCGが豊富な配列の一部は特異的転写因子の結合部位であると考えられています。CpGアイランドはDNAメチル化の標的としても重要なものです。
→ヒストンコードをリンクをクリックしてご覧ください。
CpGアイランドでの過度なDNAメチル化はDNAをぎゅっと畳み込まれた構造にするため、遺伝子転写を抑制します。
RNAポリメラーゼⅡ(RNA pol Ⅱ)による転写調節
RNAポリメラーゼⅡ(RNA pol Ⅱ)による転写調節は、プロモーターヘの結合、転写の
開始、DNA二重らせんをほどいて鋳型鎖を露出、DNAに沿ってRNAポリメラーゼⅡが移動しRNA鎖が伸長する様々な段階で行われます。
発現が抑制されている遺伝子は、RNAポリメラーゼⅡとまったく結合しないことにより、特定の種類の細胞内で転写されないように調節されていることもあります。
またRNAポリメラーゼⅡが転写開始点で両方向に結合できるようになっていて特定の細胞シグナルに応答して転写を微調整できるものもあります。
エンハンサー
プロモーターではないのに、転写効率を大きく変えることのできる配列があり、エンハンサー(enhancer)はその一つとしてよく知られています。
エンハンサーは、遺伝子から数kb~数百、数千kbも離れたところにあり、遺伝子の転写を促進させる調節配列です。
プロモーターとは異なり、エンハンサーは位置も方向性も独立していて転写開始部位の5’側にも3’側にも存在します。
特定のエンハンサー配列は限られた種類の細胞でのみ働き、多くの遺伝子でいくつかの転写因子と協働して組織特異性や発現レベルに関与します。
βグロビン遺伝子ではいくつかの組織特異的エンハンサーが遺伝子内と遺伝子の隣接領域にあります。エンハンサーと特定の調節タンパクの相互作用は、転写レベルの上昇を引き起こし、タンパクがたくさん作られることになります。
逆にこの配列に病的バリアントを来すとβグロビン遺伝子の発現は抑制されます。
座位制御領域(LCR)
発生過程でのβグロビン遺伝子の正常な発現にはもっと離れた座位制御領域(LCR)とよばれる配列も必要です。この配列はεグロビン遺伝子の上流にあり、正確なクロマチン構造を構築して高水準な発現が行えるようにします。
この配列に病的バリアントを来すとβグロビン遺伝子の発現は抑制されます。
【関連記事】