ゲノムから表現型へ
ヒトゲノムは30億文字のデジタルコード
ヒトゲノムには30億個のヌクレオチドがあります。いわば30億文字のデジタルコード。
ヒトの体細胞はすべて同じ遺伝情報を持ちます。ということは、最初の1つの受精卵と同じです。なのにどうして心臓になったり肝臓になったりするんでしょうか?胎児のときには胎盤や臍帯を作りますよね。そしてそういう臓器は一過性に出来て二度と作られません。それらを作る遺伝情報はすべての細胞が持っています。こうしたヒトの解剖学的、生理学的、生化学的複雑さをどのようにして実現しているのでしょうか?
この謎を解くカギは、ゲノム上の遺伝子から細胞内の遺伝子産物(遺伝子からできたもの)を経て個体の表現型(phenotype)へと進む過程における遺伝情報の大幅な増幅と統合にあります。
ゲノムから表現型へ
表現型とは、遺伝情報が細胞形態や臨床的・生化学的特徴などの観察可能な特徴として表現されたものをいいます。
たとえば身長、髪の色、目の色、肌の色なども表現型です。
ゲノムから表現型へと遺伝情報は段階的に実現していくのですが、これにはゲノムの産物であるタンパクやRNAが働きます。
タンパクは体のあらゆる場所と細胞器官で体の多くの機能を担っています。RNAには体の構造や調節に関わる多種多様なものが
存在しています。
ヒトゲノムのほぼ完全な配列は判明しましたが、ゲノムに存在する遺伝子の正確な数は不明のままです。
現在ゲノムには約2万のタンパクをコードする遣伝子(protein-coding gene)が椎定されています。
遺伝子の産物は タンパク RNA の2種類があり、それぞれが
・細胞の代謝
・細胞のシグナル伝達
・細胞運動
・細胞分裂
・細胞接着
・細胞のストレス応答
において様々な働きをします。
そして、それらの細胞の機能の統合の結果、臓器が出来たり保たれたりという解剖学的な表現型、臓器の機能という生理学的な表現型、神経の働きで動いたり考えたりという行動のなどの表現型が現れます。
最終的には統合して一つの個体を規定しています。
タンパクをコードする遺伝子の産物はタンパクで、タンパクの機能は基その構造により決定されます。遺伝子子とタンパクが単純に1対l対応しているなら、 タンパクは最大でも約2万種類しかないことになるのですが、これではヒトが生涯の間に発揮する細胞の膨大な種類の機能の説明がつきません。
われわれはこのジレンマをどう解決しているのでしょうか?
驚くことに、多くの遺伝子が多数の異なる産物をつくれるのです。
遺伝子のコード領域の一部分を選択的に用いることができるのです。
また、コードされているタンパクを翻訳した後に生化学的に修飾したりすることで遺伝子産物の多様性を実現しています。
これらの2つの過程が加わることでタンパクが持つ情報量は大幅に増えることになります。
実際、20、000個のヒト遺伝子から数十万種類のタンパクをコードしていると推定され、これらのタンパクはまとめてプロテオーム(proteome)とよばれている。
また、個々のタンパクは単独で機能するわけではなく、精巧なネット
ワークを形成することにより機能を実現しています。このネットワークには多くの種類のタンパクと調節RNAが関与していて、各種の遺伝学的・発生学的、および環境シグナルに対して協働的に応答します。
遺伝子のゲノム上の密度
遺伝子はゲノム上の至るところに存在するのではありますが、特定の染色体の特定の領域にクラスター(集合体)を形成したりする一方で、比較的まばらにしか存在しない領域や染色体もあり、密度は染色体により異なるし、同じ染色体でも均等に配置されているわけではなく多いところ、少ないところがあります。
例えば約135Mb(Mbは100万塩基対)からなる11番染色体は遺伝子が多くて、コード遺伝子は1300個あるのですが、これらの遺伝子は染色体上にランダムに分布しているわけではなく、遺伝子密度が特に高い2つの染色体領域では10kb(Kbは1000塩基対)ごとに1つの遺伝子が存在しています。遺伝子が乏しい領域では1Mb以上にわたりコード遺伝子がまったくないというところが何か所かあります。
【関連記事】