RGGボックス
タンパク質の機能は、ドメインとモチーフからなるアミノ酸配列に支配されている。タンパク質が含むドメインの種類は、そのタンパク質に固有の特性を与え、その結果、そのタンパク質が属する経路に影響を与える。タンパク質のドメインは、キナーゼやメチルトランスフェラーゼ活性のような酵素特性を持っていたり、ジンクフィンガーやSH3ドメインのように核酸やタンパクのアミノ酸配列と相互作用する性質を持っているものもある。タンパク質ドメインは、他のモジュール(構造・機能する単位)型タンパク質ドメインや、相互作用するパートナーに存在する短い保存されたモチーフ配列と相互作用することによって、その機能の一部を発揮することができる。モチーフはDNA、RNA、タンパクのアミノ酸配列中に存在し、タンパクドメインの結合部位やリガンドとして働くことがある。タンパク質モチーフのアミノ酸配列は、そのモチーフの機能と特異性を決定する。アルギニンは正電荷の残基であり、タンパク質モチーフによく存在し、翻訳後修飾によって制御される。アルギニンを含むモチーフはいくつかあるが、RGGとRGの繰り返し配列は総称してRGG/RGモチーフと呼ばれる。
RGGモチーフは、転写調節、細胞増殖および成長の基本的な側面に関与する遍在性の核小体リンタンパク質であるヌクレオリンのC末端に存在するアルギニン(RGGGFGGRGGFGDRGGGRGGG)の全部が二メチル化アルギニンでがあることが報告され、RGG配列がタンパク質アルギニンメチルトランスフェラーゼ(Protein Arginine Methyltransferase; PRMT)が認識する部位であると示唆された(論文)。これらメチル化されたアルギニンモチーフは、しばしばグリシン-アルギニンリッチ(GAR)領域と呼ばれる。
その後、HnRNP U(heterogeneous nuclear ribonucleoprotein U)の繰り返しRGG配列がホモポリマーRNAと結合することが明らかになり、RNA結合に必要な配列がRGGDFRGGAPGGDRGGあることがマッピングされた。hnRNP Uの3つのRGG配列を異なる種間で塩基配列決定したところ、進化的に保存されたモチーフが見つかり、RGGボックスと名づけられた。RGG boxモチーフは進化的に保存された配列であり、ヒトゲノムの約15遺伝子内に約70箇所存在することも判明した。正電荷を持つアミノ酸はほかにもリジンやヒスチジンが存在するが、RGG/RGモチーフにはアルギニンしか存在しておらず、アルギニンは正電荷以外の異なる特性ゆえにモチーフに含まれることが示唆された。



