目次

私たちの細胞の核の中には、約30億塩基対ものDNAが「クロマチン」という複雑な構造に折りたたまれて収納されています。この膨大な情報の中から「いつ・どの遺伝子を・どの程度読むか」を精密に制御しているのが、転写調節因子と呼ばれるタンパク質群です。その中でも、SANDドメインという特別な構造モジュールを持つタンパク質ファミリーは、遺伝子のON/OFFを切り替える「分子論理ゲート」として、神経発達・免疫自己寛容・抗ウイルス応答など生命の根幹に関わる多彩な機能を担っています。
SANDドメインを持つタンパク質には、神経発達に不可欠なDEAF-1、免疫自己寛容の要となるAIRE、抗ウイルス防御に働くSp100などが含まれます。これらの遺伝子に変異が生じると、重篤な神経発達障害や自己免疫疾患が引き起こされることが知られています。本ページでは、SANDドメイン含有タンパク質ファミリーの構造・機能・進化的背景を、わかりやすく詳しく解説します。
SANDドメインとは?——「分子論理ゲート」の正体
SANDドメインとは、約80個のアミノ酸残基からなる、進化的に高度に保存された「タンパク質構造モジュール(ドメイン)」です。
SANDは4つの代表的な核内タンパク質の頭文字に由来します:
Sp100(Speckled protein 100 kDa)・AIRE-1(Autoimmune regulator 1)・NucP41/75(現在のSND1)・DEAF-1(Deformed epidermal autoregulatory factor 1)。
約80アミノ酸のこの保存領域は、植物から動物に至る広範な真核生物の核タンパク質に見出され、DNAへの特異的結合または他の転写調節因子との結合を介してクロマチン制御と遺伝子発現の調節を担います。
SANDドメインの最大の特徴は、一つのコンパクトな構造の中に、「DNAを読む面」と「他のタンパク質を招く面」という2つの独立した機能面を持っていることです。この二面性が、SANDドメインを複雑な転写複合体の中核として機能させ、「特定のDNA配列」と「特定のクロマチン修飾状態」の両条件が揃ったときにのみ遺伝子転写を起動する分子ANDゲートたらしめています。
核の中でDNAはヒストンというタンパク質に巻き付いて「ヌクレオソーム」を形成し、さらに折りたたまれた「クロマチン」として収納されています。この構造が遺伝子の読み取りやすさを物理的に制御しており、クロマチンの状態(開いているか・閉じているか)が遺伝子発現の大きな鍵を握っています。
SANDドメインの三次元構造とDNA結合のメカニズム
SANDドメインの機能を理解するには、その精巧な立体構造が欠かせません。
α/βフォールド——既知に類を見ない新規のDNA結合構造
タンパク質の立体構造の基本単位として、螺旋状の「αヘリックス」とジグザグ状の「βストランド」があります。SANDドメインは5本の逆平行βストランドと4本のαヘリックスが組み合わさったα/β構造を持ちます。NMRおよびX線結晶構造解析で決定されたこの構造は、ジンクフィンガーやヘリックス・ターン・ヘリックスなど既知のDNA結合ドメインとは全く異なる完全に新規のフォールドであることが証明されています。唯一の例外として、TGF-βシグナル伝達に関与するSkiタンパク質の一部が類似性を示すと報告されています。
KDWKモチーフ——DNA認識の決定的な鍵
KDWKとは、リジン(K)・アスパラギン酸(D)・トリプトファン(W)・リジン(K)という4つのアミノ酸の特定の並びを指します。SANDドメインのαヘリックス領域に位置し、正に帯電した「パッチ(局所的な表面領域)」を形成します。DNAはリン酸骨格のため全体として負に帯電しているため、このKDWKを中心とした正電荷面が静電的引力でDNAを引き寄せ、標的となる特定の塩基配列を認識して結合します。NMRによる化学シフト摂動実験によれば、DNA結合時に大きく変動するアミノ酸残基群は専らこのKDWKモチーフを中心とするαヘリックス面にマッピングされます。
SANDドメインは一つの分子内に物理的・機能的に独立した2つのインターフェースを持ちます。
(DNA結合面)
(タンパク質相互作用面)
モジュラーアーキテクチャ——エピジェネティック論理回路の形成
SANDドメイン含有タンパク質はSANDドメイン単独ではなく、他のエピジェネティック制御モジュールと組み合わさった「モジュラーアーキテクチャ」を形成します。
DNAの塩基配列自体を変えることなく、DNAのメチル化やヒストンタンパク質の化学修飾(アセチル化・メチル化など)によって遺伝子発現を制御する仕組みです。同じDNA配列を持つ細胞が、組織ごとに異なる遺伝子を発現できる理由がエピジェネティクスにあります。PHDフィンガーはH3K4me0(非メチル化H3)を、ブロモドメインはアセチル化ヒストンを認識する代表的なエピジェネティック読取モジュールです。

SANDドメインが「分子論理ゲート(ANDゲート)」と表現される理由は、単にDNAに結合するだけでなく、「特定のDNA配列が非メチル化状態であること」と「PHDやブロモドメインが認識する特定のヒストン修飾状態が揃っていること」——この2条件が同時に満たされた場合にのみ遺伝子転写が起動するという、精密な二入力スイッチの仕組みにあります。コンピュータの回路に例えるなら、両方の入力がONのときだけ出力がONになるAND回路そのものです。
臨床遺伝専門医として患者さんに説明する際、「遺伝子のスイッチは単純なON/OFFではなく、複数の鍵が同時に揃ったときだけ動く精巧な錠前です」という言い方をしています。SANDドメインはその錠前の中核となる部品であり、この精巧さゆえに変異が生じたとき、神経発達や免疫に壊滅的な影響が現れるのです。
主要なSANDドメイン含有タンパク質ファミリー
SANDドメインを持つタンパク質には、生命維持に直結する多彩なファミリーが存在します。
① DEAF-1(NUDR)——神経発達と癌抑制の鍵
DEAF-1(Deformed epidermal autoregulatory factor 1、ヒトではNUDRとも呼ばれる)は、胚発生・中枢神経系の構築に必須の転写因子です。マウスの遺伝子ノックアウト実験では、DEAF-1を完全に欠損したホモ接合体マウスは新生児期に100%致死となります。ヘテロ接合体は生存可能ですが行動学的異常を呈することが報告されており、DEAF-1が発生初期において不可欠であることを明確に示しています。
DEAF-1はSANDドメインによるDNA結合に加え、MYNDドメインを介して乳癌関連タンパク質LMO4や腫瘍抑制因子BRCA1と直接相互作用することが知られており、神経発達から癌抑制に至る広範な生物学的機能のハブとして機能しています。
② AIRE——免疫自己寛容の守護者
AIRE(Autoimmune regulator)は、胸腺の髄質上皮細胞に特異的に発現し、中枢性免疫自己寛容の確立に絶対的な役割を果たします。胸腺内でAIREはインスリンなど全身組織に特有の抗原を強制的に発現させ、それに強く反応してしまう危険なT細胞をアポトーシス(細胞死)に導き排除します(負の選択)。
AIREのSANDドメインは、他のファミリーと異なり標準的なKDWKモチーフを欠損しています。そのため、典型的なDNA直接結合よりも、DNA-PKやRAG1/RAG2などの転写共役因子・スプライシング因子とのタンパク質間相互作用の足場として機能する、高度に特化した形態をとっています。
③ Sp100ファミリー——抗ウイルス免疫の最前線
Sp100ファミリーは、核内の非膜性細胞小器官であるPMLボディ(PML nuclear bodies / ND10)の主要構成成分です。選択的スプライシングにより、Sp100A・B・C・HMGというアイソフォームが生成され、このうちB・C・HMGがSANDドメインを有します。
単純ヘルペスウイルス(HSV-1)やヒトパピローマウイルス(HPV-18)などが細胞内に侵入すると、Sp100はSANDドメインを介してウイルスゲノム特有の「非メチル化CpGジヌクレオチド」を認識し、PML・Daxx・Sp100などのND10コンポーネントを凝集させてウイルスの遺伝子発現を初期段階で封じ込めます。さらに、インターフェロン(IFN)刺激に応答してSp100AはPI3K経路を介してリン酸化され、PKM2とともに核内へ移行し、強力な抗ウイルス性インターフェロン刺激遺伝子(ISG)の発現を一気に活性化します。
Sp100ファミリーのパラログSp140(LYSP100)は、主に白血球核内に高発現するインターフェロン誘導性タンパク質であり、多発性硬化症・クローン病・慢性リンパ性白血病(CLL)との関連がGWASで実証されています。
④ SND1(NucP41/75)——多機能な転写コアクチベーター
SANDドメインの命名元の一つであるNucP41/75は、現在ではSND1(Staphylococcal nuclease domain-containing protein 1)またはp100コアクチベーターとして知られ、エンドヌクレアーゼ活性・マイクロRNA(miRNA)分解促進・STAT5/STAT6の転写コアクチベーターとして多彩な機能を担います。細胞周期のG1→S期移行制御にも関与する、細胞増殖の重要な制御因子です。
⑤ GMEB1/GMEB2——宿主機能を乗っ取るウイルスの標的
GMEB1/GMEB2(Glucocorticoid modulatory element-binding proteins)は80%以上の配列同一性を持つSANDドメインを有し、ヘテロ二量体を形成してグルココルチコイド修飾配列(GME)に結合します。GMEBのSANDドメインには、Sp100などには存在しない亜鉛イオン(Zn²⁺)結合モチーフがあり、ドメインのC末端側の立体構造安定化に不可欠です。注目すべきは、GMEBヘテロ二量体が微小ウイルス(Parvovirus)のDNA複製に必須の宿主因子(PIF)そのものであること——ウイルスが宿主のSANDドメインタンパク質の機能を巧みにハイジャックして自身の複製に利用している典型例です。
DNAメチル化状態の識別——エピジェネティクスとのクロストーク
「CpG」はシトシン(C)とグアニン(G)が隣接した配列で、そのシトシンにメチル基(CH₃)が付加される化学修飾を「CpGメチル化」といいます。一般的にCpGメチル化は遺伝子の転写を抑制(サイレンシング)します。ゲノム上の大部分のCpGはメチル化されていますが、活性化された遺伝子プロモーター周辺は「非メチル化CpGアイランド」として存在します。SANDドメインはこの非メチル化状態を鋭敏に識別できます。
SANDドメイン含有タンパク質の重要な特性は、DNAのCpGメチル化状態に対して極端に敏感であることです。GMEB複合体を用いたゲルシフトアッセイでは、標的DNA配列のシトシン残基がメチル化されると、SANDドメインを介したDNA結合が完全に阻害されることが実証されています。
| タンパク質 | 標的DNA配列 | エピジェネティック条件 |
|---|---|---|
| DEAF-1 | 5′-TTCG-3′ | — |
| GMEB1/GMEB2 | ACGPy N(1-9) PuCGPy | CpGの非メチル化が結合に必須 |
| Sp100ファミリー | CpGジヌクレオチド | ウイルス由来の非メチル化CpGを標的 |
| OsULT1(植物) | 5′-GAGAG-3′ | ポリコーム応答エレメント(PRE)に特徴的な配列 |
| AIRE-1 | 直接結合なし(KDWKを欠損) | PHDフィンガーがH3K4me0(非メチル化H3)を認識 |
特にSp100ファミリーにとって、宿主ゲノム(メチル化済み)と侵入直後のウイルスゲノム(非メチル化)を識別する能力は、先天性免疫の巧妙なウイルス検知センサーとして機能しており、獲得免疫が働く前の第一防衛線を担っています。
進化の視点——SANDドメインはなぜ植物と動物だけに存在するのか
SANDドメインの進化的分布には、生命進化の観点から極めて示唆に富む特徴があります。分子系統学的解析によると、SANDドメインは真正細菌・古細菌には存在せず、真核生物特有の構造です。さらに、すべての真核生物に遍在するわけでもありません。
(Viridiplantae)
ULT1, ULT2, RegA
(Metazoa)
DEAF-1, AIRE, Sp100
(Fungi)
動物近縁だが喪失
珪藻・繊毛虫など
(Choanoflagellata)
動物最近縁の単細胞
(ボルボックスなど)
RegA(多細胞化の鍵)
真菌類は動物と同じオピストコンタ(Opisthokonta)という単系統群に属するにもかかわらず、SANDドメインを持ちません。一方で、植物と動物はそれぞれ完全に独立して多細胞化を達成した系統でありながら、SANDドメインを共通して「細胞分化プログラムの中核」として採用してきました。この事実は、両系統の共通祖先にあたる単細胞生物においてすでにSANDドメインが遺伝子発現制御を担っており、多細胞化の過程で並行して発生プログラムに組み込まれた(co-option)ことを強く示唆しています。
緑藻類のボルボックスでは、SANDドメインを持つregA遺伝子が「体細胞(soma)」の増殖を恒常的に抑制し、分化を促します。単細胞のクラミドモナスでは環境ストレスに応じて増殖を一時停止させる機能が、多細胞化の過程で「特定の細胞群に永続的な増殖停止・分化」を課すプログラムへと進化した——これはSANDドメインの進化的転用(co-option)の最も鮮明な例の一つです。植物のULT1もまた、花器官形成においてエピジェネティック・スイッチとして同様の役割を果たしています。

DEAF-1やAIREのような中核的な転写制御因子は、遺伝子発現ネットワーク全体を統括する「ハブ遺伝子」です。このような遺伝子に病的変異が生じると、下流の遺伝子群が連鎖的に失調し、神経発達障害(VSVS)や自己免疫疾患(APECED)のような多臓器に及ぶ重篤な病態が現れます。次世代シーケンシング(NGS)を用いた網羅的な遺伝子解析では、このような転写制御因子の変異を一度に複数探索することが可能です。
当院では、免疫不全・自己免疫・炎症性腸疾患などの遺伝子パネル検査にAIREを含む複数のSANDドメイン関連遺伝子を組み込んでいます。原因不明の免疫不全、若年発症の多内分泌障害、反復する自己免疫症状をお持ちの方は、ぜひ臨床遺伝専門医へのご相談をお勧めします。遺伝子の背景から診断・治療へのアプローチを一緒に考えることが、当院の使命の一つです。
SANDドメイン遺伝子変異と関連疾患
SANDドメインを持つ遺伝子の変異は、複数の重篤な遺伝性疾患に直結します。
Vulto-van Silfhout-de Vries症候群(VSVS)——DEAF1変異
DEAF1遺伝子のde novo変異(親から受け継がず、その人で初めて生じた変異)は、Vulto-van Silfhout-de Vries症候群(VSVS)(常染色体優性精神遅滞24型:MRD24)を引き起こします。重度の知的障害・発語の著しい遅れまたは完全な欠如・自閉症様行動・若年発症てんかんを特徴とする極めて稀で重篤な疾患です。
次世代シーケンシングによる遺伝子解析の結果、変異の大部分がSANDドメイン内のKDWKモチーフ周辺(例:Arg254Ser変異など)に集中していることが判明しています。この変異によりDEAF-1のDNA結合能が消失・著しく低下し、脳発達に必要な遺伝子群の転写ネットワークが破綻します。
APECED——AIRE変異
AIRE遺伝子の機能欠損変異(常染色体劣性)は、APECED(Autoimmune polyendocrinopathy-candidiasis-ectodermal dystrophy:自己免疫性多内分泌腺症候群1型)を引き起こします。慢性粘膜皮膚カンジダ症・副甲状腺機能低下症・副腎皮質機能低下症という三徴候を特徴とする、単一遺伝子性の自己免疫疾患です。
変異はエクソン6(SANDドメインと最初のPHDフィンガー間)・エクソン2(ホモ二量体化ドメイン)・エクソン8(PHD1)・エクソン10に集中した「ホットスポット」が確認されています。SANDドメイン関連変異は優性阻害効果(Dominant negative effect)を生じ、AIREの正常な転写複合体形成を阻害、胸腺内での組織特異的抗原提示が不全となることで自己免疫寛容が崩壊します。
多発性硬化症・クローン病・慢性リンパ性白血病——Sp140変異
Sp100ファミリーのパラログSp140(LYSP100)の一塩基多型(SNP)および発現異常は、多発性硬化症(MS)・クローン病・慢性リンパ性白血病(CLL)の罹患感受性と強く関連することが大規模なゲノムワイド関連解析(GWAS)で実証されています。白血球核内におけるIFN誘導性転写制御とクロマチンサイレンシング機能の不全が、自己免疫応答や白血球の異常増殖のトリガーになると考えられています。
| 遺伝子 | 関連疾患 | 発症形式 | SANDドメインへの影響 |
|---|---|---|---|
| DEAF-1 | VSVS(知的障害・てんかん・自閉症様行動) | de novo常染色体優性 | KDWKモチーフ周辺変異→DNA結合能喪失→神経発達遺伝子ネットワーク崩壊 |
| AIRE | APECED(多内分泌腺・カンジダ症・外胚葉異常) | 常染色体劣性 | SAND変異→優性阻害効果→転写複合体形成不全→自己抗原提示障害 |
| Sp140 | 多発性硬化症・クローン病・CLL | SNP(感受性変異) | 白血球核内のIFN誘導性転写制御・クロマチンサイレンシング機能不全 |
最新の研究動向(2024〜2025年)
液-液相分離(LLPS)と核内凝縮体
細胞内でタンパク質や核酸が特定の条件下で「液滴」のような凝縮体を自発的に形成する現象です。膜を持たないにもかかわらず、特定のタンパク質が高濃度に集積した微小区画を形成し、局所的な遺伝子発現制御を行います。PMLボディ(ND10)もこのLLPSで形成される動的な核内凝縮体の一例です。2025年のラスカー賞基礎医学研究賞が、低複雑度ドメイン(LCD)を介したLLPS研究(McKnight・Görlich)に授与されました。
Sp100などが構成するPMLボディはLLPSによる動的な核内凝縮体です。SANDドメインに隣接する低複雑度ドメイン(LCD)やSUMO化修飾が、SANDタンパク質をどのようにクロマチン転写ハブに集積・濃縮させるか——この解明が今後のエピジェネティクス研究の最重要課題として位置付けられています。
AI構造予測によるパラダイムシフト
2024年ノーベル化学賞を受賞したAlphaFold2およびその後継AlphaFold3・ESMFoldの登場により、SANDドメインと他のモジュール(PHD・ブロモドメイン等)との複合体構造や、患者変異のアロステリック効果のインシリコ解析が飛躍的に加速しています。さらに、AIを活用したDe novoタンパク質設計により、SANDドメインのDNA結合特異性を模倣・最適化した人工転写因子(医薬品候補)の創出も急速に進展しています。
極限環境メタゲノムからの新規SAND様ドメインの発見
アイスランドの火山湖や深海熱水噴出孔(水深2000m超)の微生物メタゲノムから、SANDドメインに類似した頑強なDNA結合フォールドを持つタンパク質が次々と発見されています。高温・極端なpH・高塩濃度でも機能を維持するこれらのタンパク質は、SARS-CoV-2などのウイルスRNA/DNA検出キット(LAMP法)への応用が実用化段階に入っており、医療用迅速診断の感度と処理速度向上に貢献しています。
よくある質問(FAQ)
SANDドメインとは何ですか?
SANDドメインは、約80個のアミノ酸からなるタンパク質構造モジュールで、Sp100・AIRE・NucP41/75・DEAF-1という4つの代表的な核内タンパク質の頭文字から名付けられています。植物・動物を含む広範な真核生物に存在し、DNA結合と転写調節の両方に関わる「分子論理ゲート」として機能します。
SANDドメインはどのようにDNAに結合しますか?
SANDドメインのαヘリックス面に位置する「KDWKモチーフ(リジン-アスパラギン酸-トリプトファン-リジン)」が正電荷のパッチを形成し、負に帯電したDNAのリン酸骨格と静電的相互作用を介して特定の塩基配列を認識して結合します。反対側のβシート面はタンパク質間相互作用に使われ、この二面性がSANDドメインを転写複合体のハブたらしめています。
SANDドメインを持つ遺伝子の変異はどのような病気を引き起こしますか?
主な関連疾患として、DEAF1遺伝子のde novo変異によるVulto-van Silfhout-de Vries症候群(知的障害・てんかん・自閉症様行動)、AIRE遺伝子変異によるAPECED(自己免疫性多内分泌腺症候群1型)、Sp140のSNPに関連する多発性硬化症・クローン病・慢性リンパ性白血病などがあります。
SANDドメインはなぜ植物と動物にだけ存在するのですか?
SANDドメインは真核生物特有の構造ですが、真菌・SARクレードなどには存在しません。植物と動物はそれぞれ独立して多細胞化を達成した系統ですが、両系統の共通祖先となる単細胞生物においてすでにSANDドメインが遺伝子発現制御を担っており、多細胞化の過程で「細胞分化プログラム」へと並行して転用(co-option)されたと考えられています。
SANDドメインとPHDフィンガーはどう違いますか?
SANDドメインは主にDNA配列の認識に働くのに対し、PHDフィンガーはヒストンH3の翻訳後修飾状態(特にH3K4me0やH3K4me3)を認識するモジュールです。AIREやSp100Cなど多くのSANDドメインタンパク質はこの両方を持ち、「特定のDNA配列(SAND)」と「特定のクロマチン修飾状態(PHD)」が同時に揃ったときにのみ遺伝子転写を起動する論理回路として機能します。詳しくはPHDフィンガータンパク質の解説ページもご参照ください。
SANDドメイン関連の遺伝子検査はミネルバクリニックで受けられますか?
はい、当院では免疫不全・自己免疫・炎症性腸疾患などに関連する複数のNGS遺伝子パネル検査を提供しており、AIREをはじめとするSANDドメイン含有遺伝子も検索対象に含まれています。臨床遺伝専門医として遺伝子の背景から診断・ケアへのアプローチをご一緒に考えます。ご希望の方は総合原発性免疫不全症NGSパネルや各種検査ページをご覧ください。
- Bottomley MJ et al. The SAND domain structure defines a novel DNA-binding fold in transcriptional regulation. Nat Struct Biol. 2001;8(7):626-633. PubMed
- SAND domain annotation – SMART. EMBL-EIB. smart.embl.de
- Lindqvist AKB et al. Crystal Structure and NMR Analyses of the SAND domain. Mol Endocrinol. 2003;17(7):1283-1296. Oxford Academic
- Lauberth SM et al. Mutations Affecting the SAND Domain of DEAF1 Cause Intellectual Disability with Severe Speech Impairment and Behavioral Problems. Am J Hum Genet. 2014;94(6):906-917. PMC
- Villasenor J et al. AIRE and APECED: molecular insights into an autoimmune disease. Immunol Rev. 2005;204:156-164. Harvard Medical School
- Pica-Ciamarra A et al. The Fate of Speckled Protein 100 (Sp100) During Herpesviruses Infection. Front Cell Infect Microbiol. 2020;10:607526. PMC
- Lavarino C et al. A consensus DNA recognition motif for two KDWK transcription factors identifies flexible-length CpG-methylation sensitive cognate binding sites. Nucleic Acids Res. 2001;29(23):4809-4817. PubMed
- Hanschen ER et al. The Genetics of Fitness Reorganization during the Transition to Multicellularity: The Volvocine regA-like Family as a Model. Curr Biol. 2023. PMC
- Carles CC et al. The SAND domain protein ULTRAPETALA1 acts as a trithorax group factor to regulate cell fate in plants. Genes Dev. 2009;23(23):2723-2728. PMC
- Solano-Gonzalez E et al. The Epigenetic Faces of ULTRAPETALA1. Front Plant Sci. 2021;12:637244. Frontiers
- Dettmer U et al. AIRE Mutations and Human Leukocyte Antigen Genotypes as Determinants of the APECED Phenotype. J Clin Endocrinol Metab. 2002;87(6):2568-2575. Oxford Academic
- Vulto-van Silfhout AT et al. Vulto-van Silfhout-de Vries syndrome caused by de novo variants of DEAF1 gene: a case report and literature review. Front Genet. 2023. PMC
- Lasker Foundation. Structures and functions of low-complexity domains (2025 Lasker Basic Medical Research Award). Lasker Foundation
- SAND DNA-binding protein domain. Wikipedia. Wikipedia



