InstagramInstagram

アンブレラ型臨床試験(Umbrella Trial)の包括的解説:プレシジョン・メディシン時代の革新的試験デザイン

目次

仲田洋美 医師

この記事の監修:仲田洋美(臨床遺伝専門医)

のべ10万人以上の意思決定に伴走。国際医療誌『Medical Care Review APAC』『Global Woman Leader』の2誌で表紙を飾り、「Top Prenatal Testing Service in APAC 2025」に選出されるなど、世界基準の遺伝医療を提供。

ゲノム解析技術の劇的な進歩は、医療を「1つの臓器に1つの標準治療」から「患者一人ひとりの分子異常に合わせたプレシジョン・メディシン」へと根本から塗り替えました。しかし対象となる遺伝子変異を持つ患者はしばしば数%しか存在しない希少なサブグループで、従来の試験デザインでは新薬を届けるまでに膨大な時間と費用がかかります。この壁を打ち破る革新的フレームワークが「アンブレラ型臨床試験(Umbrella Trial)」です。本記事では、その仕組み・利点・統計学的課題・規制動向・歴史的成功事例(BATTLE試験/Lung-MAP)まで、臨床遺伝専門医がやさしく解説します。

この記事でわかること
📖 読了時間:約20分
🧬 マスタープロトコル・プレシジョン医療
臨床遺伝専門医監修

Q. アンブレラ型臨床試験とは何ですか?まず結論だけ教えてください

A. アンブレラ型臨床試験とは、「単一の疾患」を持つ患者を遺伝子変異などのバイオマーカーで複数のサブグループに層別化し、それぞれに対応する標的治療薬を1つの傘(アンブレラ)の下で並行して評価する革新的試験デザインです。非小細胞肺がんを対象としたBATTLE試験やLung-MAP試験などで実用性が証明され、開発期間とコストを劇的に削減しつつ、希少な遺伝子変異を持つ患者にも治療機会を提供できる枠組みとして世界中で広がっています。

  • 基本構造 → 単一疾患 × 複数の標的薬を、共通インフラで並行評価する
  • 最大の利点 → スクリーニング無駄削減・共通対照群・施設立ち上げ時間の劇的短縮
  • 歴史的成功事例 → BATTLE試験(255名・適応的無作為化)/Lung-MAP(全米規模の官民連携)
  • 主な課題 → 多重性によるエラー率制御・サブ試験間の登録不均衡・ステークホルダー調整
  • 将来展望 → がん領域から自己免疫疾患・精神疾患・COVID-19など非腫瘍領域へ波及中

\ 臨床試験・遺伝子検査について専門医に相談したい方へ /

📅 遺伝カウンセリングを予約する

遺伝子検査・がんゲノム医療に関するご相談:遺伝子検査について

1. プレシジョン・メディシン時代と臨床試験のパラダイム転換

過去数十年にわたるゲノム解析技術や分子遺伝学の飛躍的な進歩は、病気の理解を劇的に深めるとともに、特定の分子異常だけをピンポイントで狙う革新的な標的治療薬の開発を加速させてきました。この技術革新は、医療を「同じ臓器のがんなら同じ薬」という画一的なアプローチから、患者一人ひとりの遺伝子変異やバイオマーカーに基づく「プレシジョン・メディシン(個別化医療)」へと根本的に転換させました。

しかしこの喜ばしいパラダイムシフトは、同時に臨床試験の実施における全く新しい困難をもたらしました。標的となる特定の分子異常を持つ患者は、疾患全体から見ればしばしば数%から十数%にすぎない希少なサブグループとなるためです。従来の「1つの薬を順番に試験する」やり方では、開発サイクルの極端な長期化・莫大なコスト・限られた患者リソースの分散を招いてしまいます。

さらに、特定のバイオマーカーを持つ患者を探すためのスクリーニングで対象外となった患者(スクリーンフェイラー)には、治療の機会が提供されないまま膨大な時間と検査費用が無駄になる、という倫理的・運用上のジレンマも生じていました。

💡 用語解説:プレシジョン・メディシン(個別化医療)

プレシジョン・メディシンとは、患者一人ひとりの遺伝子情報・タンパク質発現・生活環境などの個別の特性に基づいて、最も効果的で副作用の少ない治療法を選択する医療アプローチを指します。たとえば同じ「肺がん」と診断されても、EGFR変異を持つ患者にはEGFR阻害薬、ALK融合遺伝子を持つ患者にはALK阻害薬、というように分子レベルで治療を「精密に」選び分けるのが特徴です。次世代シークエンサー(NGS)の登場により、多数の遺伝子を同時に解析することが現実的になったことが、この医療パラダイムの実現を支えています。

これらの複合的な課題を克服し、有望な新薬をより迅速・効率的・倫理的に患者に届けるための革新的アプローチとして登場したのが、「マスタープロトコル(Master Protocol)」という包括的フレームワークです。これは1つの試験計画の下で、共通のインフラを使いながら、複数の仮説(複数の治療法・複数の疾患、あるいはその両方)を並行して検証する野心的なデザインを指します。本記事では、その代表的な形態の1つである「アンブレラ型臨床試験」に焦点を当てて詳しく解説していきます。

2. アンブレラ型臨床試験の厳密な定義と分類論

マスタープロトコルは、研究目的や検証する仮説の数、サブ試験の構造によって、主に「バスケット型」「アンブレラ型」「プラットフォーム型」の3つのカテゴリーに分類されます。これらの用語は臨床現場や論文でもしばしば混同されますが、対象とする「疾患集団」と「介入する治験薬」の方向性において厳密な違いがあります。

アンブレラ型臨床試験(Umbrella Trial)とは

アンブレラ型臨床試験とは、「単一の疾患または状態」を持つ患者集団を対象に、1つのマスタープロトコルの下で「複数の異なる治療薬」を並行して比較・検証する試験デザインです。最大の特徴は、対象となる単一疾患の患者集団を、特定の遺伝子変異・分子標的・バイオマーカー・組織学的特徴などに基づいて、複数の並行サブグループに層別化する点にあります。

層別化されたそれぞれのサブグループに対しては、その特異的な分子異常を狙うように設計された異なる薬剤(単剤または併用療法)が割り当てられ、それぞれが個別のサブ試験として有効性と安全性を評価されます。たとえば米国国立がん研究所(NCI)が主導するALCHEMIST試験は、早期非小細胞肺がん(NSCLC)の切除後患者を対象に、EGFR遺伝子変異やALK融合遺伝子などのバイオマーカーの有無で患者をスクリーニングし、それぞれの変異に合致した複数の分子標的薬を1つの「傘」の下で並行評価する典型例です。

マスタープロトコルの3分類 対象となる「疾患」と「治験薬」の方向性が異なる

バスケット型 複数疾患 × 単一薬剤 薬剤 (共通) 疾患A 疾患B 疾患C 疾患D 共通変異を持つ 多疾患を1薬で評価 例:NTRK融合がん

アンブレラ型 単一疾患 × 複数薬剤 単一疾患 (例:肺がん) サブA サブB サブC 薬剤1 薬剤2 薬剤3 1疾患を分子的に層別化し 複数薬を並行評価 例:BATTLE / Lung-MAP

プラットフォーム型 薬剤の継続的な入れ替え 疾患(永続) 薬A 薬B 薬C 薬D 途中で薬剤を追加・除外可 永続的に運用される 例:RECOVERY試験

バスケット型は「複数疾患 × 単一薬剤」、アンブレラ型は「単一疾患 × 複数薬剤」、プラットフォーム型は「薬剤を流動的に入れ替えながら永続運用」が特徴です。

バスケット型・プラットフォーム型との違い

アンブレラ型を理解する近道は、ほかの2タイプとの対比です。まずバスケット型臨床試験は、アンブレラ型と方向が逆で「単一の治験薬を、複数の異なる疾患にまたがって」評価します。臓器を問わず共通の遺伝子変異を持つ患者を集めて1つの分子標的薬を試すアプローチで、BRAF V600E変異を持つ多様な非黒色腫がんに対するベムラフェニブ試験や、進行性固形がんに対するペムブロリズマブのKEYNOTE-158試験などが代表例です。

バスケット型は臓器横断的(Tissue-agnostic)な画期的承認への道を切り開きました。2017年のMSI-H固形がんに対するペムブロリズマブのFDA承認、2018年のNTRK融合遺伝子陽性固形がんに対するラロトレクチニブ、2024年のHER2陽性固形がんに対するトラスツズマブ・デルクステカン(T-DXd)の承認などがその成果です。

一方プラットフォーム型臨床試験の最大の特徴は「永続性(Perpetual nature)」と「動的な流動性」です。試験が開始された後でも、事前に決めたルールや中間解析の結果に基づいて、効果の低い治療アームを脱落(ドロップ)させたり、新たな有望薬を新規アームとして追加したりできます。試験を終わらせて新たに立ち上げ直す必要がなく、切れ目なく治療法を評価し続けることが可能です。

💡 用語解説:バイオマーカー(biomarker)

バイオマーカーとは、病気の有無・進行度・治療への反応性などを客観的に測れる「生物学的な目印」のことです。アンブレラ型試験では、特定の遺伝子バリアント(例:EGFR変異、ALK融合)やタンパク質発現(例:HER2、PD-L1)などがバイオマーカーとして使われ、患者をどのサブ試験のアームに割り当てるかを決める鍵となります。バイオマーカーは「コンパニオン診断」と呼ばれる遺伝子検査によって測定されるのが一般的で、検査と治療がペアになって発展してきたのが現代のがん医療の大きな特徴です。

これら3つのデザインは排他的ではなく、現代の高度な臨床試験ではハイブリッドな設計も増えています。たとえばアンブレラ型試験が途中で新薬の追加を許容するアルゴリズムを組み込めば、プラットフォーム型の性質を併せ持つ「プラットフォーム・アンブレラ型試験」として機能することになります。

3. 運用面での戦略的利点と効率化メカニズム

アンブレラ型臨床試験を含むマスタープロトコルの採用は、医薬品開発と患者体験に対して、従来パラダイムでは到達不可能だった劇的な効率化と倫理的改善をもたらします。その利点は大きく3つの軸に分けられます。

① 運用インフラの統合と中央集権化

従来の独立した臨床試験では、新薬を評価するたびに、治験実施計画書(プロトコル)の草案・治験審査委員会(IRB)承認・実施施設の選定と契約・データ管理システムの構築・独立データモニタリング委員会の設立などを毎回ゼロから行う必要がありました。これには膨大な時間とコストがかかります。

対照的にアンブレラ型試験では、これらの研究基盤が1つの包括的プロトコルの下で開発・実装され、参加する全サブ試験で共有されます。新たな治療アームを追加したいと思ったとき、新しい試験をゼロから設計するのではなく、既存のマスタープロトコルに新たな「アーム」として追加するだけで済むため、施設立ち上げ期間が劇的に短縮され、開発プロセスが加速されます。

② 網羅的スクリーニングで患者リソースを最適化

プレシジョン・メディシン開発で最大の運用上の壁となるのが、対象となる特定の遺伝子変異を持つ患者を見つけることの難しさです。単一のバイオマーカーしか検査しない従来試験では、検査が陰性だった患者は試験に参加できず、本人は別の試験を探して再検査が必要となり、スポンサー側も高額なスクリーニング費用が回収不能なサンクコストとなる、という二重の損失が発生していました。

アンブレラ型試験はこの非効率を根本から解決します。参加希望患者に対して、次世代シークエンサー(NGS)などによる広範な網羅的ゲノムプロファイリングを一度だけ実施し、その患者が持ついずれかの変異に合致する最適なサブ試験へ直ちに割り当てるプロセスを採用しています。これによりスクリーニング失敗率が著しく低下し、有病率が1〜2%しかない超希少変異の患者でも、多数の候補のなかから合致するアームが見つかる確率が高まります。

③ 共通対照群(Common Control)の活用

無作為化を伴うアンブレラ型試験では、複数の実験的治療群が同一の「標準治療群」または「プラセボ群」を共通の対照群として共有することが可能です。3つの異なる治験薬をそれぞれ個別に試験する場合、それぞれに対照群が必要で多数の患者が対照群に割り付けられます。しかしアンブレラ型試験で対照群を1つに統合すれば、試験全体で対照群に割り付けられる患者の総数を劇的に減らしつつ、各薬剤と対照群との比較における統計的検出力を維持・向上できます。

この「共通対照群」の存在は、患者視点でも重要な意味を持ちます。個別試験に参加するよりもアンブレラ型試験に参加した方が、プラセボや従来治療のみを受ける確率が相対的に下がり、最先端の実験的治療を受けられる確率が高まるからです。これは患者にとって試験参加への強いインセンティブとなり、患者募集のスピードを加速させる大きな要因にもなっています。

仲田洋美院長

🩺 院長コラム【「希少だから諦める」を、データの仕組みで変える】

私ががん薬物療法専門医として研修を受けていた頃、ある特定の遺伝子変異を持つ患者さんに「この変異を対象にした薬の治験は、患者数が少なすぎて日本では走れません」と説明することがありました。臓器別の縦割り試験では、希少変異を集めるだけで何年もかかってしまうからです。

アンブレラ型臨床試験は、その「数の壁」をデザインの工夫で打ち破る試みです。1つの大きな傘の下で、複数の希少変異を持つ患者さんを同時に集めて、それぞれに合った薬を並行して評価する。これは「希少だから諦める」という構造そのものを、データの仕組みで変えていく取り組みだと感じています。臨床遺伝の現場からも、ゲノム検査の結果が「変異の名前」で終わらず「次の一歩」につながる時代に変わってきている手応えがあります。

4. ランドスケープ分析:アンブレラ型試験はどれだけ実施されているか

アンブレラ型臨床試験の理論的な優位性は学術界・産業界で広く認識されていますが、実際にどれくらい実施されているのか、定量的に把握することも重要です。MEDLINE・EMBASE・CENTRALなどのデータベースと臨床試験レジストリを横断した系統的レビューによると、ある時点で83件のマスタープロトコルが同定されました。

この83件のうち、圧倒的多数の76件(91.6%)が腫瘍学(オンコロジー)領域で実施されており、地理的には米国内が44件と最多でした。マスタープロトコルの利用は過去5年間で急速に増加していますが、デザインごとに特性は大きく異なります。

試験デザイン 実施件数 サンプルサイズ中央値 試験期間中央値 主な特性
バスケット型 49件 205名(IQR 90-500) 22.3ヶ月 主に第I/II相の探索試験(47/49件)。非無作為化が主流(44/49件)。
アンブレラ型 18件 346名(IQR 252-565) 60.9ヶ月 並行介入数は中央値5。バスケット型より無作為化採用率が高い(8/18件)。
プラットフォーム型 16件 892名(IQR 255-1835) 58.9ヶ月 無作為化採用が主流(15/16件)。第III相や第II/III相シームレス採用も多い(7/15件)。

この数字から読み取れるのは、アンブレラ型試験はバスケット型よりも複雑かつ大規模な構造を持つということです。単一疾患内の複数サブタイプを同時に評価するため、並行する介入数が多く(中央値で5つ)、必要なサンプルサイズが大きく(中央値346名)、試験期間も長期化(中央値60.9ヶ月)する傾向が明確に表れています。

バスケット型が小規模な第I/II相の単群試験として迅速に走るのに対し、アンブレラ型は無作為化比較試験(RCT)の要素を取り入れた、より厳密な評価段階へと進みつつあります。

マスタープロトコル分類別の実施件数とサンプルサイズ

実施件数 49 バスケット型 18 アンブレラ型 16 プラットフォーム型 50 30 10 0

サンプルサイズ中央値(人) 205 バスケット型 346 アンブレラ型 892 プラットフォーム型 900 600 300 0

出典:腫瘍学を中心とした83件のマスタープロトコル系統的レビュー

アンブレラ型試験はバスケット型に次ぐ実施件数を持ち、サンプルサイズはその中間規模に位置します。プラットフォーム型は永続運用ゆえに最大規模となります。

ただし、アンブレラ型試験の普及には学術的な懸念も伴います。38件のアンブレラ試験を対象とした別のシステマティックレビューによれば、これまで実施された多くの試験で統計学的方法論や計算根拠の報告の質が著しく低いことが指摘されています。具体的には、対象アンブレラ試験の半数以上(55.3%、21/38件)で、サンプルサイズがどう決まったのか統計的根拠を確認することができなかったと報告されています。アンブレラ型試験が標準的な試験デザインとして定着するためには、後述する統計学的課題の解決と報告ガイドラインの整備が急務とされています。

5. 統計学的・方法論的課題

アンブレラ型臨床試験は野心的な構造ゆえに、従来のランダム化比較試験(RCT)では想定されていなかった高度な統計学的複雑さと運用上の難問を内包しています。

多重性(Multiplicity)とエラー率の制御

マスタープロトコル、特にアンブレラ型試験における最大の統計学的課題の1つが「多重性(Multiplicity)」問題の制御です。1つの試験枠組みのなかで、複数の治療効果に関する仮説検証(複数の薬剤と対照群との比較や、複数のエンドポイントの評価)を同時並行で実施するため、試験全体としての「少なくとも1つの検証で、本当は偶然なのに有効と誤って結論付けてしまう確率」、いわゆる「ファミリーワイズ・エラー率(FWER)」が人為的にインフレを起こすリスクが高くなります。

💡 用語解説:多重性とファミリーワイズ・エラー率(FWER)

統計学では、たくさんの仮説を一気に検定すると、本当は効いていないのに「効いた」と判定してしまう確率(偽陽性、第一種過誤)が積み重なって増えていきます。たとえば1回の検定で偽陽性率が5%だとしても、10回検定すれば「少なくとも1回偽陽性が出る確率」は約40%まで跳ね上がります。

ファミリーワイズ・エラー率(FWER)とは、関連する一群の検定全体で「少なくとも1つは偽陽性が出る確率」のことです。アンブレラ型試験のように複数の薬剤を同時に比較する場面では、このFWERが膨らんで「実は効いていない薬を効いたと誤判定する」リスクが高まるため、ボンフェローニ補正・階層的検定手順・ベイズ流アプローチなどの工夫でエラー率を厳格にコントロールする必要があります。

探索的な目的の第I/II相試験では、有望なシグナルを見逃さないために、ある程度のエラー率インフレが許容される傾向があります。しかし、規制当局への新薬承認申請の根拠となる「確証的(Confirmatory)」なマスタープロトコル試験では、多重性に対する厳格な統計的対処が不可欠となります。これに対しては、事前定義された階層的検定手順や、ベイズモデルを用いた適応型デザインなどが提案されていますが、標準化された普遍的な解決策はまだ発展途上にあります。

バイオマーカーの重複と階層的割り付け

現実の臨床現場では、患者の腫瘍が1つの遺伝子変異だけでなく、複数の遺伝子異常を同時に持つ(共起変異)ことが頻繁にあります。この場合、患者をどのサブ試験のアームに割り当てるべきか、という論理的・倫理的問題が生じます。ある変異に対しては高い効果が期待される治験薬でも、同時に存在する別の変異がその薬への耐性メカニズムとして働く可能性があるためです。

そのためアンブレラ型試験の設計段階では、生物学的機序の解明度に基づいた厳密な「優先順位ルール」を組み込んだ患者割り付けアルゴリズムを構築することが絶対的な前提条件となります。これは単なる臨床判断にとどまらず、複雑な統計シミュレーションで「特定のアルゴリズムが各サブ試験の必要サンプルサイズを満たす能力にどう影響するか」を事前に綿密に評価する必要があります。

登録速度の不均衡とステークホルダーの利害調整

アンブレラ型試験では、サブ試験ごとに対象バイオマーカーの有病率が大きく異なるのが普通です。その結果として、サブ試験間で患者の登録率に著しい不均衡が生じる、という運用上のボトルネックが発生します。高頻度の変異を対象にするアームは早期に登録目標を達成する一方で、極めて稀な変異を対象とするサブ試験は十分なサンプルサイズに到達するまでに長期間を要し、場合によっては統計的検出力が不足したまま試験が中止されるリスクを常に抱えています。

さらに、1つのマスタープロトコルに複数の独立した製薬企業や学術研究機関が参加するという性質上、ステークホルダー間の競合する利害調整も極めて複雑になります。具体的には、データのアクセス権・知的所有権の帰属・学術論文の出版権・各社が望むタイミングでの規制当局申請戦略など、法務・規制上の調整事項が山積みです。プロトコル変更時の合意形成プロセスも、独立した単一企業の試験と比べて著しく煩雑になりがちで、強力な中央統括機能が必要となります。

6. 規制当局の動向:FDAおよびPMDAの戦略的指針

マスタープロトコルがもたらす運用上の複雑さと統計学的課題を踏まえ、米国および日本の規制当局は、試験の科学的完全性を厳格に保ちつつ革新的な医薬品開発を社会実装するための具体的ガイドラインの整備を急速に進めています。

米国食品医薬品局(FDA)のガイダンス

FDAは2018年にオンコロジー領域でのマスタープロトコルを明示的に支持する方針を打ち出し、その後のCOVID-19対応を経てその枠組みの有用性を確信しました。2024年に発表された最新の改訂ドラフトガイダンス(”Master Protocols for Drug and Biological Product Development”)では、適用範囲を特定の治療領域や公衆衛生上の緊急事態に限定せず、あらゆる疾患領域への汎用的かつ詳細な推奨事項を提供しています。

特筆すべき要求事項の1つが、高度な情報管理とバイアス排除です。マスタープロトコルでは複数の治験薬が同時に評価され、中間解析やアームの追加・除外が動的に行われるため、データの偶発的漏洩が他のアームの試験実施に重大な影響を及ぼす可能性があります。これを防ぐため、FDAはプロトコルから完全に独立した外部データモニタリング委員会(IDMC)の設置を強く推奨しています。

無作為化に関しても実践的な指針が示されています。FDAは、対照群のパフォーマンスが異常に高低することのリスクを分散し、各治験薬が対照群と比較される際の検出力を高めるため、個々の治験薬アームよりも対照群に多くの患者を割り付ける(例:2:1や3:1の比率での無作為化)スキームの採用をスポンサーに推奨しています。

多重性については、FDAは実務的な柔軟性を示しています。「異なる複数の薬剤」をそれぞれ共通対照群と比較する場合の多重性については、各薬剤の開発スポンサーが異なることが多い実情に配慮し、必ずしも厳格なエラー制御を求めていません。しかし「同一の薬剤」で複数のエンドポイントを検証する場合の多重性制御は依然として極めて重要、と明記されています。

PMDAの指針と日本の制度的環境

日本の規制当局である独立行政法人医薬品医療機器総合機構(PMDA)も、アンメット・メディカル・ニーズの高い領域や希少疾患におけるマスタープロトコル試験の有用性を高く評価しています。PMDAが公開した「医薬品開発等におけるマスタープロトコル試験の活用に関する留意事項」では、マスタープロトコルの定義と利点が明確に記載され、目的に応じたバスケット試験・アンブレラ試験・プラットフォーム試験への分類論が詳細に示されています。

特に注目すべきは、日本独自の「条件付き早期承認制度」や「特定用途医薬品の指定制度」といった早期承認メカニズムとの親和性です。これらの制度は、生命に重大な影響がある重篤な疾患で、既存治療がなく検証的臨床試験の実施が困難、あるいは患者数が少なく実施に長期間を要する医薬品を対象としています。PMDAは、こうした疾患領域でアンブレラ試験などのマスタープロトコルを活用し、探索的フェーズの臨床データから一定の有効性・安全性が示された場合に迅速な承認を目指す開発戦略を議論の対象としています。

ただしPMDAでもFDAと同様、複数薬剤を並行評価する際の中間解析の設計妥当性や、対照群共有に伴う統計学的課題(多重性・検出力)については、開発の早期段階からPMDAとの綿密な事前相談を実施することが不可欠とされています。

7. 画期的成功事例①:BATTLE試験

アンブレラ型デザインのポテンシャルを世界に示し、現代のマスタープロトコルの礎を築いたのが「BATTLE試験(Biomarker-integrated Approaches of Targeted Therapy for Lung Cancer Elimination)」です。この試験の成功は、その後の臨床試験のあり方を一変させました。

背景:肺がん標的治療の閉塞感

2000年代後半、非小細胞肺がん(NSCLC)の治療領域では、EGFRチロシンキナーゼ阻害薬(TKI)であるエルロチニブやゲフィチニブなどの標的治療薬が登場し、一部の患者で目覚ましい効果を示していました。しかし当時は効果を予測する有効なバイオマーカーが確立されておらず、単に臨床的特徴(年齢・性別・喫煙歴)に基づいて治療方針が決まっていたため、多くの患者で生物学的薬剤の恩恵が得られず、多数のランダム化比較試験が失敗する停滞期にありました。

さらに進行・再発肺がん患者から新たに腫瘍組織を採取(生検)することはリスクが高いと考えられており、過去の手術組織を用いた不正確なバイオマーカー評価が限界となっていました。

革新的な「適応的無作為化」デザイン

BATTLE試験は、これらの限界を打破すべく、治療歴のある進行期NSCLC患者255名を対象に開始されました。革新的だったのは、試験参加の条件として「リアルタイムの前向きコア針生検」を必須(Biopsy-mandated)とし、得られた新鮮な腫瘍サンプルの分子プロファイリング結果に基づいて治療を割り付ける、世界初の「適応的無作為化(Adaptively Randomized)」臨床試験として設計されたことです。

本試験はアンブレラ型のフレームワークのなかにベイズ統計を用いた二段階の無作為化プロセスを組み込みました。最初の97名には4治療群への「均等な無作為化」を実施し、エルロチニブ・バンデタニブ・エルロチニブ+ベキサロテン併用・ソラフェニブのいずれかに均等に割り付けました。その後、初期コホートから得られた有効性データをベイズモデルで解析し、残りの158名に対しては、個々のバイオマーカープロファイル(EGFR変異・KRAS変異・EGFRコピー数増加・VEGFR発現・Cyclin D1発現など)に基づき「最も有効性が期待できる治療群への割り付け確率を意図的に高める」適応的無作為化を実施しました。

💡 用語解説:適応的無作為化(Adaptive Randomization)

通常の無作為化試験では、最初から最後まで「コインを振って同じ確率で各群に割り付ける」ルールが固定されています。一方「適応的無作為化」は、試験の進行中に集まったデータを使って、割り付け確率を動的に変える仕組みです。簡単に言えば「途中までの結果を見て、効きそうな治療に多くの患者を割り当てるよう調整する」アプローチです。これによりプラセボや効果の低い治療を受ける患者を減らせる倫理的メリットがあり、ベイズ統計と組み合わせるのが一般的です。

臨床的意義とバイオマーカー発見

主要評価項目である「8週時点での疾患コントロール率(Disease Control Rate: DCR)」は、対象となった重度な前治療歴を持つ患者集団において46%という優れた結果を示し、第一の目的を達成しました。

さらに重要だったのは、リアルタイムのバイオマーカー解析と適応的割り付けによって、特定の薬剤に対する新たな予測マーカーが複数同定されたことです。特に驚くべきは、当時「創薬不可能(Undruggable)」とされ有効な治療法が皆無だったKRAS遺伝子変異を持つ患者において、ソラフェニブが顕著な恩恵をもたらす可能性を示唆した点です(変異型KRAS患者でソラフェニブ群はDCR 61%を達成し、他治療群の32%を大きく上回りました)。また、EGFR変異を持たない(野生型)患者でも、ソラフェニブが他治療群より有意に高いDCR(64% 対 33%、P<0.001)を示すことが実証され、エルロチニブに対するEGFR変異の高い予測性(P=0.04)や、エルロチニブ+ベキサロテン併用群でのCyclin D1高発現(P=0.01)・EGFR増幅(P=0.006)の有効性も新たに確認されました。

BATTLE試験の最大の功績は、重度に前治療を受けた進行がん患者に対して、リアルタイムの腫瘍生検(139名がコア生検を受け、重篤な合併症は最小限)に基づく分子プロファイリングを実施し、その結果を個別化治療に統合する「アンブレラ型・適応型デザインの実行可能性(Feasibility)」を現実世界で完璧に証明したことです。この記念碑的な成功は、KRAS変異を特異的に標的とした後続の「BATTLE-2」試験の立ち上げや、後述するLung-MAPの巨大なマスタープロトコルの発展へと直結しました。

8. 画期的成功事例②:Lung-MAP

BATTLE試験で小規模に実証されたアンブレラ型試験のコンセプトを、全米規模の臨床試験ネットワークとより高度な次世代シークエンシング(NGS)技術で巨大スケールに展開したのが「Lung-MAP(Lung Cancer Master Protocol, SWOG S1400)」です。Lung-MAPは、複雑なマスタープロトコルを社会実装するための「官民連携」の青写真として、いまも機能し続けています。

困難な疾患に対する広範なパートナーシップ

Lung-MAPは当初、進行期扁平上皮非小細胞肺がん(SqCC)の患者を主な対象としてスタートしました。扁平上皮がんは肺がん全体の20〜35%を占める主要な組織型ですが、非扁平上皮がんにおけるEGFR変異やALK融合遺伝子のような、劇的な効果をもたらす強力な標的治療薬の開発が決定的に遅れていました。The Cancer Genome Atlas(TCGA)プロジェクトなどのゲノム解析により、PI3K/RTK/RAS経路(69%)、FGFR1(7%)など標的となり得る多数の体細胞突然変異が発見されていましたが、それぞれの出現頻度が5〜20%と低く、個別の変異ごとに独立した臨床試験を設計し患者募集することは現実的に極めて困難でした。

この創薬の「死の谷」に対処するため、米国国立がん研究所(NCI)・National Clinical Trials Network(SWOG、Alliance、ECOG-ACRIN、NRG Oncology等)・米国国立衛生研究所財団(FNIH)・FDA・患者支援団体(Friends of Cancer Research)・複数の競合する製薬企業が連携し、医療史上類を見ない巨大な官民パートナーシップが構築されました。運営にあたっては独立した監視委員会・実行運営グループ・プロジェクト管理オフィスが設立され、中央倫理審査委員会(Central IRB)への移行を含む透明性の高いガバナンス構造が敷かれました。

包括的NGSスクリーニングとシームレスな第II/III相移行

本試験の技術的中核は、Foundation Medicine社のハイブリッドキャプチャベースNGSプラットフォーム(FoundationOne)を用いた、全患者に対する網羅的な分子スクリーニングです。このアッセイは313のがん関連遺伝子を一度に解析し、さらに腫瘍の遺伝子変異負担(TMB)やマイクロサテライト不安定性(MSI)、相同組換え修復欠損などの高度な複合的バイオマーカーも同時に評価します。

Lung-MAPの特筆すべき革新は、論理的な患者割り付けアルゴリズムとシームレスな試験移行プロセスです。まず患者はNGSプラットフォームによる中央スクリーニングを受け、10〜14日という短期間で解析結果が返却されます。その結果に基づき、患者は特定のバイオマーカーに合致する標的治療アーム(治験薬+標準治療 vs 標準治療)へ迅速に割り当てられます。もし合致する変異が1つも同定されなかった場合は、免疫療法などを評価する「非マッチングアーム」へと振り分けられる仕組みになっており、検査を受けたほぼ全員に治験参加の機会が提供されます

さらに各サブ試験は中間解析を経て、第II相試験としての有効性が確認された場合、治験を中断してプロトコルを書き直すことなく、そのままシームレスに第III相試験へと移行できる仕組みを備えています。実際の臨床成果として、Lung-MAPプラットフォームを通じて、免疫療法に抵抗性を示すNSCLCに対してペムブロリズマブとラムシルマブの併用療法が全生存期間(OS)を有意に改善することが早期に示され、FDAから画期的治療薬指定(Breakthrough Therapy Designation)を受けるという顕著なマイルストーンを達成しています。

臨床試験へのアクセス民主化

Lung-MAPの長期運用データが示したもう1つ極めて重要な知見は、「マスタープロトコルというインフラの共有が、臨床試験への患者アクセスを民主化する可能性」を実証したことです。従来の独立した10件の進行NSCLC臨床試験の参加者データと比較した詳細な分析では、Lung-MAPのネットワークは、高齢の患者・農村部や社会経済的剥奪地域の居住者・メディケイド加入者や無保険の患者を、従来試験よりもはるかに高い割合で登録することに成功していました。広範な医療機関ネットワークの共有と、単一の検査から最適な治療法を自動的に提案する合理的な割り付けプロセスが、地理的・経済的な理由で臨床試験参加に高い障壁を感じていた脆弱な患者群に新たなアクセス経路を提供したことが示唆されています。

ただし同分析では、女性患者やアジア系・ヒスパニック系の患者が依然として過小評価(underrepresented)されていることも判明しており、一般化可能性をさらに高めるための継続的な課題として認識されています。

9. 非腫瘍領域への拡大と今後の展望

これまでの10年間、アンブレラ型試験をはじめとするマスタープロトコルは、標的となる遺伝子異常や細胞内シグナル伝達経路が比較的明確に特定されやすい腫瘍学領域でいわば「特権的」に発展してきました(これまでのマスタープロトコルの90%以上が腫瘍学)。しかし他の多くの疾患領域でも病態の分子メカニズム解明が進むにつれ、アンブレラ型デザインの強力な効率性は、がん領域の枠を超えて非腫瘍領域へと応用されようとしています。

COVID-19パンデミックでの実証

このパラダイム拡張を世界に印象付けたのが、COVID-19パンデミックです。未知のウイルスへの有効な治療法を極限のスピードで探索する必要に迫られた際、医療界はマスタープロトコルの枠組みを採用しました。英国のRECOVERY試験(NCT04381936)や米国のI-SPY COVID試験(NCT04488081)、COMMUNITY試験(NCT04590586)などは、1つのプロトコル下で抗ウイルス薬や免疫調整薬など複数の治療アームを動的に評価し、デキサメタゾンなど有効な治療法を驚異的な速度で特定することに貢献しました。これは感染症や公衆衛生上の緊急事態において、マスタープロトコルが「最も迅速な評価パス」を提供することを証明した事例です。

精神疾患・自己免疫疾患への波及

さらに革新的な領域として、精神疾患や神経変性疾患における「プレシジョン・メンタルヘルス」への応用が本格的に検討されはじめています。統合失調症やうつ病において、これまでの症状の集合体による画一的な治療ではなく、患者の特定の神経回路の異常・遺伝的素因・バイオマーカーに基づいて患者を層別化し、それぞれのサブタイプに最適化された新規治療法をアンブレラ型試験で検証する試みです。自己免疫疾患領域でも同様に、特定のサイトカインプロファイルに基づいた層別化と複数薬剤の評価が期待されています。

標準化に向けた課題

ただしアンブレラ型試験がその真のポテンシャルを解放し、あらゆる疾患領域の標準的試験デザインとして定着するためには、乗り越えるべきハードルがあります。第一に、複雑な階層型データ構造を処理し、サブ試験間で正確に情報の借用(Borrowing of information)を行うためのベイズモデリング戦略など、革新的な統計手法のさらなる深化とソフトウェアへの実装です。第二に、学会や学術誌主導による、アンブレラ試験のサンプルサイズ計算や統計手法に関する厳密な「報告ガイドライン(Reporting standards)」の確立です。過去の多くの試験で統計情報の報告品質が低い状態が続けば、後続の研究者が過去の失敗と成功から学習し、非腫瘍領域にこの複雑なデザインを適応させる機会が失われてしまうからです。

10. 遺伝学的診断との接続:参加の前提となる分子診断

アンブレラ型試験の話題は遠い世界の出来事のように見えるかもしれませんが、実は「あなたや家族の腫瘍に、どんな遺伝子変異があるかを知ること」が、こうした最先端臨床試験への入り口になります。バイオマーカーの同定なくして、層別化された治療アームへの割り付けはあり得ないからです。

分子診断の選択肢

🔬 組織生検+NGSパネル

手術検体や生検組織から直接DNAを抽出し、遺伝子パネル検査で複数遺伝子を同時に解析します。

バイオマーカー同定のゴールドスタンダードです。

💧 リキッドバイオプシー

血液中の循環腫瘍DNA(ctDNA)を解析する非侵襲的検査。組織採取が困難な進行がん患者で大きな威力を発揮します。

当院のリキッドバイオプシーでも複数遺伝子を解析可能です。

特にBATTLE試験とLung-MAPで実証された通り、「治療を選ぶ前に変異を見る」という流れは、現代のがん医療の標準となりつつあります。組織生検が難しい進行肺がんなどでは、非小細胞肺がんに対するリキッドバイオプシーがアクションを起こす上での重要な検査オプションとなります。

臨床試験へのアクセスをどう考えるか

臨床試験への参加可否は、主治医・腫瘍内科医・臨床遺伝専門医と相談しながら、患者個人の病期・体力・希望に基づいて検討するものです。日本でも国立がん研究センター中央病院をはじめとする大学病院・がんセンターで複数のアンブレラ型・バスケット型試験が走っており、適応する変異が見つかった場合は紹介を通じて参加が可能となるケースがあります。

なお、臨床試験はあくまで「研究」であり、有効性が確立した標準治療とは異なる位置づけです。参加にあたっては適切なインフォームドコンセントと、検査結果の意味を理解するための丁寧な遺伝カウンセリングが不可欠です。とりわけ家族歴のあるがん(遺伝性腫瘍)の場合は、体細胞変異と生殖細胞系列変異の違い、ご家族への影響なども含めて、専門医とゆっくり話し合う時間が大切になります。

仲田洋美院長

🩺 院長コラム【「治験」と聞いて尻込みする前に知ってほしいこと】

「治験」「臨床試験」と聞くと、「実験台にされるのでは」と不安になる方は少なくありません。確かに研究の側面はありますが、現代のアンブレラ型試験は「あなたの腫瘍の分子的特徴を踏まえて、最も合いそうな治療を提案する」精密な仕組みになっています。標準治療が尽きてしまった患者さんにとって、新たな選択肢になり得る場面が確かに増えてきました。

私はがん薬物療法専門医として、また臨床遺伝の立場から、患者さんに「治験=最後の手段」というイメージを持ってほしくないと感じています。検査結果に基づいて適切な情報を提供し、納得して選んでいただく——その意思決定のお手伝いが、私たちの仕事の核心だと思っています。気になることがあれば、まずは主治医の先生や腫瘍内科の専門医に「私の腫瘍にはどんな遺伝子変異がありますか」と尋ねてみてください。それが次の一歩につながることがあります。

よくある質問(FAQ)

Q1. アンブレラ型臨床試験とバスケット型試験は、何が一番違うのですか?

最大の違いは「対象とする疾患」と「評価する薬剤」の関係です。アンブレラ型は「1つの疾患(例:肺がん)の患者を遺伝子変異で複数のサブグループに分け、それぞれに合った複数の薬を並行評価」します。一方バスケット型は「同じ遺伝子変異を持つ複数の異なる疾患の患者を集めて、1つの薬を評価」します。アンブレラ型は「単一疾患×複数薬剤」、バスケット型は「複数疾患×単一薬剤」と覚えると整理しやすいです。

Q2. アンブレラ型試験は、なぜ「共通対照群」が患者にとって有利なのですか?

複数の治験薬を1つの試験で評価する場合、対照群(標準治療またはプラセボ)を全治療群で共有できます。個別に試験を走らせると、毎回多数の患者が対照群に割り付けられますが、共通化すれば対照群の総人数を減らせるため、個々の患者が対照群に当たる確率が相対的に下がり、実験的治療を受けられる確率が高まります。これが患者にとってのインセンティブの1つです。

Q3. 多重性(FWER)の問題とは、具体的にどんなリスクなのですか?

統計的検定を多数同時に行うと、偶然に「効いた」と誤判定する確率(偽陽性)が積み上がります。たとえば1検定の偽陽性率が5%でも、10回検定すれば全体で約40%まで上昇します。アンブレラ型試験は複数薬剤を同時評価するため、このエラー率の膨張をきちんと制御しないと、本当は効かない薬を「効く」と承認申請してしまうリスクが高まります。確証的試験ではボンフェローニ補正や階層的検定など、厳格なエラー制御が要求されます。

Q4. BATTLE試験の「適応的無作為化」は普通の無作為化とどう違うのですか?

通常の無作為化は最初から最後まで「同じ確率で各群に割り付ける」固定ルールです。一方BATTLE試験では、最初の97名は均等に4群へ割り付けたあと、得られたデータをベイズモデルで解析し、残りの158名は個々のバイオマーカープロファイルに基づいて「最も効きそうな治療への割り付け確率を高める」適応的な手法を採用しました。これによりプラセボや効果の低い治療を受ける患者を減らせる倫理的メリットがあります。

Q5. アンブレラ型試験はがん以外でも使われているのですか?

はい。これまで実施されたマスタープロトコルの90%以上は腫瘍学領域ですが、COVID-19パンデミックでは英国のRECOVERY試験などのマスタープロトコルが、デキサメタゾンなど有効な治療法を驚異的速度で同定しました。さらに精神疾患(「プレシジョン・メンタルヘルス」)、自己免疫疾患、神経変性疾患などへの応用も本格的に検討されはじめており、分子メカニズムが解明された領域なら腫瘍以外にも適応拡大が進むと予測されています。

Q6. 日本でアンブレラ型試験に参加するにはどうすればいいですか?

日本では国立がん研究センター中央病院や複数の大学病院・がんセンターでアンブレラ型・バスケット型試験が実施されています。参加には、まずがん遺伝子パネル検査などで適応する変異が同定されることが大前提となります。主治医・腫瘍内科医にご相談のうえ、適応する試験への紹介を依頼する流れが一般的です。なお当院ミネルバクリニックは臨床試験の実施機関ではありませんが、遺伝子検査・遺伝カウンセリングの観点からサポートが可能です。

Q7. Lung-MAP試験が「臨床試験へのアクセス民主化」を実現したとは、どういう意味ですか?

従来の独立試験は、限られた大学病院でしか実施されず、都市部の中流以上の患者しか参加しにくい構造でした。Lung-MAPは全米規模のネットワーク(SWOG、Allianceなど)を活用し、高齢の患者・農村部や社会経済的剥奪地域の居住者・メディケイド加入者や無保険の患者を、従来試験よりはるかに高い割合で登録することに成功しました。マスタープロトコルというインフラ共有が、臨床試験参加の地理的・経済的障壁を下げる可能性を示した点で歴史的意義があります。

Q8. アンブレラ型試験を成功させる上で、最も難しいのは何ですか?

技術的には多重性によるエラー率の制御サブ試験間の患者登録の不均衡です。共起変異を持つ患者をどのアームに割り当てるかという論理的問題も大きな課題です。運用面では、複数の独立した製薬企業や学術機関が1つのプロトコルに参加するため、データアクセス権・知的所有権・出版権・申請戦略などの利害調整が極めて複雑になります。強力な中央統括機能と独立したガバナンス体制が成功の鍵となります。

🏥 遺伝子検査・遺伝カウンセリングのご相談

がんゲノム医療・臨床試験参加に関わる遺伝子検査や
遺伝性腫瘍に関するご相談は
臨床遺伝専門医が在籍するミネルバクリニックにお気軽にどうぞ。

参考文献

  • [1] Practical Considerations and Recommendations for Master Protocol Framework. PMC. [PMC8220876]
  • [2] Systematic review of basket trials, umbrella trials, and platform trials: a landscape analysis of master protocols. PMC. [PMC6751792]
  • [3] Design and analysis of umbrella trials: Where do we stand? PMC. [PMC9596938]
  • [4] Kim ES, et al. The BATTLE Trial: Personalizing Therapy for Lung Cancer. Cancer Discovery. 2011;1(1):44-53. [AACR] / [PMC4211116]
  • [5] Herbst RS, et al. Lung Master Protocol (Lung-MAP)—A Biomarker-Driven Protocol for Accelerating Development of Therapies for Squamous Cell Lung Cancer: SWOG S1400. PMC. [PMC4654466]
  • [6] Lung-MAP Next Generation Sequencing Analysis of Advanced Squamous Cell Lung Cancers (SWOG S1400). PMC. [PMC11625613]
  • [7] Novel Approach to Accelerate Lung Cancer Research: Lung-MAP and the Potential of Public-Private Partnerships. PMC. [PMC10767300]
  • [8] Representativeness of Patients Enrolled in the Lung Cancer Master Protocol (Lung-MAP). PMC. [PMC10581630]
  • [9] Papadimitrakopoulou V, et al. The BATTLE-2 Study: A Biomarker-Integrated Targeted Therapy Study in Previously Treated Patients With Advanced Non–Small-Cell Lung Cancer. PMC. [PMC5065110]
  • [10] U.S. FDA. Master Protocols for Drug and Biological Product Development – Draft Guidance. [FDA Draft Guidance] / [FDA Guidance Documents]
  • [11] PMDA. 医薬品開発等におけるマスタープロトコル試験の活用に関する留意事項について. [PMDA PDF]
  • [12] Lung-MAP Clinical Trial – NCI – National Cancer Institute. [NCI]
  • [13] CTTI. What is a Master Protocol? [CTTI PDF]

関連記事

用語解説マスタープロトコル試験アンブレラ型・バスケット型・プラットフォーム型の上位概念を総合的に解説します。用語解説バスケット型臨床試験「複数疾患×単一薬剤」のデザインで臓器横断的承認を切り開く試験を解説。用語解説プラットフォーム型臨床試験永続運用と動的なアーム入れ替えを特徴とする最先端の試験デザインを解説。用語解説がん種横断的療法(Tumor-agnostic)遺伝子変異を基準に臓器を問わず適応されるがん治療パラダイムを解説。用語解説ベイズの定理適応的無作為化の統計的基盤となるベイズ統計学を初心者向けに解説。検査リキッドバイオプシーforモニター血液中のctDNAから腫瘍の遺伝子変異を非侵襲的に解析できる検査です。

仲田洋美 医師(臨床遺伝専門医)

この記事の監修・執筆者:仲田 洋美

(臨床遺伝専門医/がん薬物療法専門医/総合内科専門医)

ミネルバクリニック院長。1995年に医師免許を取得後、 臨床遺伝学・内科学・腫瘍学を軸に診療を続けてきました。 のべ10万人以上のご家族の意思決定と向き合ってきた臨床遺伝専門医です。

出生前診断(NIPT・確定検査・遺伝カウンセリング)においては、 検査結果の数値そのものだけでなく、 「結果をどう受け止め、どう生きるか」までを医療の責任と捉え、 一貫した遺伝カウンセリングと医学的支援を行っています。

ハイティーンの時期にベルギーで過ごし、 日本人として異文化の中で生活した経験があります。 価値観や宗教観、医療への向き合い方が国や文化によって異なることを体感しました。 この経験は現在の診療においても、 「医学的に正しいこと」と「その人にとって受け止められること」の両立を考える姿勢の基盤となっています。

また、初めての妊娠・出産で一卵性双生児を妊娠し、 36週6日で一人を死産した経験があります。 その出来事は、妊娠・出産が女性の心身に与える影響の大きさ、 そして「トラウマ」となり得る体験の重みを深く考える契機となりました。 現在は、女性を妊娠・出産のトラウマから守る医療を使命の一つとし、 出生前診断や遺伝カウンセリングに取り組んでいます。

出生前診断は単なる検査ではなく、 家族の未来に関わる重要な意思決定です。 年齢や統計だけで判断するのではなく、 医学的根拠と心理的支援の両面から、 ご家族が後悔の少ない選択をできるよう伴走することを大切にしています。

日本人類遺伝学会認定 臨床遺伝専門医/日本内科学会認定 総合内科専門医/ 日本臨床腫瘍学会認定 がん薬物療法専門医。 2025年には APAC地域における出生前検査分野のリーダーとして国際的評価を受け、 複数の海外メディア・専門誌で特集掲載されました。

お電話での受付可能
診療時間
午前 10:00~14:00
(最終受付13:30)
午後 16:00~20:00
(最終受付19:30)
休診 火曜・水曜

休診日・不定休について

クレジットカードのご利用について

publicブログバナー
 
medicalブログバナー
 
NIPTトップページへ遷移