InstagramInstagram

RNA-seq(トランスクリプトーム解析)とは? 仕組み・マイクロアレイとの違いから臨床応用までを遺伝専門医が解説

目次

仲田洋美 医師

この記事の監修:仲田洋美(臨床遺伝専門医)

のべ10万人以上の意思決定に伴走。国際医療誌『Medical Care Review APAC』『Global Woman Leader』の2誌で表紙を飾り、「Top Prenatal Testing Service in APAC 2025」に選出されるなど、世界基準の遺伝医療を提供。

細胞の中で「いま、どの遺伝子が、どれくらい働いているか」を丸ごと読み取る技術がRNA-seq(トランスクリプトーム解析)です。かつて主流だったマイクロアレイ(遺伝子チップ)を超え、未知の転写産物や希少な遺伝子の発現まで検出できるこの技術は、いまや希少疾患の診断やがん医療の現場でも活用され始めています。本記事では、RNA-seqの基本原理から実験の流れ、シングルセル解析や臨床応用までを、一般の方にもわかりやすく遺伝専門医が解説します。

この記事でわかること
📖 読了時間:約18分
🧬 RNA-seq・トランスクリプトーム・精密医療
臨床遺伝専門医監修

Q. RNA-seqとは何ですか?まず結論だけ知りたいです

A. RNA-seqは、細胞や組織の中で作られているRNA(遺伝子が働いた”コピー”)を次世代シーケンサーで網羅的に読み取り、どの遺伝子がどれくらい発現しているかを定量的に調べる技術です。従来のマイクロアレイと違い、あらかじめ配列がわかっていない未知の転写産物や、融合遺伝子・スプライシングの違いまで直接検出できる点が最大の特徴です。基礎研究だけでなく、希少疾患の診断やがんの個別化医療にも応用が広がっています。

  • 基本原理 → 転写されたRNAをcDNAに変換し、デジタルに数えて発現量を測定する
  • マイクロアレイとの違い → プローブに依存せず、桁違いに広いダイナミックレンジを持つ
  • 実験の要点 → 生物学的反復とシーケンシング深度のバランス、バッチ効果の回避が鍵
  • 解析の流れ → 品質評価 → マッピング → 定量 → 発現変動遺伝子の同定(DESeq2など)
  • 臨床応用 → 希少疾患の診断率向上、がんの薬剤耐性解明、リキッドバイオプシー

\ 遺伝子検査・遺伝カウンセリングについて専門医に相談したい方へ /

📅 遺伝カウンセリングを予約する

遺伝子検査に関するご相談:遺伝子検査について

1. RNA-seqとは:細胞の「働きの記録」を丸ごと読む技術

私たちの体の設計図はDNAに書かれていますが、その設計図がいつ・どこで・どれくらい「実際に使われているか」は、DNAを見ただけではわかりません。細胞が遺伝子を使うとき、DNAの情報はまずRNAという”働くためのコピー”へと写し取られます。この写し取りを「転写」と呼び、細胞の中に存在するRNA全体をトランスクリプトームと言います。つまりトランスクリプトームを調べることは、「その細胞がいま何をしようとしているのか」という活動状況を読み取ることに他なりません。

RNA-seq(RNAシーケンス)とは、この細胞内のRNAを次世代シーケンサーで網羅的に読み取り、どの遺伝子がどれくらい発現しているかを定量的に測定する技術です[1]。具体的には、細胞や組織から抽出したRNAを、化学的に安定で読み取りやすいcDNA(相補的DNA)に変換したうえで、そのライブラリ(配列の集合体)を大量に読み取ります[3]。過去十数年の間に、トランスクリプトーム解析の主役は従来のマイクロアレイ(遺伝子チップ)から、次世代シーケンシングに基づくこのRNA-seqへと決定的に移行しました[1]。

💡 用語解説:トランスクリプトームとcDNA

トランスクリプトームとは、ある細胞や組織が特定の時点で発現しているすべてのRNA分子の集まりのことです。「transcript(転写産物)」と「genome(ゲノム)」を組み合わせた言葉で、細胞の”活動スナップショット”だとイメージするとわかりやすいです。

cDNA(相補的DNA)とは、RNAを鋳型(型紙)にして人工的に合成したDNAのことです。RNAは分解されやすく扱いにくいため、逆転写酵素という酵素を使ってRNAの配列情報を安定なDNAへ写し替えます。RNA-seqでは、このcDNAをシーケンサーで読み取ります。

RNA-seqが革新的だった理由は、単に読み取りの速さ(スループット)と定量性を高めただけでなく、これまでの技術では捉えきれなかった転写の複雑さを扱えるようになった点にあります[2]。たとえば、一つの遺伝子から複数のパターンで作られるスプライシングバリアント、本来別々の遺伝子がつながってしまう融合遺伝子、父親由来と母親由来のどちらのコピーが使われているかというアレル特異的発現、さらにはタンパク質にならないノンコーディングRNAまで、まとめて定量できるようになりました[1]。

現在では、RNA-seqは基礎科学の研究室にとどまらず、農業分野や臨床診断、そして患者一人ひとりに最適な医療を目指すプレシジョン・メディシン(精密医療)の現場においても、幅広く活用されるようになっています[1]。この記事では、その基本原理から実験のコツ、データ解析の仕組み、そして最先端の臨床応用までを、順を追って解説していきます。

2. マイクロアレイとの違い:なぜRNA-seqが主流になったのか

RNA-seqが登場する前、遺伝子の発現量を網羅的に調べる主役はマイクロアレイ(遺伝子チップ)でした。マイクロアレイは、スライドガラス上に「調べたい遺伝子の配列にくっつく短い一本鎖DNA(プローブ)」をびっしり並べ、そこにサンプル由来のRNA(を蛍光標識したもの)を結合させて、光の強さで発現量を測る仕組みです。とても優れた技術でしたが、RNA-seqと比べると根本的な弱点を2つ抱えていました。

違い①:プローブに依存するかどうか

1つ目の違いは、「あらかじめ配列を知っている必要があるかどうか」です。マイクロアレイは、プローブとRNAが結合(ハイブリダイゼーション)する現象を利用するため、検出したい遺伝子の配列があらかじめわかっていなければ、そもそもプローブを作れません[5]。つまり「すでに知っているものしか測れない」技術です。

これに対してRNA-seqは、既存の知識やリファレンス(参照)配列に完全に依存せず、サンプルに含まれるRNAをそのまま読み取ります。そのため、新しい転写産物、融合遺伝子、一塩基変異(SNV)、インデル(挿入・欠失)、未知のスプライシングバリアントまでを直接検出できるのです[5]。「知らないものも見つけられる」という点が、発見志向の研究において決定的な強みとなりました。

💡 用語解説:ハイブリダイゼーションとプローブ

DNAやRNAは、A-T(U)、G-Cという決まった組み合わせで相手の鎖とくっつく性質があります。この「相補的な配列同士がくっつく」現象をハイブリダイゼーションと呼びます。プローブとは、この性質を利用して特定の配列を”釣り上げる”ために設計された短い一本鎖の核酸のことです。マイクロアレイは無数のプローブを使う「釣り針方式」、RNA-seqはプローブを使わずすべて読む「総ざらい方式」とイメージすると違いがわかりやすいです。

違い②:測定できる範囲(ダイナミックレンジ)の広さ

2つ目の違いは、測定できる発現量の幅(ダイナミックレンジ)です。マイクロアレイは蛍光というアナログな光の信号に頼るため、発現量がとても低い領域ではノイズに埋もれてしまい、逆に発現量がとても高い領域では信号が飽和して振り切れてしまいます。この技術的な限界は、およそ10³(1,000倍)程度のダイナミックレンジにとどまります[5]。

一方RNA-seqは、読み取ったリード(配列の断片)をデジタルに1つずつ数えるため、信号の飽和が起こらず、10⁵(10万倍)を超える広大なダイナミックレンジを実現しています[5]。この特性により、これまで検出が難しかったわずかな発現の変化や、量の少ないアイソフォームも、高い感度と特異性で捉えられるようになりました[6]。

マイクロアレイとRNA-seqの定量可能範囲の比較。RNA-seqは10の5乗を超える広さを持つ

マイクロアレイ(ハイブリダイゼーション法)とRNA-seq(デジタル計数法)の定量可能範囲の比較。RNA-seqはバックグラウンドノイズとシグナル飽和の制約を受けず、桁違いに広い測定範囲を持つ。

統計的な検出力の面でもRNA-seqの優位性が報告されています。ある比較研究では、解析対象となった遺伝子の75.5%でRNA-seqがマイクロアレイより高いスコアを示しました[9]。偽発見率(誤って”差がある”と判定してしまう割合)を調整したうえで発現変動遺伝子として選ばれた割合も、マイクロアレイの56.0%に対しRNA-seqでは71.5%に達しています[9]。

ただし、すべての場面で常にRNA-seqがマイクロアレイを上回るわけではない点には注意が必要です。特定のがん種の生存予測モデルでは、大腸がん・腎臓がん・小細胞肺がんのコホートでマイクロアレイベースのモデルの方が良い成績を示す一方、卵巣がんや子宮内膜がんではRNA-seqベースのモデルが優れるという報告があります[10]。データセットの特性や対象疾患によっては、蓄積されたマイクロアレイのデータもなお有用な情報源となり得ます。とはいえ、転写産物を包括的に理解するための主要な基盤技術がRNA-seqであるという事実は変わりません[10]。

3. 実験デザイン:結果の信頼性は「計画」で決まる

RNA-seqから得られる結論が信頼できるかどうかは、実験を始める前の「計画段階」で大きく決まります。サンプリングやライブラリ構築のデザインが不適切だと、交絡因子やバッチ効果といったバイアスが入り込み、後からどれほど高度な計算手法を使っても補正しきれなくなるためです[11]。ここが、RNA-seqを「なんとなくやる」のと「正しくやる」のとを分ける最初の分岐点になります。

生物学的反復とシーケンシング深度:どちらにお金をかけるか

発現の違う遺伝子(DEG:発現変動遺伝子)を見つけたいとき、最も頻繁に直面する悩みが「反復(サンプル数)を増やすか、1サンプルあたりの読む量(深度)を増やすか」というトレードオフです[14]。予算が限られている以上、どちらかを優先しなければなりません。

マイクロアレイの時代は測定自体のノイズが大きかったため、同じサンプルを繰り返し測る「技術的反復」が重視されていました。しかし現在のIlluminaプラットフォームによるRNA-seqでは、技術由来のばらつきは個体差などの生物学的なばらつきに比べて極めて小さく抑えられています[12]。そのため今日のRNA-seqでは技術的反復はほぼ不要で、代わりに異なる個体から採取する「生物学的反復」を増やすことが絶対的な要件となります[12]。

💡 用語解説:生物学的反復と技術的反復

生物学的反復(Biological Replicates)とは、別々の個体・別々の細胞集団からサンプルを取ることです。個体ごとの自然なばらつきを捉えられるため、「この差は集団として本物か」を統計的に判断できます。

技術的反復(Technical Replicates)とは、同じサンプルを繰り返し測ることです。機械のばらつきは見られますが、生物としての違いはわかりません。現代のRNA-seqでは機械のばらつきが小さいため、こちらの重要性は下がっています。

実際、総予算が限られている場合は、1サンプルを深く読むよりも、生物学的反復の数を増やす方が発現変動遺伝子の検出力を高めることが多くの研究で示されています[12]。読む深さの目安は目的によって異なり、一般的な遺伝子レベルの解析ではENCODEのガイドラインに基づき1サンプルあたり最低3,000万リードが推奨されますが、反復が十分(4〜5以上)あれば1,500万リード程度でも十分とされます[14]。一方、稀少な転写産物やアイソフォームレベルの詳細な解析には、6,000万リード以上の深い読み取りが求められます[14]。

交絡とバッチ効果:混ざると分けられなくなる

実験デザインで最も致命的なミスが「交絡(Confounding)」です。これは、2つの異なる要因の影響を区別できなくなる状況を指します[14]。たとえば、新薬の効果を調べる実験で、治療群のサンプルをすべてオスのマウス、対照群をすべてメスのマウスから採ってしまうと、得られた発現の差が「薬の効果」なのか「性別の違い」なのかを、統計的に分離することが不可能になります[12]。これを避けるには、性別・年齢・同腹子などを各群に均等に分散させる必要があります[14]。

もう一つ注意すべきが「バッチ効果(Batch Effect)」です。これは、RNAの抽出日、ライブラリ調製の担当者、試薬のロット、シーケンサーの実行回(ラン)などの違いによって生じる技術的な変動のことです[12]。理想は全サンプルを同一バッチで処理することですが、大規模研究では現実的に不可能です。その場合に絶対に避けるべきは「特定の条件群だけを1つのバッチに偏らせること」で、代わりに各バッチへ各群を均等に振り分け、バッチ情報をきちんと記録しておきます。こうしておけば、後の解析(DESeq2などの統計モデル)でバッチ由来の変動を差し引き、本物の生物学的な差だけを抽出できます[12]。

仲田洋美院長

🩺 院長コラム【「データを取る前」がいちばん大事】

遺伝子解析の相談を受けていると、「とにかくたくさん読めば良い結果が出る」と思われている方が少なくありません。しかし実際には、どんなに高価なシーケンサーで深く読んでも、実験の入り口でオスとメス、治療群と対照群、処理する日付などが偏ってしまっていると、そのデータからは本物の答えを取り出せなくなってしまいます。

これは料理の下ごしらえに似ています。材料の切り方や仕込みが雑だと、どんなに良い火加減で調理しても味は決まりません。RNA-seqにおける「生物学的反復を増やす」「群を均等に分散させる」という地味な工夫こそが、信頼できる結論を導く土台になります。臨床の現場でデータを読み解く立場からも、私はこの”計画の質”をいつも重視しています。

4. RNA抽出とライブラリ調製:シーケンサーで読める形にする

RNA-seqの物理的な出発点は、高品質なRNAを抽出し、それをシーケンサーで読める形の「ライブラリ」に調製することです[11]。この段階での選択が、最終的なデータの解像度と正確性を決定づけます。ここでは特に重要な3つのポイント——RNAの品質、断片化、そして鎖特異性——を見ていきます。

RNAの品質:分解したRNAは結果を歪める

抽出したRNAの品質はRIN(RNA Integrity Number)という指標で評価します。RINが6未満に分解した低品質のRNAを使うと、遺伝子全体を均等に読めず、転写産物の末端付近だけが偏って読まれる「カバレッジバイアス」が生じます[16]。これは分解が進んだRNAにポリA選択(後述)を行うと、3’末端側の断片ばかりが回収され、5’側の情報が失われるためで、スプライシング解析やアイソフォーム定量を大きく歪める危険があります[16]。

とはいえ臨床や病理の現場では、いつも新鮮なサンプルが手に入るわけではありません。死後解剖のサンプルや、長期保存されたホルマリン固定パラフィン包埋(FFPE)組織では、RNAは必然的に高度に分解されています[16]。こうした劣化サンプルでは、mRNAの目印(ポリAテール)を狙う方法ではなく、大量に存在するリボソームRNAを取り除く「rRNA枯渇法」を使うのが一般的です。これにより、断片化したmRNAやポリAを持たないノンコーディングRNAもライブラリに取り込めます[15]。

断片化:長いRNAを読める長さに切る

市場を広く占めるIlluminaのシーケンサーは、一度に読める長さに物理的な限界があります(一般的なショートリードで150〜300bp程度)[11]。そのため、長いmRNAやcDNAはシーケンス前に適切なサイズへ切断(断片化)する必要があります[18]。断片化には物理的・酵素的・化学的の3つの方法があり、それぞれに長所と短所があります[18]。近年は自動化しやすく、微量サンプルやFFPEのような劣化サンプルにも強い酵素的断片化の重要性が高まっています[17]。最新のキットでは、増幅時に生じやすい偽の配列(アーティファクト)の形成を大幅に減らし、臨床診断で重要な低頻度バリアントの検出精度を向上させることに成功しています[17]。

鎖特異的RNA-seq:RNAの「向き」を保つ工夫

ライブラリ調製で最も重要な判断の一つが、転写産物の「向き(方向性)」を保ったまま読む鎖特異的(ストランド特異的)プロトコルを使うかどうかです[22]。標準的な方法では、二本鎖cDNAを作る過程で、読み取った配列がゲノムのどちら側の鎖から転写されたものかという情報が失われてしまいます[22]。

これがなぜ問題になるのか。哺乳類のトランスクリプトームは複雑で、Gencodeプロジェクトのデータによれば、ある解析ではヒトゲノムの約9%の遺伝子が同じ鎖で物理的に重複しており、反対側の鎖からの転写を含めると全体の約19%(およそ11,000遺伝子)が同じ領域を共有して転写されているとされます[26]。向きの情報がないと、こうした重複領域から出たリードがどちらの遺伝子由来か判別できず、大きな定量誤差の原因になります[26]。そのため、正確なトランスクリプトーム解析や、アンチセンス転写産物・長鎖ノンコーディングRNAの解明を目的とする場合、鎖特異的RNA-seqが事実上の必須条件となります[23]。

💡 用語解説:dUTP法(鎖の向きを記録する仕組み)

鎖の向きを保つ代表的な方法がdUTP法です。仕組みはこうです。まずRNAを鋳型に1本目のcDNAを合成し、2本目を合成するときに通常の材料(dTTP)の代わりに目印付きの材料(dUTP)をわざと使います。すると2本目だけにウラシルという”印”が入ります。

その後、ウラシルだけを認識して切り出す酵素(UDG)を加えると、印のついた2本目の鎖だけが選択的に壊されます。結果として、元のRNAの向きを正確に保った1本目の鎖だけが増幅され、すべてのリードが元の転写産物の向きを保持できるのです。現在、世界の主要な施設で最も広く使われている堅牢な方法です[22][23]。

5. データ解析:読み取った配列を「意味」に変える

シーケンサーが配列を読み終え、生の配列と品質スコアを持つFASTQ形式のファイルが出力されると、実験室(ウェットラボ)での作業は完了し、計算機環境(ドライラボ)での解析に移ります[11]。一般的な流れは、①生データの品質評価、②リファレンスへのマッピング(アライメント)、③発現量の定量、④条件間で発現が異なる遺伝子(DEG)の特定、という4段階です[30]。ここには、ハーバード大学のバイオインフォマティクスコアのような教育機関でも普及が図られている、厳密な計算論的ベストプラクティスが存在します[31]。

マッピングと定量:2つのアプローチ

読み取ったリードを遺伝子に割り当てる方法には、大きく2つの経路があります[35]。1つ目は、STARやHISAT2といった「スプライス認識アライナー」でリードをゲノム上の正確な位置に貼り付け、featureCountsなどで各遺伝子に着地したリード数を数える、伝統的で信頼性の高い方法です[35]。良質なデータの目安は、一意にマッピングされたリードが80%を超えることです[35]。

2つ目は、SalmonやKallistoに代表される「軽量定量(擬似アライメント)」です。ゲノム全体への重い物理的アライメントを行わず、リードの短い部分配列(k-mer)をもとに、どの転写産物由来かを確率的に割り当てます[35]。計算リソースと時間を劇的に削減でき、よく似た配列を持つアイソフォームの存在量も正確に定量できる利点があります[35]。ヒトやマウスのようにアノテーション(注釈)が充実した生物では、この方法が主流になりつつあります。得られたカウントは、FPKMやTPM、あるいはDESeq2による正規化を経て、生物学的な解釈に用いられます[11]。

発現変動解析の定番「DESeq2」の考え方

条件間で発現が有意に変わった遺伝子(DEG)を見つける統計解析には、これまでCuffdiffやEdgeRなど多様なソフトが開発されてきましたが、現在バルクRNA-seqで最も広く使われている定番がR言語ベースのDESeq2です[3]。DESeq2が信頼されるのは、RNA-seqのカウントデータが持つ数学的な特性を丁寧にモデル化しているからです[38]。

💡 用語解説:過分散と負の二項分布

「回数を数えるデータ」を統計的に扱うとき、よくポアソン分布という数学モデルが使われます。ただしポアソン分布は「平均とばらつき(分散)が等しい」という強い前提を置いています。

ところが実際の生物データでは、個体差などの影響でばらつきが平均を大きく上回る「過分散」が頻繁に起こります。DESeq2は、この過分散を正確に表現できる「負の二項分布」を土台に採用することで、より現実に即した判定を可能にしています[38]。

DESeq2の解析はいくつかの巧妙なステップを踏みます。まず、サンプルごとに読んだ総リード数が違うため、そのままでは比較できません。DESeq2は各遺伝子カウントの中央値に対する比率から「サイズファクター」を導き、堅牢に正規化します[37]。次に各遺伝子のばらつき(分散)を推定しますが、反復数が少ない(例:各群n=3)と分散推定が不安定になります。そこでDESeq2は、全遺伝子の「平均発現量」と「分散」の関係を示す予測曲線を当てはめ、各遺伝子の分散推定値をそのトレンドに向けて統計的に「縮小」させます[37]。この工夫により、たまたま分散が低く見えた遺伝子が誤って”差あり”と判定される偽陽性を防ぎます。

最後に、負の二項分布に基づく一般化線形モデルでデータを当てはめ、発現変化の大きさをLog2 Fold Change(対数比)として算出し、Wald検定などでp値を計算します[38]。多数の遺伝子を同時に検定するため、Benjamini-Hochberg法などで多重検定を補正し、偽発見率(FDR)で調整したq値(padj)を最終的な有意性の基準とします[39]。さらに時間経過を追う複雑なデザインでは、尤度比検定(LRT)を使って経時的に変化する遺伝子群を網羅的に同定することもできます[39]。

6. 発現量だけじゃない:スプライシングと小分子RNA

RNA-seqの価値は、単に遺伝子の量を測ることだけにとどまりません。細胞の中で起きているRNAの多彩な現象を、まるごと解析できる基盤技術としての地位を確立しています[40]。ここでは代表的な2つの応用——スプライシングと小分子RNA——を紹介します。

選択的スプライシングと新しいアイソフォームの発見

一つの遺伝子から、エクソン(タンパク質の設計情報を持つ部分)の組み合わせ方を変えることで、複数の異なるmRNA、ひいては異なる機能を持つタンパク質が作られる現象を選択的スプライシングと呼びます[11]。この仕組みは、細胞の分化や発生、そしてがんや神経変性疾患の病態において、極めて重要で動的な役割を果たしています[11]。

💡 用語解説:エクソン・イントロンとアイソフォーム

遺伝子には、タンパク質の情報を持つエクソンと、その間に挟まれるイントロンという部分があります。RNAができる過程でイントロンが取り除かれ、エクソンがつなぎ合わされます。これがスプライシングです。

このとき、どのエクソンを使うか・使わないかを変えると、同じ遺伝子から少しずつ違う製品ができます。この”バリエーション違いの製品”をアイソフォームと呼びます。RNA-seqは、スプライシングのつなぎ目をまたぐリードを読むことで、こうした違いを網羅的に検出できます[11]。

さらに、PacBioのIso-SeqやOxford Nanoporeといったロングリードシーケンシング技術をRNA-seqに統合することで、解析は新たな次元に入っています[1]。ショートリードでは、断片化されたリードを計算でつなぎ合わせるため、複雑なスプライシングを持つ長い転写産物の全体像を推測するのは困難でした。ロングリード技術は転写産物の全領域を一分子レベルで連続して読み取るため、これまで未知だった新しいアイソフォームの完全な構造を確定できます[1]。ミネルバクリニックの用語解説でも、ロングリードシーケンサーナノポアシークエンサーについて詳しく取り上げています。

小分子RNAとアレル特異的発現の検出

細胞の中には、タンパク質に翻訳されないRNAが多数あり、遺伝子発現を調節する司令塔として働いています。その代表が200塩基未満の小分子RNA(Small RNAs)で、マイクロRNA(miRNA)や低分子干渉RNA(siRNA)などが含まれます[3]。標準的なmRNA-seqでは、断片化やサイズ選別の過程でこうした短いRNAは排除されてしまうため、これらを調べるには専用のSmall RNA-seqライブラリ調製が必要になります[11]。これにより、発現抑制ネットワークを司るmiRNAのプロファイリングや、新たな疾患バイオマーカーの探索が可能になります。

また、RNA-seqのデータはゲノム上の変化も反映するため、転写された領域にある一塩基多型(SNP)やインデルの検出、さらには父親由来と母親由来のどちらのアレル(対立遺伝子)が優先的に使われるかというアレル特異的発現の偏りを調べる用途にも応用されています[3]。遺伝子発現におけるアレル不均衡は、片方のアレルの機能異常を見つける手がかりとなり、後述する希少疾患の診断でも重要な役割を果たします。

7. 解像度の進化:シングルセルと空間トランスクリプトミクス

RNA-seqのこの10年で最も破壊的だった進歩は、「組織全体を平均して見る」解析から、「一つひとつの細胞単位」、さらには「組織の中での位置関係を保ったまま」見る解析へと、解像度が飛躍的に上がったことです[40]。

シングルセルRNA-seq(scRNA-seq):埋もれた細胞を見つける

従来のバルクRNA-seqは、数百万個の細胞をすり潰した混合物を分析するため、細胞集団全体の”平均的な発現”しか得られませんでした。この方法では、がん組織に潜む微小な細胞集団(たとえば稀な薬剤耐性クローン)の重要なシグナルが、大多数の細胞のノイズに埋もれてしまうという弱点がありました[45]。

シングルセルRNAシーケンシング(scRNA-seq)は、この壁を打ち破りました。マイクロフルイディクス(微小流体)などの技術で細胞を一つずつ小さな液滴に隔離し、それぞれの細胞のRNAに固有の目印(細胞バーコードと分子識別子UMI)を付けることで、何万もの単一細胞のトランスクリプトームを同時に高解像度で描き出します[44]。ただしこの解析は計算負荷が桁違いに大きく、たとえば10,000細胞のデータには16〜32GBのRAMが、100,000細胞規模では64GB以上やクラウド・HPC環境が必要になります[35]。10x GenomicsのCellRangerによる処理から、正規化、UMAPなどの次元圧縮、Louvain/Leidenアルゴリズムによるクラスタリング、マーカー遺伝子による細胞タイプの注釈付けまで、独自の複雑なパイプラインを辿ります[35]。この技術により、腫瘍内の不均一性の解明や、腫瘍微小環境における免疫細胞とがん細胞の複雑な相互作用の理解が急速に進んでいます[44]。

バルクRNA-seqからシングルセル、空間トランスクリプトミクスへの解像度の進化

RNA-seq技術の進化。バルクRNA-seqが組織全体の発現を平均化するのに対し、scRNA-seqは個々の細胞タイプを特定できる。さらに空間トランスクリプトミクスは、細胞の位置情報と発現プロファイルを組織構造上で同時に統合する。

空間トランスクリプトミクス:位置情報を取り戻す

シングルセル解析は細胞の違いを高精度に解明できる一方、前処理で組織を単一細胞にバラバラに解離させるため、「その細胞が組織のどこにあり、どの細胞と隣り合っていたか」という空間情報が完全に失われる欠点がありました[45]。この欠けた文脈を取り戻すのが空間トランスクリプトミクス(Spatial Transcriptomics)です。

この技術では、組織切片を、X軸・Y軸の位置を示す空間バーコードがあらかじめ格子状に配置された特殊なスライドにのせます[46]。組織から染み出したmRNAがその場(in situ)で捕捉・逆転写され、シーケンシング後に各リードを元の座標へマッピングし直すことで、顕微鏡で見る病理組織像と数千〜数万の遺伝子発現プロファイルをピクセル単位で統合できます[46]。実際に、前立腺がんの研究では6,750もの組織領域を解析して遺伝子発現の空間的な不均一性が明らかになり、乳がんでも腫瘍と微小環境の間の空間特異的な細胞間コミュニケーションが直接証明されています[48]。

📝 補足:シングルセルRNA-seqと空間トランスクリプトミクスは、いずれも急速に発展している先端領域です。研究段階の技術も多く含まれ、臨床への本格的な実装に向けては、標準化やコスト面の課題がなお残されています。

8. 臨床応用:希少疾患の診断とがん医療へ

RNA-seqは基礎研究のパラダイムを塗り替えただけでなく、次世代の臨床診断や、患者一人ひとりに合わせた個別化医療(プレシジョン・メディシン)の中核技術として急速に台頭しています[50]。ここでは、希少疾患の診断とがん医療という2つの応用を見ていきます。

希少疾患:DNA検査で「わからなかった」を解決する

未診断の希少な遺伝性疾患を調べる第一選択は、全エクソームシーケンス(WES)全ゲノムシーケンス(WGS)といったDNAベースの検査です。これらは大きな貢献をしていますが、DNAレベルの解析だけでは限界があります[51]。特に、タンパク質のアミノ酸配列を変えない同義置換や、イントロン深部の変異が見つかった場合、それが本当に病気の原因かどうか判断できない「意義不明変異(VUS)」に分類され、確定診断に至らないケースが全体の半分以上を占めます[51]。

💡 用語解説:意義不明変異(VUS)とは

VUS(Variants of Uncertain Significance)とは、遺伝子検査で見つかった配列の変化のうち、「病気の原因なのか、それとも無害な個人差なのか、現時点では判断がつかない」ものを指します。DNAの文字が変わっていても、それが実際にタンパク質や細胞の働きにどう影響するかがわからないと、確定診断には使えません。RNA-seqは、その変異が実際にRNAレベルでどんな影響を及ぼしているかを直接示すことで、VUSの解釈を助けます。

ここに新たなブレイクスルーとしてRNA-seqが導入され始めています。DNA検査で診断がつかなかった患者の線維芽細胞や筋組織、血液などからRNA-seqを行い、トランスクリプトームの表現型を解析することで、DNA変異が実際にどんな機能的帰結をもたらすかを直接証明できます[52]。RNA-seqが臨床診断に貢献する主なメカニズムは、①特定の遺伝子が極端に増減する「異常発現」の検出、②変異アレルだけが異常発現する「対立遺伝子特異的発現」の検出、③DNA検査では解釈困難だったイントロン変異が実際にスプライシング異常を起こしていることの直接確認、の3点です[54]。

実際、WES/WGSで未診断だった大規模コホートにRNA-seqを追跡検査として実施した結果、患者の約15〜16%(特定の研究では最大35%)で新たな分子的原因が解明され、診断率が顕著に向上したと報告されています[51]。ただしこの数字は研究やコホートによって幅があります。こうしたDNA解析とRNA解析を組み合わせるアプローチは、ミネルバクリニックでもRNA統合シークエンス解析(RNA-ISE)として提供されており、原因不明の希少疾患の診断を補助・加速する目的で活用されています。

精密腫瘍学:静的な設計図に「動き」を加える

がん医療において、RNA-seqの価値は計り知れません。DNAシーケンスが腫瘍の持つ変異やコピー数異常という「静的な遺伝的地図」を示すのに対し、RNA-seqはそれらの変異が実際に機能的な転写プログラムとして稼働しているかを示す「動的な機能的リードアウト」を提供するからです[4]。がんの薬剤耐性の解明では、scRNA-seqが特に威力を発揮します。薬の投与前後の単一細胞の転写プロファイルを比べることで、選択圧を逃れて生き残った微小な耐性細胞集団を特定し、それがどんな分子的な仕組みで生存しているかを明らかにできます[4]。

具体的な発見も相次いでいます。乳がんのscRNA-seq研究では、腫瘍に浸潤する免疫抑制性の未成熟な骨髄系細胞が薬剤耐性を誘導していることが特定され、別の研究ではプラチナ製剤耐性に関連する新規遺伝子や、白血病における新たな融合転写産物が薬剤耐性を高めるメカニズムが解明されています[48]。また、免疫チェックポイント阻害薬(ICI)の効果予測でも、RNA-seqベースの多遺伝子発現アッセイは、単一マーカーの評価に比べて、細胞傷害性T細胞の活性化状態や免疫の疲弊メカニズムを網羅的に捉えられ、どの患者が免疫療法に反応するかの予測精度を高めています[4]。

さらに、血液中を循環する腫瘍由来のRNA(ctRNA)を標的としたリキッドバイオプシーの開発も急速に進んでいます[42]。エクソソーム内のRNAなどは生体内で比較的安定しており、外科的な組織生検を伴わない非侵襲的ながんの早期発見・治療効果のモニタリング・再発の早期検知に向けたバイオマーカーとして有望視されています[42]。血液中の循環腫瘍DNA(ctDNA)と合わせて、リアルタイムに腫瘍の状態を追える技術として注目されています。

仲田洋美院長

🩺 院長コラム【DNAが「設計図」なら、RNAは「今日の作業日誌」】

遺伝子検査というと、多くの方はDNAを調べるものだとイメージされます。確かにDNA解析は診断の土台ですが、DNAはあくまで生まれつき決まった「設計図」です。その設計図が実際に細胞の中でどう使われているか——それを教えてくれるのがRNAであり、RNA-seqなのです。私はよく、DNAが建物の設計図なら、RNAは「その日、現場で実際にどの作業が行われたか」を記した作業日誌のようなものだとご説明しています。

DNA検査だけでは「意義不明」とされた変化が、RNAを見ることで初めて「これは確かに悪さをしている」と証明できることがあります。希少疾患の診断において、この視点が加わったことの意義はとても大きいものです。文献・研究動向として蓄積されつつあるがん領域での応用も含め、RNAという”動き”を読む時代が確かに来ていると感じています。

もっとも、RNA-seqを日常の臨床診断に完全に統合するには、まだ課題が残っています。データ解析パイプラインの規制要件に適合した標準化、数十ギガバイトからテラバイト規模に及ぶ巨大なデータの保存・処理インフラのコスト削減、そして健常人における組織・細胞ごとの遺伝子発現のベースラインを整理した包括的なデータベースの構築などです[50]。これらを一つずつ乗り越えることで、RNA-seqは今後も生命現象の解明の最前線を走り続けると考えられます。

9. よくある誤解

誤解①「RNA-seqはDNA検査の代わりになる」

RNA-seqはDNA検査を置き換えるものではなく、補完するものです。DNAが「生まれつきの設計図」を示すのに対し、RNAは「その設計図が実際にどう使われているか」を示します。両者を組み合わせることで、DNA単独では「意義不明」だった変化の解釈が進むことがあります。

誤解②「RNA-seqなら何でもわかる」

RNA-seqは強力ですが万能ではありません。解析する組織・細胞で発現している遺伝子しか見られないため、目的の遺伝子が働いていない組織を調べても情報は得られません。どの組織を使うか、どの手法(ポリA選択かrRNA枯渇か)を選ぶかで、見えるものが変わります。

誤解③「たくさん読めば読むほど良い」

1サンプルを深く読むことより、生物学的反復(サンプル数)を増やす方が検出力が上がる場面が多くあります。深さと反復数のどちらを優先すべきかは目的によって異なり、限られた予算をどう配分するかが実験設計の腕の見せどころです。

誤解④「マイクロアレイはもう使われない」

主役はRNA-seqに移りましたが、特定のがん種の予測モデルなど、蓄積されたマイクロアレイのデータがなお有用な場面もあります。技術には向き不向きがあり、目的に応じて使い分けるのが実際の姿です。

よくある質問(FAQ)

Q1. RNA-seqとDNAの遺伝子検査は何が違うのですか?

DNAの遺伝子検査は、生まれつき持っている「設計図」そのものの変化を調べます。一方RNA-seqは、その設計図が実際に細胞の中でどれくらい、どのように使われているかを調べます。DNA検査で見つかった変化が本当に病気の原因かどうか判断が難しいとき、RNA-seqがその変化の”機能的な影響”を直接示すことで、診断の手がかりになります。両者は競合するものではなく、補い合う関係です。

Q2. RNA-seqはマイクロアレイと比べて必ず優れているのですか?

多くの面でRNA-seqが優れており、特に未知の転写産物を検出できる点や、測定できる発現量の幅(ダイナミックレンジ)の広さで大きな強みがあります。ただし、すべての場面で常に上回るわけではありません。たとえば特定のがん種の生存予測モデルでは、蓄積されたマイクロアレイのデータの方が良い成績を示す例も報告されています。目的やデータの特性に応じて使い分けられています。

Q3. シングルセルRNA-seqと普通のRNA-seqはどう違うのですか?

従来のRNA-seq(バルク解析)は、多数の細胞をまとめてすり潰し、集団全体の”平均的な発現”を測ります。これに対しシングルセルRNA-seqは、細胞を一つずつ分離して固有の目印をつけ、一細胞ごとの発現を読み取ります。これにより、集団の平均では埋もれてしまう稀な細胞(たとえば薬剤耐性を持つがん細胞など)を見つけ出せます。その分、計算負荷やコストは大きくなります。

Q4. RNA-seqは希少疾患の診断にどのように役立つのですか?

全エクソーム・全ゲノム検査(DNA検査)で診断がつかなかった患者さんの血液や線維芽細胞などからRNA-seqを行うと、①遺伝子の異常な増減、②片方のアレルだけの異常発現、③スプライシング異常を直接確認できます。これによりDNA検査で「意義不明」とされていた変化の解釈が進み、大規模研究では追跡検査で約15〜16%(研究により幅があり最大35%)の患者さんで新たに原因が判明したと報告されています。

Q5. 「鎖特異的RNA-seq」とは何ですか?なぜ必要なのですか?

RNAには「向き」があり、どちら側の鎖から転写されたかという情報が重要な場合があります。通常の方法ではこの向きの情報が失われてしまいますが、鎖特異的(ストランド特異的)RNA-seqでは向きを保ったまま読み取れます。ヒトゲノムには、同じ領域から両方向に転写される遺伝子が一定割合存在するため、向きの情報がないと、どちらの遺伝子由来かを正しく区別できず定量誤差の原因になります。正確な解析には欠かせない工夫です。

Q6. 分解した古い組織サンプルでもRNA-seqはできますか?

はい、可能です。長期保存されたホルマリン固定パラフィン包埋(FFPE)組織などRNAが分解しているサンプルでは、mRNAの目印を狙う方法だと情報が偏ってしまいます。そこで、大量に存在するリボソームRNAを取り除く「rRNA枯渇法」を使うことで、断片化したmRNAやポリAを持たないノンコーディングRNAも解析できます。ただし品質が低いサンプルでは解釈に注意が必要です。

Q7. RNA-seqの解析にはどれくらいのコンピュータ性能が必要ですか?

通常のバルクRNA-seqであれば、一般的な研究室のワークステーションでも解析可能です。ただしシングルセルRNA-seqは負荷が桁違いに大きく、たとえば1万細胞で16〜32GB、10万細胞規模では64GB以上のメモリや、クラウド・高性能計算(HPC)環境が必要とされます。データ量が数十ギガバイトから時にテラバイト規模に達するため、保存・処理のインフラも重要な検討事項になります。

Q8. 血液を採るだけでがんのRNAを調べられるのですか?

血液中には、腫瘍由来のRNA(エクソソーム内のRNAや、タンパク質と結合して安定化した循環マイクロRNAなど)が存在し、これを標的とするリキッドバイオプシーの研究開発が進んでいます。外科的な組織生検を伴わない非侵襲的な検査として、早期発見や再発の早期検知への応用が期待されていますが、多くはまだ研究・開発段階にあり、実用化に向けた検証が続いています。

🏥 遺伝子診断・RNA解析のご相談

希少疾患の遺伝子診断やRNA統合解析、
遺伝カウンセリングについては
臨床遺伝専門医が在籍するミネルバクリニックにお気軽にご相談ください。

参考文献

  • [1] Van den Berge K, et al. RNA Sequencing Data: Hitchhiker’s Guide to Expression Analysis. Annual Review of Biomedical Data Science. [Annual Reviews]
  • [2] Stark R, et al. RNA sequencing: the teenage years. Nature Reviews Genetics. 2019. [PubMed 31341269]
  • [3] Applications of RNA-Seq. CD Genomics. [CD Genomics]
  • [4] RNA-Seq in Cancer Research: Driving Precision Medicine Forward. Lexogen. [Lexogen]
  • [5] RNA-Seq vs Microarrays: Compare technologies. Illumina. [Illumina]
  • [6] Rao MS, et al. Comparison of RNA-Seq and Microarray Gene Expression Platforms for the Toxicogenomic Evaluation of Liver From Short-Term Rat Toxicity Studies. Frontiers in Genetics. 2018. [Frontiers]
  • [9] Zhao S, et al. Comparison of RNA-Seq and Microarray in Transcriptome Profiling of Activated T Cells. PLOS ONE. [PLOS ONE]
  • [10] Comparison of RNA-Seq and microarray in the prediction of protein expression and survival prediction. PMC. [PMC10920353]
  • [11] RNA-Seq Workflow. Bio-Rad. [Bio-Rad]
  • [12] Experimental planning considerations. Harvard Chan Bioinformatics Core (HBC Training). [HBC Training]
  • [14] Experimental design considerations. Harvard Chan Bioinformatics Core (Intro to RNA-seq). [HBC Training]
  • [15] RNA-seq: experimental design. Harvard Chan Bioinformatics Core. [HBC Training PDF]
  • [16] Kukurba KR, Montgomery SB. RNA Sequencing and Analysis. PMC. [PMC4863231]
  • [17] Watchmaker DNA Library Prep Kits with Fragmentation. Watchmaker Genomics. [Watchmaker]
  • [18] Head SR, et al. Library construction for next-generation sequencing: Overviews and challenges. PMC. [PMC4351865]
  • [22] Stranded vs Non-Stranded RNA-Seq. GENEWIZ Blog. [GENEWIZ]
  • [23] Strand-Specific RNA-Seq: Accurate Transcriptomics. Revvity. [Revvity]
  • [26] Zhao S, et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. PMC. [PMC4559181]
  • [30] RNA-seq: Basic Bioinformatics Analysis. PMC. [PMC6168365]
  • [31] Bioinformatics Training at the Harvard Chan Bioinformatics Core. HBC Training. [HBC Training]
  • [35] RNA-Seq Bioinformatics: Pipeline Selection Guide. CD Genomics. [CD Genomics]
  • [37] Gene-level differential expression analysis with DESeq2. Harvard Chan Bioinformatics Core (Intro to DGE). [HBC Training]
  • [38] Gene-level differential expression analysis with DESeq2 (Wald test). Harvard Chan Bioinformatics Core (Intro to DGE). [HBC Training]
  • [39] DGE analysis using LRT in DESeq2. Harvard Chan Bioinformatics Core (Intro to DGE). [HBC Training]
  • [40] Stark R, et al. RNA sequencing: the teenage years. Nature Reviews Genetics (PubMed). [PubMed 31341269]
  • [42] Trending Applications in RNA Sequencing. Twist Bioscience. [Twist Bioscience]
  • [44] Hong M, et al. RNA sequencing: new technologies and applications in cancer research. PMC. [PMC7716291]
  • [45] Leveraging single-cell approaches in cancer precision medicine. PMC. [PMC7969443]
  • [46] RNA sequencing – the teenage years. RNA-Seq Blog. [RNA-Seq Blog]
  • [48] RNA sequencing: new technologies and applications in cancer. PMC. [PMC7716291]
  • [50] Byron SA, et al. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. PMC. [PMC7097555]
  • [51] Marco-Puche G, Lois S, et al. RNA-Seq Perspectives to Improve Clinical Diagnosis. Frontiers in Genetics. 2019. [PMC6861419]
  • [52] RNA-Seq Perspectives to Improve Clinical Diagnosis. PMC. [PMC6861419]
  • [54] RNA sequencing role and application in clinical diagnostic. PMC. [PMC8960934]

関連記事

用語解説トランスクリプトームとは細胞内の全RNA転写産物の集合。RNA-seqが読み取る対象を解説します。用語解説次世代シークエンサー(NGS)RNA-seqの読み取りを支える次世代シーケンシング技術を解説します。用語解説選択的スプライシング一つの遺伝子から複数のRNAが作られる仕組みを詳しく解説します。検査RNA統合シークエンス解析(RNA-ISE)DNA解析にRNA-seqを組み合わせ希少疾患の診断確率を高める検査です。用語解説VUS(意義不明変異)判断が難しい遺伝子変化の意味と、RNA解析による解釈の進展を解説。用語解説リキッドバイオプシー血液から腫瘍由来のDNA・RNAを調べる非侵襲的検査を解説します。

仲田洋美 医師(臨床遺伝専門医)

この記事の監修・執筆者:仲田 洋美

(臨床遺伝専門医/がん薬物療法専門医/総合内科専門医)

ミネルバクリニック院長。1995年に医師免許を取得後、 臨床遺伝学・内科学・腫瘍学を軸に診療を続けてきました。 のべ10万人以上のご家族の意思決定と向き合ってきた臨床遺伝専門医です。

出生前診断(NIPT・確定検査・遺伝カウンセリング)においては、 検査結果の数値そのものだけでなく、 「結果をどう受け止め、どう生きるか」までを医療の責任と捉え、 一貫した遺伝カウンセリングと医学的支援を行っています。

ハイティーンの時期にベルギーで過ごし、 日本人として異文化の中で生活した経験があります。 価値観や宗教観、医療への向き合い方が国や文化によって異なることを体感しました。 この経験は現在の診療においても、 「医学的に正しいこと」と「その人にとって受け止められること」の両立を考える姿勢の基盤となっています。

また、初めての妊娠・出産で一卵性双生児を妊娠し、 36週6日で一人を死産した経験があります。 その出来事は、妊娠・出産が女性の心身に与える影響の大きさ、 そして「トラウマ」となり得る体験の重みを深く考える契機となりました。 現在は、女性を妊娠・出産のトラウマから守る医療を使命の一つとし、 出生前診断や遺伝カウンセリングに取り組んでいます。

出生前診断は単なる検査ではなく、 家族の未来に関わる重要な意思決定です。 年齢や統計だけで判断するのではなく、 医学的根拠と心理的支援の両面から、 ご家族が後悔の少ない選択をできるよう伴走することを大切にしています。

日本人類遺伝学会認定 臨床遺伝専門医/日本内科学会認定 総合内科専門医/ 日本臨床腫瘍学会認定 がん薬物療法専門医。 2025年には APAC地域における出生前検査分野のリーダーとして国際的評価を受け、 複数の海外メディア・専門誌で特集掲載されました。

お電話での受付可能
診療時間
午前 10:00~14:00
(最終受付13:30)
午後 16:00~20:00
(最終受付19:30)
休診 火曜・水曜

休診日・不定休について

クレジットカードのご利用について

publicブログバナー
 
medicalブログバナー
 
NIPTトップページへ遷移