WGSベースのNIPT①:リードの密度とは?
WGSベースのNIPTにおけるリードの密度とは?
全ゲノム配列決定(WGS: whole genom sequence)に基づく
NIPT分析のアルゴリズムの理解のために,
まずNIPTの最終目標である
低胎児分画FF(fetal fraction)でも大きなゲノム領域の
胎児のコピー数異常をしっかり同定できることを考慮することが大事です.
「コピー数異常」は胎児のトリソミーおよびモノソミーのことを指します.,
「大きなゲノム領域」は染色体全体および
微細欠失(微小欠失)のような比較的小さなバリアントを含みます.
検査が低FFで感度が高い場合,高FFでは確実にうまくいくと考えられますよね?
すると,低FFでしっかり検査ができる,という目標は
解析アルゴリズムが克服しなければならない課題と
評価するための枠組みを提供してくれることになります.
例えば,2%FFでT21の場合,21番染色体はゲノムの1.7%であるため
0.017×0.02=0.00034
たった1/3,000のcfDNAフラグメントが胎児の21番染色体由来ということになります.
染色体 | 遺伝子数 | 塩基対数 |
---|---|---|
番号 | (個) | (Mb 1M=100万) |
1 | 2610 | 279 |
2 | 1748 | 251 |
3 | 1381 | 221 |
4 | 1024 | 197 |
5 | 1190 | 198 |
6 | 1394 | 176 |
7 | 1378 | 163 |
8 | 927 | 148 |
9 | 1076 | 140 |
10 | 983 | 143 |
11 | 1692 | 148 |
12 | 1268 | 142 |
13 | 496 | 118 |
14 | 1173 | 107 |
15 | 906 | 100 |
16 | 1032 | 104 |
17 | 1394 | 88 |
18 | 400 | 86 |
19 | 1592 | 72 |
20 | 710 | 66 |
21 | 337 | 45 |
22 | 701 | 48 |
X | 1098 | 163 |
Y | 78 | 51 |
染色体と塩基の数,遺伝子の数はこんな感じ.
すると,胎児の21番染色体の量の50%の変化(2本が3本になるので50%の量の変化ですよね)を
統計学的に高い信頼性をもって検出するには,
数千,いや,数十万というcfDNAフラグメントを
ランダムに測定しても十分ではない,ということになります.
WGSの最初の過程は,何百万ものcfDNA断片(“read”)が
参照ゲノムに結合するところから始まります.
市販のソフトは,何百万ものリードを,30億塩基のヒトの参照ゲノムに
あっという間にマッピングできてしまいます.
低FFでもT21サンプルをしっかり検出する,という目標を考えると,
もっとも重要な問題は,21番染色体として読み取られたリード数が
期待値よりも大きいかどうか,ということになりますよね.
すぐ考え付くやり方は,既知の21番染色体が二つあるサンプルで
マッピングされた読み取り値に対するchr21の読み取り値と比較すること,ですね.
たとえば,1番染色体が2本の胎児(正常な染色体数の胎児)の
1番染色体は2本分のリードナンバーであると仮定し,
chr 1にマッピングされたリードナンバーから
chr21にマッピングされたリードナンバーを推定することを考えてみましょう.
ここで問題なのは,
通常の染色体が2本の正常なサンプルでは,1番染色体のリードは数100万に対して
長さが10分の一未満の21番染色体は20万しかありません.
そこで.
WGSベースでcfDNAを計測して比較して分析するには
染色体の長さが関係なくなるように,たとえばリードの密度という
指標を使うのが一番良い,ということになるのです.
参考文献
[1] Fan HC, Blumenfeld YJ, Chitkara U, Hudgins L, Quake SR. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from matemal blood. Proc Natl Acad Sci USA 2008;105:16266-71.
[2] Chiu RWK, Chan KCA, Gao Y, Lau VYM, Zheng W, Leung TY, et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in matemal plasma. Proc Natl Acad Sci USA 2008;105:20458-63.
[3] Straver R, Sistermans EA, Holstege H, Visser A, Oudejans CBM, Reinders MJT. WISECONDOR: detection of fetal aberrations from shallow sequencing maternal plasma based on a within-sample comparison scheme. Nucleic Acids Res 2014;42:e31.
[4] Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 2009;10:R2S.
[5] Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 2009;25:1754-60.