WGSベースのNIPT⑥:Zスコアとは?
Zスコアとは?
次は,Zスコアについてお話ししましょう.
前述のように観察されたビン密度および
予想される二原子密度を決定する以外に,
異数性,すなわち試料の大きなコホートにわたる
予想される密度と観察される密度の間の平均差を評価するためには,
1つの正式で比較的簡単な計算が必要となります.
NIPTにおける他のほとんどの計算と同様に,
この期待偏差(σ0-E)も,
例えば標準偏差ではなくIQR
または絶対偏差の中央値を用いることによって,
外れ値に対してもしっかりとできるはずです.
なぜなら,高FF異数体サンプルは外れ値として現れ,
観察された密度は二元的期待値をはるかに超えるからです.
z = (µobs ―µexp)/ σμO-E
z-スコアがゼロに近い場合,
サンプルが二項仮説から逸脱しないことが示唆されます.
対照的に,zスコアの大きさが大きいサンプルは
異数性と一致します.
zスコアが非常に正である場合はトリソミー,
zスコアが非常に負である場合はモノソミー,というふうに.
正倍数性と異数性の間で選ばれた閾値,
すなわちカットオフは,
検査の感度と特異性に大きな影響を与えます.
一般に,低い閾値は高い感度を達成するために特異性を犠牲にするのですが,
高い閾値は感度よりも特異性を優先します.
真に二相性のサンプルのzスコアが正規分布していると仮定すると,
zスコアの閾値3は,期待される最低特異度99.9%に相当します.
(すなわち,サンプル1000個当たり1個の偽陽性があるということです).
サンプル特異的FFでも,正倍対と異数体のカットオフを
しっかり作成することにより
ハイレベルを実現することができます.
異数体サンプルのµobsがFFでスキャンされることを思い出しましょう.
たとえば,高FFトリソミーSampleはµobsとµexpの間に
非常に大きな偏差がありますので,
非常に高いzスコアをもつはずとなります.
したがって,もしSamp leが既知のFF値を持ち,
それがトリソミーでz ~20となるのなら,
z-scoreのカットオフ値を3とすることは賢明ではありません.
しきい値は例えば5まで上げることができ,
それは
(1)2倍体ダイソミーサンプルの可能性を切り捨てることよって特異度を押し上げ,(2)異数性サンプルのzスコアがカットオフ値を大きく超えるまでは
感度に対する下向きの影響を実質的には持たない
ということになります.
参考文献
[1] Sehnert AJ, Rhees B, Comstock D, de Feo E, Heilek G, Burke J, et al. Optimal detection of fetal chromosomal
abnormalities by massively parallel DNA sequencing of cell-free fetal DNA from maternal blood. Clin Chem 2011;57:1042-9.
[2] Zhao C, Tynan J, Ehrich M, Hannum G, McCullough R, Saldivar J-S, et al. Detection of fetal subchromosomal abnormalities by sequencing circulating cell-free DNA from maternal plasma. Clin Chem 2015; 61:608-16.