bamdst的旧版本(21年9月,软件后来有更新,但版本号没变),统计的[Total] Raw Reads (All Reads)错误,导致某些情况下的比对率偏低,On Target Rate也会受影响。
软件版本
- bamdst 1.0.9
问题定位
- bamdst把primary + secondary当作分母去算比对率了,Reads和Base都是。假如1条Reads在参考基因组上Multiple Mapping到了2个位置,分母是算+2的。导致当Multiple Mapping的Reads较多时,这个软件算出来的比对率(Read和Base)会偏低。
- 一般比对率,按Read算,是=Mapped Reads / (Clean R1 Reads + Clean R2 Reads) * 100
- 这个样本是:4688627 / (2344520 + 2344520)* 100 = 99.99%。samtools flagstats算出的比对率就是99.99%。
- 以上错误的比对率结果是调用21年9月安装的bamdst得到的。2019年12月有个Issue有提到这个问题:Raw Reads (All reads) are a bit off。
- 以下是2023年11月重新安装的bamdst,算出来的Raw Reads是对的。
- 但是这两个的软件版本都是1.0.9,Github上也没有Change Log,那就没法知道具体是什么时候修改成正确的了。
解决方案
- 如果bamdst太旧,建议重新从Github下载再编译安装bamdst。
- 或者直接用samtools flagstats提取比对率。