Pacbio三代数据SV分析

(未解决) Pacbio CCS(HIFI)数据,IGV能看到的Deletion,用三代SV软件call不出

需求说明

输入文件是一个Pacbio CCS(HIFI)数据,是用pbmm2 1.5.0 (commit v1.5.0-1-gadeb061)比对得到的Bam文件。
需要确认一个9.5k Deletion的情况,已在IGV明确找到softclip fragment比对位置。

分析过程

pbsv

因为是Pacbio的数据,所以一开始是用pbsv分析。但是出现以下问题:

pbmm2特定版本结果只与pbsv特定版本兼容?

从bioconda找到不同版本的pbsv
测试了2.3.0、2.4.0、2.4.1、2.6.0、2.6.2、2.9.0,不同版本的pbsv discover结果.svsig.gz文件都有差别。
但是只在2.4.1、2.6.0、2.6.2的pbsv call的TRACE级别Log中有看见一些cluster。所以pbmm2 1.5.0应该对应2.4.1、2.6.0、2.6.2版本的pbsv?
后续接着用2.6.2版本的pbsv分析。

pbsv call不出

.svsig.gz中能看到支持该Deletion的记录,但最终call的结果里没有该Deletion。
pbsv call的TRACE级别Log文件中能看到:

  • 有警告信息:Could not find parse function for type: s。但是.svsig.gz文件不提供文件格式说明,没法确认是不是这个警告导致没结果。
  • 看见的cluster都是Insertion的,而且都因为failed coverage被过滤掉。该Deletion连cluster都没有。

Sniffles2

pbsv不行,于是试了下Sniffles2。

Sniffles 2 可能有bug

先用的Sniffles 2,发现github上有人说Sniffles2可能会漏检大片段缺失:
https://github.com/fritzsedlazeck/Sniffles/issues/390
https://github.com/fritzsedlazeck/Sniffles/issues/367
原因:未知。
可能的解决方法:(1)用sniffles 1;(2)用cuteSV。

Sniffles 1 报错

No MD string detected! Check bam file! Otherwise generate using e.g. samtools.
https://github.com/fritzsedlazeck/Sniffles/issues/149
https://github.com/fritzsedlazeck/Sniffles/issues/58
https://github.com/lh3/minimap2/issues/142
原因:minimap2旧版本不输出XS标签。
解决方法:(1)用samtools calmd给Bam文件添加XS标签;(2)更新minimap2并在比对时添加–MD参数。

Sniffles 1、Sniffles 2 都call不出

Sniffles 2.0.7用–no-qc参数只找到一些Insertion的SV。
Sniffles 1.0.12用–ccs_reads –cs_string –min_support 1 –cluster_support 1也是只找到与Sniffles 2相同的Insertion。

cuteSV

cuteSV call不出

使用的版本是cuteSV 2.0.2。
github文档的建议,用了For PacBio CCS(HIFI) data和For force calling两种参数组合都只call出两个Insertion。