一些VEP使用过程中的报错信息
Existing_variation全部为-
问题及警告信息
- 问题:VEP注释结果中Existing_variation全部为-。
- 警告信息: WARNING: 6742 : Use of uninitialized value in subtraction (-) at ***/ensembl-vep/modules/Bio/EnsEMBL/VEP/AnnotationSource/Cache/VariationTabix.pm line 184,
line 1.
问题定位
VariationTabix.pm是用于判断当前突变是否数据库中的已知突变,其中$existing->{start}和$existing->{end}未定义,是由于脚本中第172行调用tabix,open VARS, “$TABIX_BIN -f $file $region_string 2>&1 报错:[tabix] failed to load the index file。
查看tabix版本,是0.2.5,且帮助文档中没有csi格式index的说明。
所以可能是tabix版本太旧,无法识别vep数据库中的.csi格式index导致。
解决方法
- 简要过程
更新tabix,替换~/.bashrc中调用的tabix。 - 具体过程
tabix独立的安装包只更新到0.2.6,更新的版本只包含于HTSLIB。
一般生信服务器里都已经有装samtools,应该可以直接用samtools路径里的tabix。
这台服务器里已经安装的samtools的版本是1.12,路径下找到了htslib-1.12目录,但是里面没tabix,应该是没有make。以上命令make后,在samtools-1.12/bin能看到1.12版本的tabix和bgzip。1
2
3cd htslib-1.12
make
make install
修改~/.bashrc的tabix路径,然后source ~/.bashrc,重新开终端,再测试VEP。
测试
成功,Existing_variation列有rs编号和COSV编号
dbNSFP插件警告
警告信息
Use of uninitialized value $readme_file in concatenation (.) or string at ***/vep_data/Plugins/dbNSFP.pm line 279.
问题定位
dbNSFP.pm第276行,需要dbnsfp.*readme.txt在数据库dbNSFP4.3a_grch37.gz文件同一目录下。
解决方法
解压dbNSFP4.3a.zip,得到dbNSFP4.3a.readme.txt,软链接为dbNSFP4.3a_grch37.readme.txt,放在dbNSFP4.3a_grch37.gz文件同一目录下。