VEP报错

一些VEP使用过程中的报错信息

Existing_variation全部为-

问题及警告信息

  • 问题:VEP注释结果中Existing_variation全部为-。
  • 警告信息: WARNING: 6742 : Use of uninitialized value in subtraction (-) at ***/ensembl-vep/modules/Bio/EnsEMBL/VEP/AnnotationSource/Cache/VariationTabix.pm line 184, line 1.

问题定位

VariationTabix.pm是用于判断当前突变是否数据库中的已知突变,其中$existing->{start}和$existing->{end}未定义,是由于脚本中第172行调用tabix,open VARS, “$TABIX_BIN -f $file $region_string 2>&1 报错:[tabix] failed to load the index file。
查看tabix版本,是0.2.5,且帮助文档中没有csi格式index的说明。
所以可能是tabix版本太旧,无法识别vep数据库中的.csi格式index导致。

解决方法

  • 简要过程
    更新tabix,替换~/.bashrc中调用的tabix。
  • 具体过程
    tabix独立的安装包只更新到0.2.6,更新的版本只包含于HTSLIB。
    一般生信服务器里都已经有装samtools,应该可以直接用samtools路径里的tabix。
    这台服务器里已经安装的samtools的版本是1.12,路径下找到了htslib-1.12目录,但是里面没tabix,应该是没有make。
    1
    2
    3
    cd htslib-1.12
    make
    make install
    以上命令make后,在samtools-1.12/bin能看到1.12版本的tabix和bgzip。
    修改~/.bashrc的tabix路径,然后source ~/.bashrc,重新开终端,再测试VEP。

测试

成功,Existing_variation列有rs编号和COSV编号

dbNSFP插件警告

警告信息

Use of uninitialized value $readme_file in concatenation (.) or string at ***/vep_data/Plugins/dbNSFP.pm line 279.

问题定位

dbNSFP.pm第276行,需要dbnsfp.*readme.txt在数据库dbNSFP4.3a_grch37.gz文件同一目录下。

解决方法

解压dbNSFP4.3a.zip,得到dbNSFP4.3a.readme.txt,软链接为dbNSFP4.3a_grch37.readme.txt,放在dbNSFP4.3a_grch37.gz文件同一目录下。