VEP安装

VEP安装过程

安装依赖

yum install -y unzip git bgzip tabix
yum install -y "perl(DBD::mysql)"
cpan -i Archive::Zip
cpan -i Devel::CheckLib
cpan -i DBI
cpan -i Module::Metadata
cpan -i LWP::Simple
cpan -i HTTP::Tiny
cpan -i autodie

安装VEP

官方安装说明

克隆项目

git clone https://github.com/Ensembl/ensembl-vep.git

下载API

注:–NO_HTSLIB选择不安装Bio::DB::HTS/htslib。
perl [VEP路径]/VEP/ensembl-vep/INSTALL.pl --NO_HTSLIB --NO_UPDATE --AUTO a --CACHEDIR [数据库路径]

下载数据库

注:人的注释数据库提供2种版本,通过–ASSEMBLY参数选择:GRCh37(hg19)和GRCh38(hg38)。
perl [VEP路径]/VEP/ensembl-vep/INSTALL.pl --NO_HTSLIB --NO_UPDATE --AUTO cf --ASSEMBLY GRCh37 --SPECIES homo_sapiens_merged --CACHEDIR [数据库路径]

下载插件

可选,某些数据库需要通过插件才能注释,如dbNSFP。
插件说明信息
注:
查看INSTALL.pl可以看到下载Plugin的其实是从raw.githubusercontent.com下载,但是这玩意很久之前就被墙了。
所以下载Plugin不是用官方说明提供的命令下载的,是从https://github.com/Ensembl/VEP_plugins下载项目压缩包,再解压到CACHEDIR/Plugins的。
VEP首次调用这些插件时,可能会报错误或警告,需要按提示信息下载数据库文件,或者安装依赖模块/软件即可。也可以调用前直接看*.pm文件中的DESCRIPTION下载依赖。
perl [VEP路径]/VEP/ensembl-vep/INSTALL.pl --NO_HTSLIB --NO_UPDATE --AUTO p --ASSEMBLY GRCh37 --SPECIES homo_sapiens_merged --PLUGINS dbNSFP,DisGeNET,ExAC,CADD --CACHEDIR [数据库路径]