IGV 2.11.0版本以上,自定义参考基因组的方法
软件版本
IGV版本:2.13.0
需求说明
对b37的参考基因组fasta文件做了一些修改,需要在IGV中浏览它,而且需要有Refseq的基因注释信息的Track。
信息说明
版本差异
IGV 2.11.0版本以上,是用一个JSON文件去指定和加载参考基因组的。
同时弃用了之前版本的.genome格式;通过选项Genomes -> Greate .genome File…的加载方式也取消了。
官方文档
格式说明 https://github.com/igvteam/igv/wiki/JSON-Genome-Format
属性说明 https://github.com/igvteam/igv.js/wiki/Reference-Genome
参数说明
IGV 2.11.0版本以上自定义参考基因组JSON文件,只有是fastaURL必填,其他都是可选。
所有URL都可以是在线资源或本地路径。
- id:该参考基因组的名称,可选。
就是在Genome下拉框里显示的基因组名称。如果需要使用BLAT功能的话,这里要填某些特定的genome ID。具体原因见IGV的BLAT
。 - name:描述信息,可选。就是在Genome下拉框里显示的基因组名称。
- fastaURL:参考基因组Fasta的URL,必填。可以是线上的,如UCSC等数据库中的fasta文件;也可以是本地的,如服务器上的fasta文件路径。
- indexURL:参考基因组Fasta的索引(.fai)文件,可选。但如果不提供.fai文件,会一次性加载整个fasta文件。
- cytobandURL:UCSC格式的cytoBand文件的URL,可选。是用于画染色体示意图的,可以在UCSC的goldenPath找到cytoBand.txt.gz,例如hg19的。UCSC上有cytoBand文件格式说明。
- tracks:加载参考基因组时,同时加载的一系列Tracks,例如默认的hg19基因组的RefSeq Gene描述信息,可选。IGV的Github有tracks格式说明。
加载方法
写完JSON文件后,在软件中加载自定义参考基因组的方法:Genomes -> Load Genome from File… -> 选择参考基因组json文件
JSON示例
示例的详细信息见:IGV reference genome (JSON)
1 | { |
IGV的BLAT
BLAT
Reference genome
从以上官方文档可以知道,IGV的BLAT功能,本质是将待查询序列形成一个命令,传到UCSC的网页服务进行分析。
所以如果命令中的某些参数不对,会导致BLAT功能失效,例如指定数据库的db参数。经过测试发现JSON文件的id就是命令中的db参数。
从Reference genome的Hosting genomes
这部分有个https://igv.org/genomes/genomes.tsv
,在里面可以看到IGV自带的各个基因组的JSON文件,以及genome ID(db参数/JSON文件的id取值)。
- 如果你只是想把IGV自带的参考基因组文件下载到本地,避免每次都要等加载;同时要保留BLAT功能。那么JSON文件的id取值必须要是genomes.tsv中的genome ID。
- 如果你的物种或者参考基因组不是IGV自带的,或者想调用本地服务器的BLAT功能,可以看这篇文章:如何在IGV上使用BLAT搜索非模式物种。
https://igv.org/genomes/genomes.tsv
文章更新记录
2025.03.26
参数说明
中id和name的说明有误,已更正。- 更新
JSON示例
为官方示例。 - 新增
IGV的BLAT
相关信息。