NBCI BLAST可能会出现序列名称带有“PATCHES XXX”,例如“Homo sapiens chromosome 1 genomic patch of type NOVEL, GRCh38.p14 PATCHES HSCHR1_12_CTG3”。UCSC In-Silico PCR会出现类似“chr1_jh636052_fix”的序列名称。
NCBI解释
Introduction to Patches - Genome Reference Consortium (nih.gov)
FIX patches
Fix patches represent changes to existing assembly sequences. These are generally error corrections (addressed by approaches such as base changes, component replacements/updates, switch point updates or tiling path changes) or assembly improvements, such as the extension of sequence into gaps. A fix patch scaffold represents a preview of what the assembly will look like at the next major (coordinate changing) release. When the next major release occurs, the accessions for the fix patch scaffolds will be deprecated and the changes will be found in the chromosomes.
NOVEL patches
Novel patches represent the addition of new alternate loci to the assembly. These are alternate sequence representations of sequence found on the chromosomes. When the next major release occurs, the accessions for the novel patch scaffolds will persist, and the scaffolds will be known as alternate loci. At that time, the scaffolds will move from the PATCHES assembly unit to the relevant alternate loci assembly unit.
UCSC解释
hg19 Human: Reference Assembly Fix Patch Sequence Alignments (chr1_jh636052_fix) (ucsc.edu)
This track shows alignments of fix patch sequences to main chromosome sequences in the reference genome assembly. When errors are corrected in the reference genome assembly, the Genome Reference Consortium (GRC) adds fix patch sequences containing the corrected regions. This strikes a balance between providing the most complete and correct genome sequence, while maintaining stable chromosome coordinates for the original assembly sequences.
Fix patches are often associated with incident reports displayed in the GRC Incidents track.
DeepSeek-R1解释
Genome Reference Consortium (GRC) 的 Patches 详解
GRC 负责维护和更新参考基因组(如人类基因组),以反映科学界对基因组结构的最新理解。由于技术进步或新发现,参考基因组需要定期修正和补充。为此,GRC 引入了两种类型的补丁(Patches):FIX patches 和 NOVEL patches。以下是它们的详细解释:
1. FIX Patches(修正补丁)
定义与作用
- FIX patches 是对现有染色体序列的直接修正或改进,目的是修复错误或填补已知缺口。
- 修正类型包括:
- 碱基错误纠正(如测序错误的单碱基修改)。
- 组件替换/更新(替换不准确的序列片段)。
- 路径调整(优化序列的拼接方式)。
- 填补缺口(通过新数据延伸原有序列,减少未测序区域)。
特点与生命周期
- FIX patches 以独立支架(scaffold)形式发布,作为临时预览,展示下次主版本(major release)的预期变更。
- 主版本发布后:
- FIX patches 的变更会整合到染色体主序列中,其原始 accession 编号(如
KI270752.1
)会被弃用。 - 用户需切换到新版染色体坐标,旧补丁不再独立存在。
- FIX patches 的变更会整合到染色体主序列中,其原始 accession 编号(如
示例
若原染色体 2 号某区域存在缺口,FIX patch 可能新增一段序列填补该缺口。下次主版本中,这段序列将直接合并到染色体 2,原补丁编号失效。
2. NOVEL Patches(新异源补丁)
定义与作用
- NOVEL patches 代表染色体某些区域的替代序列(alternate loci),反映群体中的遗传多样性或复杂区域的不同单倍型。
- 例如:人类主要组织相容性复合体(MHC)区域高度多态,NOVEL patches 可提供不同单倍型的序列版本。
特点与生命周期
- NOVEL patches 以独立支架形式发布,但不会整合到主染色体中,而是作为替代位点保留。
- 主版本发布后:
- 其 accession 编号(如
KI270757.1
)会保留,但分类从“补丁”调整为“替代位点”(alternate loci)。 - 移至专门的“替代位点集合”(如
ALT_REF_LOCI_1
),供研究者按需使用。
- 其 accession 编号(如
示例
若染色体 17 号某区域存在两种常见结构变异,NOVEL patch 可为每种变异提供独立序列。主版本发布后,这些序列作为替代位点与主染色体并存。
核心区别
特征 | FIX Patches | NOVEL Patches |
---|---|---|
目的 | 修正错误、填补缺口 | 提供替代序列(遗传多样性) |
主版本后状态 | 整合到染色体,原编号失效 | 保留为替代位点,编号不变 |
数据归属 | 最终归属主序列 | 长期独立存在,补充主序列 |
为何需要 Patches?
- 持续改进:在不破坏现有坐标系统的前提下(非主版本期间),及时修正错误或添加新数据。
- 兼容性:研究者可提前预览变更,同时保持旧版本数据的稳定性。
- 多样性管理:通过替代位点支持复杂区域的遗传变异研究(如免疫相关基因)。
总结
FIX 和 NOVEL patches 是 GRC 维护参考基因组的核心工具,前者确保准确性,后者反映多样性。两者协同工作,使参考基因组成为动态更新的资源,既稳定又适应科学进步。用户需注意主版本更新时的数据迁移规则,以正确引用最新或替代序列。
总结
GRC会不定期以major或minor的形式对参考基因组进行更新。major表示基因组原序列碱基或坐标有相对较大的改动,会提供新的编号,如GRCh37、GRCh38等;minor则是patch的形式,如GRCh38.p13等,其基因组原序列无变动,主要是新增了fix patch和noval patch两种,其中fix patch是对原基因组序列的更新和修正,其内容会在下一次major中并入,noval patch则是新的单倍体型。关于人类基因组的一些说明