基因组(Genome)是生物体所有遗传物质的总和,包括DNA或RNA(病毒)。它涵盖了编码DNA、非编码DNA、线粒体DNA和叶绿体DNA等组成部分。研究基因组的科学领域被称为基因组学。
同源染色体(Homologous Chromosomes)是在二倍体生物细胞中形态和结构基本相同的染色体,它们在减数第一次的四分体时期彼此联会。子代的一对染色体中,一条来自母方,另一条来自父方。
参考基因组(Reference Genome)是一个数字化的核酸序列数据库,由科学家和研究单位协作组装、维护和更新。它作为一个理想化的个体的全基因组序列的典型代表或案例,用于分子遗传学和个人基因组学研究等基础性研究。
人类基因组由23对染色体和约60亿个碱基组成,以两个拷贝的形式存在,分别来自父母。其版本名有多个,如hg19、hg38等。
参考基因组的实体通常为单倍体的文本文件(如.fasta格式),含有染色体号和核酸序列,并可包含一系列的配套文件。
人类基因组计划(Human Genome Project, HGP)是科学探索工程的杰作,旨在测定并解读人类基因组的核苷酸序列。其最终目的是为了破译人类遗传信息。
全基因组测序(Whole Genome Sequencing, WGS)是利用高通量测序平台对生物个体或的全基因组进行测序。
高通量测序(High-Throughput Sequencing, HTS)是新一代测序技术,对大量核酸分子进行序列测定。
这两项技术共同推动了生物信息学和分子遗传学的发展,为疾病诊断和治疗提供了有力的工具。
基因结构在真核生物中大致分为编码区、前导区、尾部区和调控区等区域。
外显子组(Exome)指真核生物基因中外显子的总和,与全基因组测序相比,外显子组测序更为经济高效。
全外显子组测序(Whole Exome Sequencing, WES)是针对外显子区域的测序方法。
读段(Read)是高精量或二代测序平台产生的序列读取信息。
变异(Variation)指基因组或外显子组上碱基序列的不同。
单核苷酸多态性(SNP)指基因组水平上单个核苷酸的变异,它在基因组研究中具有一定比例的发生和分布规律。
"二态性"(biallelic)指两种状态之间的变异。
SNV(Single Nucleotide Variant)指单个碱基的突变。
新发突变(De novo Mutations)指父母本身没有的突变,通常在卵发育过程中产生。
体细胞突变(Somatic mutation)是体细胞在生长发育或环境因素影响下后天获得的突变。
插入缺失(Insertion/Deletion, InDel)指基因组中小片段的插入或缺失。
结构变异(SV)指基因组上大长度的序列变化和位置关系变化。
拷贝数变异(CNV)是由基因组发生重排导致的一种染色体结构变异,可能引发各种人类疾病。