拷贝数变异( CNV ) 是个体基因组中以DNA片段丢失或获得的形式出现的结构变异现象,常见为一千碱基对(Kb)到几百万碱基对(Mb)的序列重复。CNV与其他遗传变异形式,如单核苷酸多态性(SNP)、插入缺失(InDel)等类似,共同构成了个体变异的重要来源。由于CNV通常会覆盖更多的基因组区域,可以导致拷贝数变异区(CNVR)中的基因缺失和重复,进而改变基因表达及个体的表型。近几年,随着最近高通量测序和基因芯片技术的应用,人们发现CNV与复杂性状息息相关。通过检测CNV和复杂性状的潜在数量性状基因座(QTL),可以加速家畜遗传改良,并且可以深入了解家畜驯化的进化机制以及它们对不同环境条件的适应。今天给大家推荐的一篇文章,是今年4月26日在线发表的CNV在家畜中的研究综述。
前言
CNV作为一种常见的遗传现象,是表型变异的重要来源。在两个不同样本中检测到的重叠CNV的并集称为拷贝数变异区(CNVR)。CNVR基因拷贝数的差异导致基因表达和表型变异的变化,这是由于基因的缺失、复制、倒置和易位改变了基因剂量和基因破坏效应。它是进化机制的源泉。如果CNV存在于蛋白质编码区,它就可能会改变蛋白质功能,而在调控区,它通常会改变基因表达水平。该综述将有助于理解CNV及其在家畜经济性状改良中的作用。
CNV的形成机制
非等位基因同源重组( NAHR )、非同源末端连接( NHEJ )、复制叉停滞和模板转换( FoSTeS )以及L1介导的反向转座是基因组产生CNV的重要机制。NAHR发生在减数分裂和有丝分裂中,这是由于非同源染色体之间相似序列的两个区域之间的重组。如果姐妹染色单体之间发生交叉互换,可能会增加DNA片段,从而导致染色体片段的重复、缺失和反转。NHEJ是细胞由于电离辐射或活性氧等引起的DNA双链断裂(DSBs)的一种修复机制。FoSTeS是一种基于DNA复制的机制,可以解释复杂的基因组重排和CNV。L1转座通过逆转录和整合发生CNV现象。
家畜CNV检测常用方法及研究进展
家畜CNV的检测通常可分两个阶段:第一阶段全基因组层面少量样本CNV初筛,以及第二阶段目标区域大样本CNV验证。
第一个阶段通常用到的方法包括:基于芯片技术的家畜商品化SNP基因分型芯片和比较基因组杂交( CGH )芯片,以及基于测序技术的全基因组重测序WGS和低深度WGS。常用的分析软件包括:基于隐马尔可夫模型( HMM )算法开发的PennCNV软件,基于不同的专有滑动窗口方法开发的CNVPartition软件,基于贝叶斯方法检测NGS数据多样本中CNV的cn.MOPS算法,利用不同HMM算法的QuantiSNP方法,一种CNV检测python包CNVFinder等。
第二个阶段通常用到的方法是基于目标区域设计探针检测CNV,通过第二阶段的验证,可以得到更小更精确的CNV区域,确保了第一阶段得到CNV数据的真是可信。
目前在家畜如牛、绵羊、山羊、猪和鸡中CNV研究,如下表1、2、3所示:
表1、牛CNVs的几种常见检测方法及进展
牛
Upadhyay等人利用牛Illumina BovineHD基因分型芯片,在牛中鉴定出9134个CNVs和923个CNVRs,长度为61.06 Mb,占牛常染色体的2.5 %。这些CNVRs被发现与影响产量性状、体尺和寄生虫抗性的数量性状基因座相关联。最近的研究报告显示,CNVs的进化速度比SNPs快2.5倍,有助于促进不同环境的更好适应。刘等人研究发现野牛和非洲taurine牛的CNV丰度高于欧洲taurine牛,明确了品种间的分化和种群历史(表1)。
表2、家畜CNV研究进展
羊
杨等人在绵羊中鉴定了619个CNV区域,覆盖197 Mb,相当于绵羊基因组的约6.9 %,并发现了几个重要的CNV重叠基因( bt3、PTGS1和PSPH ),它们涉及胎儿肌肉发育、前列腺素( PG )合成和骨颜色。还有研究从160个中国绵羊品种中鉴定出111个CNVR,覆盖羊基因组序列13.75 Mb。Fontanesi等人利用牛-羊385 K aCGH,参照牛基因组,鉴定了135个CNV区,覆盖羊基因组约10.5 Mb,并发现一CNVR与卷毛性状有关。同样的,Fontanesi等人还鉴定出127个山羊CNVRs,覆盖山羊基因组约11.47 Mb。绵羊和山羊Agouti基因座拷贝数的差异导致毛色的变异(表2)。
马
拷贝数变异体约占马基因组的1 - 3%,而且多位于基因内区域。Ghosh等人利用400K WGtiling oligo array在16个不同品种的马中鉴定出258个CNVR区,除chrY外,这些CNVR区占所有马基因组的1.3 %,还发现20%的鉴定CNVR位于基因间区。
表3、鸡CNVs的几种常见检测方法及进展
鸡
由于微染色体和大染色体的存在,鸡具有独特的基因组排列。Griffin等人首先用aCGH对鸡CNV进行研究,以建立种间基因组重排,结果显示涉及编码基因的CNV比非编码序列多。研究报告了鸡CNV的表型关联,包括pea-comb、晚羽、深棕色羽毛颜色和真皮色素沉着等(表3)
展望
近期CNV研究使得CNV图谱的构建成为可能,这反过来又有助于识别与经济重要性状相关的CNV。随着技术的进步和测序成本的降低,由于CNV显示出比SNP位点更多信息和复杂的遗传变异,研究人员现在正集中于CNV研究以检测遗传变异。目前对国内家畜全基因组CNV区的鉴定研究将改变遗传改良育种的观念,并进一步有助于揭开家畜分子育种的遗传秘密。
关于天昊
我们天昊生物在CNV检测服务方面经验丰富,优势明显。我们除了提供第一阶段基于测序技术的全基因组WGS和低深度重测序CNV检测服务外,还在第二阶段目标区域CNV检测服务方面深耕数年,潜心研发出针对不同CNV检测通量需求的AccuCopy®多重DNA拷贝数检测技术、CNVplex®高通量DNA拷贝数检测技术和CNVseq®超高通量DNA拷贝数等专利技术,并提供定量PCR检测拷贝数检测服务,期待成为您CNV检测的优质服务提供商!