摘要:微卫星与癌症风险分类
肺癌是一种发病率和死亡率都很高的癌症。之前的研究更多关注了肺癌中单核苷酸的变异,而忽略了重复的DNA片段差异,即微卫星序列(MST)长度变化与肺癌之间的联系。最近的一篇Oncogene文章,就揭示出高深度、高精度微卫星基因分型可以帮助我们更加精确的进行肺癌风险分类,具有十分重要的理论研究和临床指导意义。
发表时间:2017年7月发表期刊:Oncogene影响因子:7.519
研究背景:
微卫星是一些包括短重复单位(1~6 bp)的串联DNA序列。最近的研究表明,微卫星在多种癌症的遗传发生的复杂过程中起了重要的作用。
本研究的目的是通过比较肺癌患者与正常人群生殖细胞外显子序列,发现可以用于肺癌风险分类评估的一些微卫星markers。
研究方法:
TCGA肺癌特异性MSI位点挖掘+347个位点的靶向捕获芯片定制+30个肺癌样本及89个对照样本的捕获测序+位点的基因分型及肺癌风险分类分析
研究内容:
本研究的流程如下(图1):
图1、位点识别与标记验证流程图
该项工作主要分为两个阶段,即(1)MST位点识别阶段和(2)标记验证阶段。阶段1:通过对来自TCGA中的488个非小细胞肺癌生殖细胞肿瘤样本和从1000 genomes中获得的399个非癌对照样本数据进行分析,发现癌症和对照样本中有显著基因型差异的119个MST位点。用相同方法发现其他癌症中的144个MST标记。阶段2:将263(119+144)个MST标记外加84个对照MST标记定制目标富集试剂盒,进行靶向捕获测序。对30份肺癌样本和89份非癌症对照样本的高深度测序(579x ± 315),发现在这263个MST标记中,有21(13+8)个MST标记具有明显的不同。
图2、通过对MST位点的统计可以高灵敏度区分肺癌样本(肺腺癌(LUAD,a)、肺鳞癌(LUSC,b)与非癌症样本
本研究分析了两种肺癌中具有的MST位点数及风险值。图2中蓝色条代表对照样本,橙色条代表肺癌样本。其中图2-a中,当样品中存在39%(经ROC分析得到的垂直的黑线)及其以上的LUAD特意MST位点时,则该样品认为“存在肺腺癌风险”。同样,图2-b中,当样品中存在37%及其以上的LUSC特异MST位点时,则该样品认为“存在肺鳞癌风险”。
最近研究表明,不同的癌症类型可以具有一些共同的致癌特征谱。本研究除了从肺癌及非癌症数据中发现13个可用于肺癌风险分类的MST位点之外,还从乳腺癌、卵巢癌、黑色素和髓母细胞瘤等癌症中筛选出144个MST位点,经过验证发现8个可以用于肺癌风险分类中。
表1、肺癌和非癌症样本精确分类的21个MST位点列表
图3、筛选出的特异性MST(13个肺癌特异性+8个其他癌症特异性)可以区分肺癌与非癌症样本
图3中蓝色条代表非癌症样本,红色条代表肺癌样本。其中图3-a表明,当具有肺癌表型样品中存在13个特异性MST位点中的61%(经ROC分析得到的垂直的黑线)及其以上时,则该样品被认为“存在肺癌风险”,其灵敏性达到0.90,特异性达到0.94。同样,图3-b中,当具有肺癌表型样品中存在21个特异性MST位点中的57%(经ROC分析得到的垂直的黑线)及其以上时,则该样品认为“存在肺癌风险”,其灵敏性达到0.93,特异性达到0.97。
图4、肺癌发生潜在机制示意图。
通过对13个MST位点深入研究发现,这13个MST都处于基因的Intron区域。之前的研究发现Intron区域的MST可以影响基因的选择性剪接和转录过程,通过对DAVID数据库中这13个基因聚类分析发现,它们选择性剪接和剪接产物都有显著富集情况。
对这13个基因与肺癌的关联分析发现,只有REL和ARID1B在以前的研究中与癌症有关。TCGA分析暗示了REL和ARID1B可能通过DNA损伤和染色质重塑机制导致肺癌的发生(图4)。
结论: