英文题目: Complementing 16S rRNA Gene Amplicon Sequencing with Total Bacterial Load To Infer Absolute Species Concentrations in the Vaginal Microbiome
中文题目:联合16S扩增子测序与总细菌负荷,推断生殖道菌群物种的绝对丰度。
期刊名:mSystems
影响因子:6.519
发表时间:2020年
发表单位:华盛顿大学弗雷德哈钦森癌症研究中心疫苗和传染病部
研究摘要:
尽管16S扩增子测序可定量分析细菌类群的相对丰度,但样品之间总细菌负荷的差异限制了其反映单个细菌物种绝对丰度的能力。qPCR可以定量单个物种的绝对丰度,但是针对存在于不同样品中的每种细菌开发一套qPCR检测方法是不切实际的。我们想确定使用总细菌负荷和相对丰度相结合的方法来推断细菌绝对丰度是否准确可靠。我们分析了来自20名有细菌性生殖道病史的女性的1320份样本,这些女性在60天内每天自行收集生殖道拭子样本。我们通过获取物种相对丰度(通过16S扩增子测序获得)和总细菌载量(通过细菌16S通用引物 qPCR获得)的乘积来推断每个细菌的绝对丰度。结果发现Log 10转化得到的绝对丰度与七种特定细菌的特异引物靶向qPCR得到的绝对丰度相关。>0.5-log10的误差中有92%是由相对丰度低于10%的物种引起的,许多误差发生在细菌从早期增殖或后期收缩到低丰度的过程中。当一个物种的相对丰度大于10%时,基于两种技术联合推断的绝对丰度是可以代替靶向qPCR的检测结果。但是,靶向qPCR更适合检测相对丰度低的细菌,并且对于表征单个物种的生长和衰变动力学靶向qPCR是第一选择。
研究意义:
微生物组研究主要使用16S rRNA扩增子测序来评估细菌类群的相对丰度。但是16S rRNA扩增子测序不能准确反映物种的绝对丰度。本研究试图确定通过细菌16S通用引物 qPCR获得总细菌载量和16S rRNA扩增子测序获得的物种相对丰度的两者乘积是否可以准确地代替特异性qPCR所检测的单个物种的绝对丰度。总体而言,基于两种技术联合推断的特定物种的绝对丰度在某种程度上是物种特异性qPCR检测结果的合理替代,尤其是当细菌以较高的相对丰度存在时。这种方法提供了一个机会来评估细菌物种的绝对丰度,而无需为每个特定物种开发单独的qPCR分析方法。
研究背景:
对于大多数传染病,单一病原体的绝对丰度通常是疾病严重程度和治疗反应的最具体标志。相比之下,细菌群落的研究通常依赖于基于16S rRNA基因扩增的NGS测序来评估细菌的相对数量,而非绝对数量。在机制层面上,细菌和细菌基因产物的特定组合被认为在许多微生物相关疾病的发病机制中起着重要作用,这种表征微生物群的方法很有价值。但是,与这些微生物分类群的相对丰度相比,单个细菌分类群的绝对丰度可能是疾病风险的更好预测指标。使用qPCR定量单个物种的绝对丰度是很费时的,不但要求使用已知浓度的内标DNA生成标准曲线,而且价格昂贵,并且只能在专门实验室中使用;此外,每种qPCR分析都需要大量开发和验证成本,因此,qPCR不适合检测群落中的所有物种的绝对丰度。此外,选择最适合分析的物种可能反映出研究者的偏向性。
从NGS数据推断多种细菌物种绝对丰度的方法未来在微生物组研究领域非常有用,包括生殖道微生物组的研究。扩增子测序已用于帮助确定细菌性生殖道疾病,其它性传播疾病以及早产风险增加的条件。然而,即使在一天的过程中,个体之间和个体内部的总细菌负荷也可能随着时间的推移而发生显著变化,因此,相对丰度无法准确代表绝对丰度,因此,最近肠道微生物组研究结果显示,相对丰度可能会给出虚假的疾病关联结果,而这些虚假的疾病关联实际上可能是由不同个体间总微生物负荷差异所引起的。
在这里,我们证明了将相对丰度数据乘以通过qPCR测得的总细菌负荷所得到的推断值,可以为每个样品中特定物种的细绝对丰度提供有用的参考。在这里,我们通过与物种靶向qPCR测定的阴道微生物组中7个关键物种的绝对丰度相比较来验证上述推断的绝对丰度估计值的准确性。我们发现,虽然推断的绝对丰度估计值对于大多数样品都是准确的,但当物种的相对丰度较低时,这种联合分析得到的推断的绝对丰度估计值很容易出错,并且可能在从低细菌丰度增殖时期和后期收缩到低丰度的过程中可能会歪曲单个物种的动力学。
研究结果:
纵向剖面的比较突出了相对丰度和绝对丰度之间的差异
在研究过程中,我们比较了同一样本的绝对浓度和相对丰度。图1a和b显示了单个参与者的细菌动力学,所显示的个体经历了细菌谱的动态变化,并在低多样性状态到高多样性状态之间发生了显著变化。
单一物种当用qPCR检测时,结果变化和扩增子测序检测结果变化不同,例如,对于图1中所示的参与者,A. vaginae的绝对丰度在第17天(h 415)突然增加,但是相对丰度直到第28天(h 671),才显示出突然增加。从第0天到第7天(h 168),受试者接受甲硝唑治疗细菌性阴道炎(BV): qPCR显示BV相关物种的绝对丰度呈指数下降;然而,扩增子测序则显示受试者经过治疗更迅速地向Lactobacillus iners转化。
另外,扩增子测序的相对丰度也无法捕获细菌的低水平定植,例如扩增子测序在第6至11天(h 150和261)不能发现Gardnerella vaginalis的定殖,而靶向qPCR则可以发现Gardnerella vaginalis的定殖。如前所述,高多样性状态通常与Gardnerella vaginalis, Atopobium vaginae, BVAB2, Megasphaera的高绝对丰度同时出现,这些都与细菌性阴道炎(BV)相关。
这些观察结果强调靶向qPCR为测量单个物种的动力学提供了更精准的评价,而扩增子测序是估计高多样性群落中细菌多样性的最佳方法。
图1 参与者生殖道生态位的复杂细菌动力学。对一名18岁女性每日采集的生殖道拭子样本进行分析:(a)针对七个特定物种的定向qPCR;(b)16S扩增子测序;(c)相对丰度超过1%的物种的绝对丰度推断值。方框表示已使用qPCR对特定菌进行了检测。推断的绝对丰度比相对丰度更接近靶向qPCR检测结果,并且可以预测无法进行靶向qPCR检测的物种的绝对丰度。
噪声检测分析表明采样方差对观察到的动态影响有限
接下来,我们试图评估观察到的qPCR值变化是否是采样或实验室可变性相关的噪声造成的结果,而不是由于丰度的真实变化所致。我们从绝对丰度的纵向数据中估计采样噪声。该技术将数据分解为两个部分:信号(样品中的真实丰度)和噪声,噪声来源可能是生物学的,技术的,采样的或这些的任意组合。在图3a和b中,我们展示了两个参与者的L.iners和BVAB2的纵剖面,我们发现检测到的信号(红色显示)与qPCR测量数据(黑色显示)非常接近,只有轻微的偏差,在所有其他参与者以及每个物种中都发现了相同的趋势。在图3c和d中,我们展示了检测到的L.iners和BVAB2的噪声在所有参与者中的分布,检测到的噪声平均值为零,方差很小,在细菌总数和所有其他物种中也发现了同样的情况。
在我们的研究中,观察到物种发生了高达8.2 log 10的变化,细菌总负荷在60天内可以改变4.9 log10,这些观察到的变化比我们估计的噪声要大得多,这表明捕捉到的动力学很可能是生物的,而不是噪声。
图3 噪声检测分析表明采样方差很小,给出了两个纵剖面的信号和噪声分解,来自靶向qPCR分析的测量用黑色表示,由25%低通滤波器检测到的信号用红色表示,用于单独参与者中的L.iners(a)和BVAB2(b)。在这两种情况下,信号与绝对丰度测量值非常匹配。
推断的绝对丰度是qPCR测量的绝对丰度的预测值
对于每个物种的绝对丰度,我们通过将细菌总负荷乘以扩增子测序得到的相对丰度来推断,如方程式1所示。然后,我们将推断值与七个关键物种的靶向qPCR所测量的绝对丰度进行了比较。对于每个物种,在大多数样品中推断出的细菌绝对丰度与qPCR所测量的绝对丰度很类似(图1c;图2中的虚线)。在许多情况下,对于大多数物种,没有明显的极端不一致(图2a)。然而,对于某些物种,如Megasphaera和BVAB2,推断的细菌绝对丰度始终高于qPCR所测量的绝对丰度一个数量级(图2b)。在一组样本中,对于所有物种,推断的细菌绝对丰度为零,而qPCR水平为正,导致推断的细菌绝对丰度和qPCR所测量的绝对丰度之间的严重不一致:这通常在低绝对丰度情况下出现(图2)。
其中IC是推断的绝对丰度,RA是相对丰度,TBL是细菌总负荷。
图2 由于细菌总负荷的变化,相对丰度估计可能会歪曲实际丰度。两名受试者中两种不同物种的物种特异性特征的示例:crispatus,受试者06(a)和Megasphaera,受试者17(b)。垂直条显示相对丰度(%,左y轴),实线表示qPCR测量的绝对丰度,灰色线表示细菌总负荷,虚线表示推断丰度(右y轴)。黑色虚线表示qPCR数据的检测阈值。箭头表示相对丰度变化与绝对丰度变化不一致的时间点,这通常发生在细菌负荷急剧变化或相对丰度较低时。
我们比较了相对丰度和qPCR所测量的绝对丰度之间的相关系数(图4a),还有就是推断的绝对丰度和qPCR所测量的绝对丰度之间的相关系数(图4b),结果发现与相对丰度相比,推断的绝对丰度与qPCR所测量的绝对丰度的相关性略有改善。
图4 与相对丰度相比,推断的绝对丰度与qPCR所测量的绝对丰度的相关性略有改善。(a)绝对浓度与相对丰度的散点图。(b)绝对浓度与推断的绝对丰度的散点图。
但是我们注意到物种间的相关性,在qPCR所测量的绝对丰度和推断的绝对丰度之间的相关系数中,Megasphaera 和BVAB2的相关系数最强,其次是L. crispatus, A. vaginae和 L. jensenii。 G. vaginalis 和 L. iners的相关性最弱 (表1)。
表1单一物种的qPCR所测量的绝对丰度与相对丰度的相关系数,以及qPCR所测量的绝对丰度和推断浓度之间的相关系数 。
我们定义推断的绝对丰度为IC,如等式2所示。虽然推断的绝对丰度误差(IC error)的范围很大(图5a),但平均推断的绝对丰度误差和标准偏差较低。此外,在四分位范围内(IQR)的样本中,大多数物种的推断的绝对丰度误差中位数接近于零,表明推断的绝对丰度误差很小(图5a)。但是,对于BVAB2和Megasphaera,推断的绝对丰度误差的四分位范围虽然很窄,但绝对丰度误差都小于0,这意味着推断的绝对丰度高估了其真实绝对丰度。使用推断的绝对丰度,还有一种可能是低估了G. vaginalis的绝对丰度(图5a)。
其中IC是推断的绝对丰度,AC是绝对丰度。
图5 与绝对丰度相比,较低的细菌相对丰度是推断的绝对丰度误差的主要预测因子。 (a)显示推断的绝对丰度误差的箱式图,其中推断的绝对丰度为零,表明总体上误差低;(b)相对丰度组的大于0.5的IC误差的条形图。黑色柱子包括双重负数样本(推断的绝对丰度为零和qPCR所测量的绝对丰度为阈值):大于0.5的IC误差中93%由相对丰度低于10%的物种引起(85%是由相对丰度低于1%的物种引起的),灰色柱子是删除了双重负数样本:在大于0.5的IC误差中仅有85%是由相对丰度低于10%的物种引起的(66%是由相对丰度低于1%的物种引起的);(c) 箱式图显示未确认和确认的总细菌载量被低估的样品(通过16S通用引物qPCR测得的总细菌载量低于通过靶向qPCR测得的所有七个菌种绝对丰度的总和的样本)的IC误差。推断丰度为零的数据点被删除。总细菌负荷被低估的样品比其它样品高估了单一物种的丰度。
低相对丰度是推断的绝对丰度误差的主要来源
结果显示,特异性细菌相对丰度越低,推断的绝对丰度误差范围越高(图4b)。因此,在大于0.5的IC(推断的绝对丰度)误差中,93%是由相对丰度低于10%的物种引起的,85%是由相对丰度低于1%的物种引起的。这些IC误差中有许多由这些双重负数样品(推断的绝对丰度为零且qPCR所测量的绝对丰度为阈值的样品)引起的,从分析中删除这些样品后,在大于0.5的IC误差中,仅有85%是由相对丰度低于10%的物种引起的,仅有66%是由相对丰度低于1%的物种引起的(图5b)。
当qPCR检测的绝对丰度值等于或低于检测阈值时,我们将假阳性样本定义为非零推断丰度值;当qPCR检测的绝对丰度值高于检测阈值时,我们将假阴性样本定义为零推断丰度值。假阴性(23.6%)比假阳性(3.17%)更为常见,说明靶向qPCR比NGS更灵敏。不同物种间假阴性的发生率并不相同,其中G. vaginalis的假阴性率最高,其次是L. inners 和A. vaginae。一些物种的假阴性率较高,因为它们通常出现在中等浓度下,接近相对丰度误差阈值。假阴性样本的qPCR中位数为3.92log10(每个拭子16S rRNA基因拷贝数)(IQR,2.88到4.82;范围,1.97到7.84),再次表明IC误差通常发生在较低的细菌负荷下。
通过16S通用引物qPCR测得的总细菌载量通常低于通过靶向qPCR测得的所有七个菌种绝对丰度的总和,这些总细菌负荷被低估的样品比其它样品高估了单一物种的丰度(图5c)。例如从这些细菌总负荷被低估的样本中得出的非零推断丰度为0.171 log10(每个拭子16S rRNA基因拷贝数),平均IC误差(IQR,-0.138至0.447;范围为–7.31至2.66),而其它样本的非零推断丰度则为-0.368 log 10(每个拭子16S rRNA基因拷贝数),平均IC误差(IQR,为-0.638至-0.143;范围为-6.54至1.42)。
L. crispatus的假阳性率最高。 所有样本中假阳性的平均相对丰度非常低,为0.06%(IQR,0.04至0.11%;范围,0.0007至36.8%)。
推断的绝对丰度与样品多样性或测序深度无关
根据香农多样性指数(图6a),样品多样性不影响推断的绝对丰度(IC)误差。此外,观察到测序深度不影响推断的绝对丰度(IC)误差(图6b),因此总的来说,低细菌相对丰度是推断的绝对丰度(IC)误差的主要来源,而与多样性或测序深度无关(图6a和b)。在所有原始物种计数中均观察到> 0.5的IC误差,但最大的IC误差(> 2)几乎完全与100以下的原始物种计数相关(图6c)。
图6 样品多样性,测序深度和物种计数不影响推断的绝对丰度(IC)误差。(a)相对丰度与香农多样性指数。 较高的IC误差主要发生在较低的相对丰度上,但在低和高多样性样本中均如此。(b)相对丰度与测序深度。 较高的IC误差主要发生在较低的相对丰度下,但在测序深度的各个级别上均如此。(c)测序深度与物种数量。尽管在所有物种计数中观察到的IC误差约为0.5,但在物种数量低于100时发生了很高的IC误差。
推断的绝对丰度估计值可以预测单个物种细菌负荷的大多数时间变化
接下来,我们通过确定一天中细菌水平的变化来检查推断的绝对丰度是否是评估单个物种动力学的有用工具。相对丰度的变化率与qPCR检测的绝对丰度的变化率之间的相关性很弱,例如在23.2%的时间里,我们观察到相对丰度的变化与绝对丰度的变化相反(见图7a的左上和右下象限),这种类型的错误通常发生在最丰富的物种(e.g., L. crispatus)和较稀有的物种(例如BVAB2)。
推断的绝对丰度的变化率与qPCR检测的绝对丰度的变化率则显示出更好的相关性,例如推断的绝对丰度将rIC误差(推断的绝对丰度引起的变化率误差)降低了50%以上(从23.2降低到7.97%,图7b)。
图7 推断的绝对丰度允许对两个连续样品之间的动力学变化进行某种程度的准确推断。(a)qPCR检测的绝对丰度变化率与相对丰度变化率的散点图显示差的相关性。观察到的相对丰度变化的很大一部分与绝对丰度的变化方向相反(左上和右下误差象限标有百分比)。(b)qPCR检测的绝对丰度变化率与推断的绝对丰度变化率的散点图显示出改善的相关性,百分比对应于落在误差象限内且相对丰度较低的数据点。
图8 显示了A. vaginae绝对丰度水平和样本间变化的典型轮廓,发现了数据中最常见的两种类型的rIC误差:第一个是当两个连续点之一推断的绝对丰度为零(单阳性)时会发生高的阳性率或阴性率,这些点导致对所有样本中单个物种的早期生长率或后期收缩率的高估(图7b和8b,右上象限和左下象限),当细菌早期从低丰度增殖或后期收缩到低丰度的过程时,通常会发生此类rIC误差。当连续两个点推断的绝对丰度为零(双阴性)时,就会发生第二种rIC误差,导致低估了单个物种的早期生长率或后期收缩率(图8b),当细菌早期从低丰度增殖或后期收缩到低丰度的过程时,通常也会发生此现象。这两种rIC误差占> 0.05 rIC误差的91.7%(图8c)。如果所有涉及零值的数据都从分析中消除,我们发现推断的绝对丰度的变化率与qPCR检测的绝对丰度的变化率之间存在极好的相关性(图8b)。因此,当细菌丰度较低或使用不太灵敏的16S通用引物PCR和NGS方法无法检测到时,推断的绝对丰度在微生物早期生长或后期收缩不能捕获准确的动力学。然而,当细菌以较高的丰度存在时(例如每个拭子中的16S rRNA基因总拷贝数>106),推断的绝对丰度可用于估计单个物种的生长率和收缩速率。
图8推断的绝对丰度可以准确推断两个连续非阴性样品之间的动力学变化。(a,顶部)单个受试者A. vaginae随时间变化(虚线表示推断的绝对丰度,实线表示qPCR检测的绝对丰度);(a,底部)同一受试者A. vaginae随时间变化的速率。只有当一个连续样本中的推断的绝对丰度为零时,推断的绝对丰度和qPCR检测的绝对丰度之间的拭子-拭子水平差异才会变化。(b) 推断的绝对丰度变化率与qPCR检测的绝对丰度的散点图。数据与图7a和b中的数据相同,三角形对应于图a。根据连续样本是双阳性(推断的绝对丰度均>0推断浓度)、单阳性(推断的绝对丰度一个>0和一个为0)还是双阴性(推断的绝对丰度均为0),对点进行着色。两个样本都为正(不为零)的数据点的相关性要高得多。(c) 大多数rIC误差>0.05发生在正、负样本(单阳性)之间的转换过程中。