四环素牙成因

首页 » 常识 » 预防 » 基因组相邻分型法能够快速推断抗生素的耐药
TUhjnbcbe - 2020/10/10 23:52:00
沈阳治疗白癜风的医院 http://pf.39.net/bdfyy/bdfzj/171111/5837445.html
本文初次发表在年最新的英国医学学术期刊《自然微生物期刊》,文献开发了基因组相邻分型法。这项技术可以快速推断抗生素的药敏性和耐药性。本文作者:KarelB?inda,AlannaCallendrello,KevinC.Ma,DerekR.MacFadden,ThemoulaCharalampous,RobynS.Lee,LaurenCowley,CristaB.Wadsworth,YonatanH.Grad,GregoryKucherov,JustinO’rady,MichaelBaym,WilliamP.Hanage节选翻译:振东文宣编辑部/菁菁

在医疗领域,观察耐药菌对于提供有效的经验性抗生素治疗至关重要。然而,传统的分子流行病学分析通常无法在可能影响患者治疗结果的时间范围得出结论。本文介绍了“基因组相邻分型”法,该方法可以通过在基因数据库中识别细菌样本的近亲来推断细菌样本的表型。研究表明,针对肺炎链球菌和淋病奈瑟氏球菌,这项技术可以推断抗生素的药敏性和耐药性。本研究将快速K-mer匹配法应用于牛津纳米孔基因测序数据库,并进行实时运行。这样就可以在开始测序的10分钟内和采集的临床宏基因组痰样本的4小时内确定耐药性。这种灵活的方法应用在病原体监测中,有助于快速确定适当的经验性抗生素治疗。

1.引言

感染给医疗健康系统带来多重挑战,并使患者面临不断上升的医疗费用和更高的发病率、死亡率。临床医生经常需要在不知道病原体,且不知道病原体是否药敏或耐药的情况下,针对感染性综合征患者,进行经验性抗生素治疗的快速决策。在一定情况下,决策速度与不良结果直接相关。对于败血症性休克,有效治疗的开始时间每延迟60分钟,死亡风险预期就会增加10%。通过传染病分子流行病学分析,研究人员能够识别高风险的病原体,并根据遗传学或基因组学分析确定其传播方式。早期,人们使用爆发调查法和鉴定此前未经测试的菌株抗性等方法。但是,随着可负担的、价格较低的基因测序技术得到应用,情况正在发生改变。本文提出一种名为基因组相邻分型的方法,该方法使分子流行病学能够在更早的阶段提供有效信息,从而更好地应用于临床实际。该方法从样本中实时获取序列,并将其与基因组数据库匹配、鉴定出最接近的亲属。由于基因密切相关的分离株通常具有相似的特性,该方法有助于对病原体表现进行合理的启发式分析。基于牛津纳米孔基因数据库,本研究在开始基因测序后的几分钟内,为肺炎链球菌和淋病奈瑟氏球菌鉴定了耐药性和药敏性。根据特定的病原体和可用于匹配的数据库的质量,该方法具有很多潜在的应用。本文将讨论这一方法的应用价值及局限性。2.结果耐药性与肺炎链球菌和淋病奈瑟氏球菌的克隆相关。为了量化克隆与病原体肺炎链球菌和淋病奈瑟氏球菌耐药性的关联,本研究构建了细菌线性耐药性的最佳预测因子,并测量了受体特征曲线下的相关面积。首先,研究人员在美国马萨诸塞州的一项研究中将该方法应用于个肺炎球菌基因组。其次,研究人员使用了CDC淋病奈瑟氏球菌隔离检测项目自年到年收集的例临床淋病奈瑟氏球菌数据。两种数据均包括来自IlluminaHiSeq读段的基因组草图,耐药性数据,以及研究人员使用群体结构贝叶斯分析从序列簇推出的谱系。肺炎链球菌的血统可预测苄青霉素,头孢曲松,甲氧苄氨嘧啶,磺胺甲恶唑,红霉素和四环素的耐药性,其AUC值在0.90至0.97之间,与此前研究结果一致。就淋病奈瑟氏球菌而言,环丙沙星、头孢曲松和头孢克肟的AUC值均相对较高(0.93~0.98),而阿奇霉素的缔合度较低(AUC=0.80),与先前观察结果一致。序列读取能够快速识别最接近的亲属。基于观察到的关联,研究人员开发了基因组相邻分型法以根据测序数据预测表型。基因组相邻分型法包含两个步骤。首先,将样本与已知系统发育树和表型的参考基因组数据库进行比较,然后根据最相邻的数据及其匹配质量预测样本的可能表型。为了应用基因组相邻分型法,研究人员开发了名为耐药元件相关序列的软件(RASE)。软件接收纳米孔读数,并使用ProPhyle软件修正版将读数的k-mer内容与与参考表型数据相比较。ProPhyle是一个宏基因组分类器,它使用数据转换算法实现了快速得出、存储高效、色彩精确的德布莱英图数据结构。使用ProPhyle,RASE可以识别与读数最相似的参考数据,并赋予它们相似性权重。权重的积累将决定样本与参考数据相似性的分数。权重的初始设置为0,并且会根据每次读取的信息内容积累、增加。一般而言,较长的读段(例如,覆盖多个辅助基因的读段)往往具有特异性,得分较高。较短或来自核心基因组的读段往往是非特异的,得分较低。样本和参考数据之间的遗传距离与权重成反比。基于计算权重、种群结构、参考表型,可分两步预测耐药性或药敏性。首先,RASE识别最匹配的参考基因组谱系,并通过比较两个最匹配的谱系、估计谱系匹配的置信度,从而计算“谱系得分”。随后,RASE确定该谱系中的最佳匹配对象,预测最相近表型以及其他相近表型的耐药性。通过比较权重,可以得出“药敏性分数”,从而量化耐药性的风险。当耐药性和药敏性菌株从遗传角度难以区分时,就会发生权重相似的情况。如果权重太相似,则认为研究的置信度较低。即使耐药性表型在谱系内发生变化,精确定位数据库中最邻近的亲属依然能够为患者的诊断和治疗提供进一步解决方案。RASE结果、药敏性评分、用于质量控制的一部分k-mers均随数据库内最佳匹配的变化而实时更新。随着程序的运行,评分会波动,并最终稳定下来。RASE可以在几分钟内识别数据库中的菌株。首先,本研究检测了两个用于构建RASE数据库的肺炎球菌分离株(%敏感性和%特异性,n=10),以测试RASE是否可以在理想情况下发挥作用。对于完全易感的分离株(SP01),RASE分别在1分钟和7分钟内鉴定出正确的谱系和测序菌株。对于耐多药分离株(SP02),RASE可以在1分钟内同时正确检测谱系和测序菌株。为了将基于基因组相邻分型法与基于传统基因方法的耐药性检测时间进行比较,本研究评估了两种方法对耐药基因进行测序需要多长时间。我们观察到传统基因方法检测单个样本至少需要25分钟。随后,研究人员对数据库中的五种淋病奈瑟氏球菌分离株进行了评估(57%的敏感性和%的特异性,n=20)。首先,研究人员测试了易感分离株(GC01),RASE在3分钟内鉴定出正确的菌株和抗菌谱。然后,研究人员对具有罕见机制的分离株(GC02)进行了测序,GC02具有头孢菌素耐药性。在这种情况下,具有耐药性的菌株和具有药敏性的近亲在遗传特征上往往非常相似,容易干扰到RASE的分析。虽然因难以区分近亲而有所延迟,RASE仍然能在9分钟内识别出正确的耐药表型。药敏性得分的低置信度能够体现出RASE分析过程的难易程度和分析结果的可靠性。使用相同的分离株(GC03)在进一步的实验中重复此操作,该分离株同样报告了对耐药表型的低置信度。基因组相邻分型法的这一功能旨在提醒操作员有必要进行进一步测试。RASE可以使用痰液宏基因组样本鉴定肺炎球菌的耐药性。使用琼脂稀释、Etest或圆盘扩散进行细菌培养和表型分析,会大大延长耐药谱分析的时间。因此,直接使用宏基因组方法对临床样品进行测序更加可取。研究人员从下呼吸道感染患者的痰标本中分析了宏基因组纳米孔数据,并选取了6个已知含有肺炎链球菌的标本(敏感性为75%,特异性为%,n=16)。一个样本(SP10)包含多种细菌的DNA。在5分钟内,该序列被鉴定为属于瑞典15A-25克隆(ST63),该克隆与已知耐药性表型相关,包括大环内酯类和四环素类。根据EUCAST断点,该样本对红霉素、克林霉素、四环素和奥沙西林具有耐药性。瑞典15A-25克隆的初始报告未报告对青霉素的耐药性,随后在该谱系中显示了耐药性。RASE数据库正确地显示了该样本中青霉素耐药的风险。3.讨论与结论本文提出基因组相邻分型法,用于在相应数据库中对比查找菌株基因组最邻近的亲属,并根据已报告的亲属特征推断出该菌株的表型特征。当前,临床医生通常在作出关键临床决定之后才能确定细菌病原体的种群结构,继而获取细菌的耐药性和药敏性信息。宏基因组学样本的结果表明,可以将这种方法直接应用于临床,并且这一方法在肺炎链球菌和淋病奈瑟氏球菌相关试验的成功应用表明其可能具有广泛的应用价值。对肺炎球菌最邻近亲属的初始鉴定一直比淋球菌更稳健,这是由于肺炎球菌具有更多针对单个谱系的k聚体,从而显示更高的序列多样性。由于淋球菌多样性较低,当数据库存在多个密切相关的基因组时,RASE即使可以正确识别亲缘关系,结果也将在不同对象之间波动。如果这些基因组的耐药性不同,药敏性得分的不确定性将反映这一问题。如果得分不确定,表明需要进行进一步调查。和其他推论方法类似,基因组相邻分型原则的局限性是数据库的代表性。本研究中,研究人员使用了有限地理区域中相对较小的样本来证明其原理。但实际上,这一方法还可以将许多公共卫生机构生成的大型基因数据库与元数据结合使用。如果有需要,可以对此类数据库进行本地采样补充。对基因组相邻分型法准确性影响较大的问题是数据库中是否包含足够高比例的临床常见菌株,以及已知菌株的耐药性数据是否正确。数据库的最佳结构和内容还需要进一步工作来确定,但本研究的重点在于证明这一方法有望应用在一定范围内的病原体上。这些病原体包括大肠埃希氏菌。基于多位点序列分型鉴定的序列类型数据和流行病学信息,大肠埃希氏菌对多种抗生素产生的AUC值超过0.。这表明基因组相邻分型法在这一菌种中的应用具有很大的潜力,能够对其耐药性和药敏性进行较好分辨。然而,本研究预期在物种内基因变异很小的情况下(意味着很难识别近亲),或者存在独立多样基因组、能够迅速发展耐药性的情况下(意味着耐药性与其亲缘背景关系不大),基因组相邻分型法可能不适用。在传染源未知的情况下,这一问题更具挑战性。一种病原体的k聚体可能与其他病原体匹配并导致错误的预测结果,因此选择正确的预测数据库非常关键。选择预测数据库需要两个步骤实现。首先将读数通过宏基因分类器(如Centrifuge43或MetaMaps44)传递,然后这些分类器将选择正确的RASE数据库。本研究的另一个局限性是制备样品所需要的时间。这一时间目前包括人类DNA消耗、DNA分离、文库制备,总共需要4个小时。但是,这是一个快速发展的技术领域,并且自动快速文库制备工具包已经在开发中。为了使这一方法更接近临床实际,还需在样品制备领域,特别是文库制备领域进行更加深入的研究。本研究已证明,在不探索耐药性决定因素和不进行因果研究的情况下,可以依据基因组相邻分型法有效预测耐药性和药敏性。实际上,基因组相邻分型法仅要求菌株表型与种群结构的关联性足够高,从而提升预测的可靠性。这一方法的主要优点是它只需要很少的基因组数据,因此不受高错误率或低覆盖率的限制。特别是,这一方法目的并不在于定义被测样品的准确基因组序列,而只是尝试确定其来自哪个谱系。因此,即使读物中仅有一小部分k聚体与RASE数据库匹配,也足以确定谱系关系。该方法具有比基因检测更快的优势。由于信息性k聚体分布在整个基因组中,有效信息更有可能出现在纳米孔测序的前几个读数中。基因组相邻分型法可以看做是一种压缩感测方法的应用。也就是说,通过测量在数据中心广泛分布的稀疏信号,研究人员可以使用具有容错性的、较少的指标识别它。基因组相邻分型法也可应用于检测与系统发育密切相关的其他表型,如*力。由于爆发中密切相关的分离株都与RASE数据库中同一菌株匹配,基因组相邻分型法的下一步应用可能包括快速暴发调查。这一方法还有助于加强监测,特别是实地监测。例如,在-年西非埃博拉疫情中,人们发现纳米孔基因测序可以应用在没有先进医疗设施的偏远地区。目前,经验处理决策是在连续的“窗口”中做出的。从最初的革兰氏染色到完整的表型表征,病菌信息不断增加。来自基因组相邻分型的信息是对这一过程的自然补充,并且可能帮助临床医生在对患者做显著性测试之前或药敏性数据可用之前就改善治疗决策。高质量的RASE数据库与基因组相邻分型法相结合,能够提供一种替代性、前瞻性的诊断监测模型,在改善传染病临床管理方面具有广阔的应用前景。

点击前往振东健康商城

预览时标签不可点
1
查看完整版本: 基因组相邻分型法能够快速推断抗生素的耐药