根据世界卫生组织(WHO)报道,“抗抑菌剂基因的出现对于由细菌、寄生虫、病毒及真菌所引起的感染疾病的预防与治疗带来了很大的挑战,在后抗生素时代,看似普通的感染有可能扼杀一条生命不再是不切实际的幻想,而正逐渐变为现实”。
通常抗抑菌剂基因的获得是由细菌内可动遗传因子元件介导的致病菌间或者是致病菌和共生体间交换的结果,因此,获得抗抑菌剂基因所处的遗传环境对于了解抗抑菌剂基因的移动就显得非常重要。通过PCR或高通量二代测序的方法可以很容易检测到抗抑菌剂基因的存在,然而这些方法自身的一些局限性使得其很难精确地检测这些基因所处的遗传环境。而PacBio RS II SMRT单分子测序技术,利用其特有的读长优势可以克服这些局限从而追踪含抗抑菌剂因的致病菌在医疗环境中的传播。
细菌间遗传因子的水平转移是通过由细菌染色体所分离出来的质粒、小DNA分子来实现的。Conlan等科学家通过对2011年美国NIH临床诊断中心爆发的那次疫情中病人中分离到的致病菌进行PacBio长读长测序分析,鉴定出致病菌质粒含有blaKPC基因,该基因可以编码碳青霉烯酶从而水解碳青霉烯抗体。Conlan又对1000多个感染抗碳青霉烯抗体致病菌病人进行监测,从这些病人中分离出细菌基因组并进行PacBio SMRT长读长测序分析,得到了63个质粒的完整序列,这些完整的质粒序列信息让我们对致病菌质粒的多样性有了具体的了解,而这些是任何其他测序方法所不能完成的。
质粒在抗抑菌剂基因的转移中起着关键的作用,抗抑菌剂基因通常以模块化的基因簇形式聚集在一起增加了它们的抑菌性。一些插入序列,如IS26,将抗抑菌剂基因在基因组序列张间隔排列,像转座子一样可以到处移动;还有一些因子,如ISEcp1,可以移动其相邻的基因,从而产生许多抗抑菌剂基因拷贝存在于基因组内。这些插入序列及其他一些因子的存在是二代测序基因组组装不完整的主要原因,只能得到许多染色体序列片段及质粒序列片段,在这种意义上说,质粒序列信息是二代测序基因组组装的“黑洞“,在许多基因组组装研究中都要规避复杂结构的质粒的存在。Colan等在本研究中的基因组比较结果表明抗抑菌剂基因的结构及序列排列信息只有通过PacBio长读长测序获得完整质粒序列信息的情况下才能够拿到。
传统的Sanger测序是组装和分析抗抑菌剂细菌质粒的金标准,然而这种方法在测序前需要分离和构建不同的高质量的质粒文库,在技术层面存在很大困难,并且成本也非常之高。短序列测序的二代测序可以很经济地获得很多有重复序列所分割的Contig,由于这些重复序,通常是些移动因子(如插入序列),在质粒中存在很多拷贝,因此在组装完整质粒序列方面就存在很大困难。从任何细菌中获得抗抑菌剂基因都可以很容易地做到,但是如何将这些质粒中的序列完整地组装起来是最大的困难,而组装完整的质粒序列对于我们在临床上理解这些基因是如何传播的非常关键。作为比较, PacBio长读长测序可以使我们获得完整的细菌质粒图谱,包括数量、位置及抗抑菌剂基因的移动因子等具体信息。这些信息也极大地帮助我们去理解质粒的运输、转移、流行病及进化情况。