DNA测序,无论从何种角度而言,都着实代表了生物检测最具活力的领域。尽管已历经25年发展,测序技术却没有合并为某种单一基本方法,而是发展出日益丰富的多样化技术。然而,激光激发的荧光技术依然是最为流行的检测方法。事实上,激光荧光技术在基因测序的发展中担任着关键的角色,测序环境的飞速变化也正在推动重要的产品趋势。
从Sanger法说起
首个成功测定一段DNA序列的方法是链终止法,又称Sanger法。此方法在四种不同的脱氧核糖核苷碱基和一种低浓度的链终止核苷酸中,使用聚合酶复制单链DNA;链终止核苷酸已经过化学改性,因而聚合酶可吸收其中一种核苷酸,但其结构将阻止进一步合成。结果将从原始引物序列产生不同长度的片段,从仅含几个碱基到与原始单链等长。对终止核苷酸进行放射性标记并在硅胶板中分散复制片段后,序列可在曝光照片底板上呈现为具有四种独特条纹(腺嘌呤[A]、胞嘧啶[C]、鸟嘌呤[G]、胸腺嘧啶[T])的"条形码"。
该方法通过第一代仪器实现了自动化,其原理为改用荧光标记的链终止核苷酸(用四种不同的荧光标记四种碱基),通过毛细管电泳法(CE)区分各复制片段的长度,随后用激光荧光(通常为488 nm)识别A、C、G、T(参见图1)。
图1. 最初的Sanger测序法在聚合反应终止处开始,用放射性核苷酸进行标记,随后在凝胶隔板上通过电泳法区分长度。该方法随后改用荧光核苷酸标记、毛细管电泳区分和激光检测,从而实现了第一代自动化测序法。
每一轮仅可测序几百个碱基。因此,整个人类基因组的读取工作由多个实验室共同承担,每个实验室运行多个测序器,总成本约30亿美元,历时长达10年。
第二代:大规模并行计算
难以置信的是,测序完整人类基因组的成本已降低近七个数量级,现在每个完整人类基因组的测序成本不到1,000美元。第三代仪器的开发商甚至更进一步,可将成本继续降低至十分之一。
第二代测序(NGS)仪器所使用的大规模并行计算,是推动速度和成本革新的重要一步。经过验证,两种最为流行的第二代测序方法分别由Illumina公司(加利福尼亚州圣地亚哥)和Life Technologies公司(加利福尼亚州卡尔斯巴德)开发。这两种方法均首先将目标DNA切分成易于处理的单链,每条单链通常含数百个碱基。随后,将这些单链排列成某种互不重叠的阵列,并在原地进行放大,即通过聚合酶链反应(PCR)或克隆形成小型群集,每个群集仅含一种单链且由该种单链的诸多相同复制品构成。随后用百万级像素的传感器以荧光法跟踪测序,因此可以同时分析多达数万甚至数十万个群集的激光荧光。Life Technologies公司使用连接(切断)测序法,而Illumina公司采用合成测序法(SBS)。后者已成为市场领导品牌,部分得益于其旗舰版仪器的超高通量,每日测序量可达6,000亿个碱基,非常适用于全基因组测序及其他类似应用领域。
图2. Pacific Biosciences RS II测序仪。每个零模式波导(ZMW)含一个单一聚合酶(图a)。通过将激光分离指向各个ZMW的众多衍射极限光斑,可在一个SMRT芯片上同时实时模拟和监测多达150,000个ZMW(图b)。(图片由Pacific Biosciences公司提供)
这两种方法的测序均在由激光激发的玻璃板上或流动池中进行。每种核苷酸(A、C、G和T)均有唯一的荧光发射剖面。因此,每一个独特的群集均会以特定的波长模式闪烁,即在其成像位置会呈现为不同颜色,以对应下一个将要切断(Life Technologies)或合并(Illumina)的碱基。结合使用二向色滤光片和低噪点数码相机检测,可在每个化学周期内,同时对数百万个群集序列的碱基进行逐一读取。随后,计算机将从这些随机排列的群集中对比所有序列,并将其与已知/预期的基因组序列进行对比,以组成最初未剪切的DNA完整序列。
遗传学/DNA测序(续)
图3. 仪器制造商常常寻找整合型激光器和光束传输解决方案,有时还希望产品可以提供多种激光波长。相干公司的Galaxy解决方案提供现成便捷的技术,使用八个波长专用的即插即用输入接口,将多个激光器的输出合成到单个输出光纤中。
第三代:
技术多样性
展望未来,多个商业开发平台上将会出现数个"第三代"测序方法,包括基于电化学和半导体检测的全新系统。但因为某些原因,激光荧光法仍将是主流方法:这种方法广受认可,并且是湿法化学和生物化学实时取样中通用性最强的方法,可提供无与伦比的空间分辨率和极高的敏感度,甚至可达单分子级别。
大多数第三代方法的目的是降低成本,甚至提高整体通量。我们之所以强调"整体"通量,是因为决定通量的不仅仅是速度,还有每一轮的碱基数、每一轮的单链数和单链长度等。第二代测序法具有读长数量大、长度短的特点,而在第三代方法中,数量相对较少,长度却非常长。这简化了软件在组装完整目标序列时存在的寡核苷酸单链重叠的问题,从而降低了必要的计算机时间和过量取样数量(取样深度)。
过量取样是必要的,因为第二代测序法和某些第三代方法常常出现较高的错误率。与拥有近100%准确率的Sanger改进法不同,某些技术的错误率(每单个读取事件)会达到15%甚至更高。然而,错误的出现实属随机事件;本质上,这些方法所采用的过量取样仍可提供100%的准确率。例如,即使每次读长的每个碱基仅有80%的准确率,那么15至30倍的过量取样量便可获得极小的错误率。
Pacific Biosciences公司(加利福尼亚州门洛帕克市)开发了一种非常有趣的方法,其中采用了一种创新性光学元件。PacBio RS II系统使用零模式波导(ZMW),即直径远小于光波长的光波导。在一个单分子实时(SMRT)芯片上,通过在透明硅胶基片上沉积的铝膜(100 nm厚)中形成圆孔(直径约70 nm)以生成ZMW。每个波导的底端均有一个单一聚合酶。激光照明可穿透硅胶,进入每个波导的深度仅为30 nm,因此仅当核苷酸添加到DNA时,才可高效吸收荧光的毫秒脉冲。重要的是,公司宣称单次连续的读长可达到40,000个碱基。测序工具的实用性由并行程度决定,而并行程度可由放大这个简单实验取得,并且这在很大程度上取决于可用的激光技术如何。PacBio RS II仪器通过将激光分离成指向各个ZMW的众多衍射极限光斑,可同时实时监测多达150,000个ZMW(参见图2)。根据Pacific Biosciences公司光学工程和仪器设计部高级经理Paul Lundquist所言,相干公司的Genesis技术非常适合这个应用领域。"从激光束中生成一个衍射极限光斑并不困难,但是符合这种级别的光束分离和精准定位要求的光学系统,必须具备优异的光束质量和波长稳定性。正是因为具备这些高要求的性能和可扩展功率平台,Genesis的表现十分出色。"
表达谱和综合测序
应用领域市场的多样化,是测序方法技术多样性不断丰富的原因之一。临床应用领域在DNA测序市场中比例较小,但是预计在2019年前会出现近2倍的明显增长(独家调查结果)。此外,仅有部分研究和临床应用领域要求在单碱基分辨率级别读取千兆碱基,如第一次人类基因组的完整测序。有一些应用领域(例如,查找与某些癌症相关的点突变或开发转基因作物)需要短片段的单碱基分辨率。
对于表达谱测序应用领域,其目标是寻找某些序列或基因是否存在及/或其位置,而非读取每一个碱基。BioNano Genomics公司(加利福尼亚州圣地亚哥)的方法十分有趣,将新颖的微流体与激光激发的荧光相结合。该方法将荧光标记过的单链DNA串插入到被剖析的双螺旋DNA中。每个单链DNA串仅在双螺旋DNA中存在与其完全互补的配对时,才会插入到其中。随后使该DNA通过狭长的微流体通道,延展DNA三级结构,从而形成长串形状。然后,使用激光源横穿此DNA流,并像读取彩色条形码一样读取这些插入的DNA片段。
至少在短期内,这些第三代技术将与第二代测序法展开竞争,因此有必要关注作为主流的第二代测序技术在光电方面出现的几个有趣进步。其中一项进步就是将寡核苷酸单链贴附到微型玻璃珠(3 ?m)上,而不再随机放在某一表面上。这些单链经过桥式放大后,将在流动池较低层面上密集的小坑或井中自行组装。这可确保实现最高的密度,同时还能避免群集或玻璃珠重叠在一起。此外,在微机电加工系统(MEMS)技术中,流动池较低表面外侧设有一组近抛物线反射器,可将激光集中在每个玻璃珠上,还可高效吸收落射荧光。随后,使用微型透镜将激光高效聚集到聚光器中。另一项进步出现在氟化学领域,简化了光学元件系统,并减少了图像的需求总量。具体而言,一些系统使用双染测序化学和双通道检测,其中"C"仅为红色,"T"仅为绿色,"A"为红绿混合,"G"为暗色(非红非绿)。
激光器性能与整合
这些化学、纳米光子学和微流体方面令人印象深刻的创新,共同推动着激光器的四个主要发展趋势:多样性、可靠性、整合和合作。
激光器多样性。测序的动态本质和终端市场尚处萌芽的状态(目前临床应用领域所占到的市场份额十分有限)使得未来难以预测。市场仅需要少数几种波长(488 nm、514 nm和532 nm,以及640 nm或660 nm的红色),但对激光器其他参数的需求则具有多样性。这意味着,为了提供范围尽可能广泛的标准激光器选择来支持研发,常常需要不止一项核心技术(如二极管、光泵浦半导体激光器[OPSL])。这还意味着,为支持优化的、更大体积的仪器,应能够制造经济高效的客制化激光器。
例如,相干公司提供的激光器功率从几毫瓦到10瓦不等。为什么?对于DNA单链被高度放大、空间上高度集中的应用来说,所需的荧光信号更强,激光器功率更低。但如果这些取样点遍布需要大面积照明的大型流动池或滑道中,就会提高对功率的要求。对于测序单链而信号相对较低的应用领域,功率就变得非常重要,尤其是那些常常进行大规模并行计算的应用领域。功率方程的另一个因素是损伤;激光器不得对测序使用的任何酶或对DNA本身造成功能性损伤。因为较短波长造成的损伤往往更多,对较短波长(如488 nm)的数百毫瓦以上的功率需求也就较少。
激光器可靠性。虽然大多数商业激光器应用领域均有可靠性方面的要求,但这里的问题不仅仅是非计划停机给仪器的原始设备制造商及其终端用户造成的成本。某些测序技术,特别是针对全基因组的应用领域,均需要连续运行长达数天。
如果激光器出现性能故障或者暂时性性能偏差,就会连累整个数据集,导致其价值全无。因此,市场非常保守,不会对未经验证的激光器技术感兴趣。
激光器整合。对于多数测序技术而言,拥有独家专利的"神奇功能"和消费品主导的利润,主要来自拥有专利的化学和微流体技术等,因此在激光使用方式方面的创新则相对较少。另外,大多数这类公司在激光生成和传输/修改方面并没有投入资金或拥有专业技术。因此在多数情况下,他们所要寻找的是一体化光电引擎而非一台标准激光器。在研发和产品试验板实验期间,需要即插即用的简易型智能激光器的仪器开发商数量极其有限。但是他们常常需要现成的模块化解决方案,以便在光纤传输(单模与多模)中实现即插即用的多个波长的合成,并使用折射和衍射光学元件实现光束成形(参见图3)。在某些情况下,他们要求消除引擎中激光器的相干性,以避免生成斑点,确保一致的稳定照明。
合作。因为这些市场特点,仪器开发商和制造商常常希望激光器供应商作为分包商而非组件供应商。这类合作关系需要激光器供应商有能力制造符合某些特定输出规格的系统,以及专门用于打印的系统,但后者较少见。除了这项专业技术外,随着各项第三代测序技术已成功完成商业化,并开始在快速增长的市场中角逐份额,仪器公司还希望拥有可以应对不可预测的增长模式的激光器分包商。
增加价值
虽然技术已取得巨大进步,测序仍然是一个活跃的初期市场,具有难以估量的技术多样化可能性。更重要的是,激光器作为一个可靠组件使用,而不是一个创新性的解决方案。这就要求激光器制造商必须生产出系列丰富的现成激光器和光束传输/光束合成产品,并有能力提供扩展范围宽广的客制化系统,方可有力支持此行业的发展。"