自第一代DNA测序技术问世至今的几十年时间里,基因测序技术已获得了巨大的发展。从第一代到第三代乃至第四代测序技术,测序读长从长到短,再从短到长。虽然当前第二代短读长测序技术仍在全球测序市场上占据着绝对的优势位置,但第三和第四代测序技术也已在近几年来得到了快速发展。凭借超长读长和单分子测序的优势,以PacBio SMRT和Nanopore测序为代表的长读长测序技术在一定程度上弥补了二代测序技术的局限性,如读长短、存在PCR扩增偏好性等,为基因组研究提供了全新的手段和分析策略,极大推动了基因组学研究的发展。
基因测序技术的发展也在全球掀起投资狂潮,根据BBC Research的统计,全球基因检测市场2018年达117亿美元,预计2020年将达138亿美元。在长读长测序领域,尽管PacBio及Oxford Nanopore等公司占据着技术优势和先发优势,但更多创新企业也纷纷涌入这一领域。例如,一家名为Universal Sequencing Technology(以下简称UST)的美国初创公司正致力于让长读长测序技术变得更加触手可及。
图:UST公司LOGO。来源:UST官网
据悉,UST公司于2015年7月在美国特拉华州注册成立,是一家专业从事基因测序平台研发及产业化的高科技生物技术公司,由多位曾参与研发Roche 454测序平台的资深业内人士创立,现已经拥有超过20名员工。截至2017年,UST共计获得了总计600万美元的种子投资。2018年6月,UST还成功获得了来自我国肿瘤分子诊断领域领军企业艾德生物的800万美元A轮融资。迄今为止,UST已在国际上提交了19项专利申请,涉及长读长文库制备化学试剂和第三代DNA测序技术。日前,UST正式推出了该公司首款产品——TELL-Seq全基因组测序文库制备试剂盒,可以帮助研究人员从短读长reads中提取远距离信息。据报道,这款全基因组文库制备试剂盒使用一种转座酶来片段化DNA并添加条形码,进而帮助测序后重新组装这些reads。该试剂盒可用于连接伪长reads,平均50kb,最大100kb,一次最多可进行四个大基因组或12个较小基因组的基因组文库制备,售价为720美元。该公司介绍,该产品能够帮助研究人员更有效地识别生物体与个体之间的结构变异,对基因组进行分型,以区分序列或变异来自哪个亲本染色体。除染色体结构分析外,宏基因组研究人员还将使用该试剂盒,分析包含复杂微生物混合物的环境样品。
图:TELL-Seq全基因组测序文库制备试剂盒。来源:UST官网
在去年11月发布在预印本网站BioRxiv的一篇文章中,UST的科学家描述了利用这种名为“转座酶关联长读长测序”(TELL-Seq)的技术,来从头组装基因组以及单倍型分型的方法。UST团队与生物信息学分析公司Bioturing以及加利福尼亚大学圣地亚哥分校的研究人员合作,实现Scaffold N50长度为31.5 Mb和scaffold NA50长度为4.3 Mb;最长contig为109.2 Mb,最大比对区域为23.6 Mb。 UST公司首席执行官兼联合创始人Ming Lei(雷明)表示,这种单管反应仅需要几纳克的DNA,对于任何需要长读长测序的应用而言,这都使得结果更加准确和可负担。雷明于1985年在成都科技大学(现四川大学)获生物力学硕士,1995年在美国北卡州大获生物医学工程博士,之后于约翰霍普金斯大学医学院从事博士后研究。自2001年起,雷明一直在DNA测序及微流体领域从事最尖端的产品研发工作,从头到尾参与了世界上第一台大规模高通量DNA测序仪以及相关产品的研发,也是最早从事单分子纳米孔DNA测序技术研究的科学家之一。
图:Tell-Seq文库制备流程示意图。来源:BioRxiv
除了Tell-Seq试剂盒,雷明还透露,UST的真正目标是推出一款新型长读长测序平台,该平台目前正在开发中。虽然雷明并未提供技术细节,但他表示该平台与Oxford Nanopore和PacBio的测序技术不同,且具有“颠覆性”。
UST商务负责人Andrew Bond也表示:“我们将自身定位于一家测序公司。文库制备试剂盒是我们的首款产品,但我们还将有其他产品问世。” 最终,该公司希望开发出一款长读长测序平台,使全球每个实验室或医院都可以负担得起并使用它。据报道,自2016年起,在种子投资和A轮融资的助力下,UST加速推动技术研发,迄今为止已在国际上提交了19项专利申请。其中一项美国专利申请描述了一种测序装置和方法:将DNA附着在一种由“精密机械驱动器”控制的板上,通过该驱动装置将分子推过纳米孔芯片。“我们为第三代DNA测序仪项目开发了一系列知识产权。”雷明说到,“纳米孔测序的专利申请只是我们的新型测序仪技术中的一小部分。”另一项美国专利申请则描述了利用条形码追踪核酸片段的方法,可用于全基因组测序和靶向测序的多种应用。这也是Tell-Seq的工作原理,其中约50 kb的DNA片段被锚定在条形码磁珠上的转座体捕获。转座酶打断了DNA片段,并将条形码附加到片段上。该反应在主体溶液中进行,没有封装样品和试剂,也没有物理分隔,耗时不超过三小时。“所有化学反应都发生在磁珠表面。”Andrew Bond说,“在那之后,你可以将这些片段视为常规文库。在这种情况下,它是一个支持Illumina测序的文库。”雷明表示,该公司的下一目标是B轮融资,并推出新版本的TELL-Seq试剂盒。下一步,该公司计划扩大规模并推出用于高通量应用的试剂盒,其中包括针对全外显子组和靶向测序的改良试剂盒,计划于2020年第二季度推出。“对于非外显子组靶向测序,我们专注于完整基因长连续位点的单倍型分型和双倍型分析,包括外显子、内含子及其调控区域,例如整个EGFR基因和整个MHC区域等。”他补充到。尽管当前第二代短读长测序技术仍然占据着绝对的优势位置,但雷明表示,UST的所有技术都将专注于长读长测序。“我们正在从事的一切工作都与长读长有关。” 他说,“毫无疑问,未来在许多应用场景下,长读长测序的需求将超越短读长测序。”没错,虽然人们习惯将测序技术迭代以进行区分。但除了一代经典的Sanger测序技术,二代和三代仅是测序原理不同,而非代际关系。驱动测序技术革新的动力永远来自真实的需求。未来,UST能否引领新一轮DNA测序的创新,还让我们拭目以待。