編者按
NGS技術(shù),到底是下一代測序,還是二代測序?NGS到底包含了哪些技術(shù)?關(guān)于NGS的定義,一直困擾著業(yè)內(nèi)外人士。曾參與“國際人類基因組單體型圖計(jì)劃中國卷”項(xiàng)目 、“炎黃一號(hào)” 等多個(gè)重大科研項(xiàng)目的基因測序?qū)<彝跬┦?,近期發(fā)表了文章《淺議基因測序技術(shù)的代際》,文中清晰地解釋了測序技術(shù)代際問題。小編特將該文轉(zhuǎn)載,歡迎各位交流探討。
正文:
相對于較早出現(xiàn)的Sanger雙脫氧核苷酸測序技術(shù)(簡稱Sanger測序),2005年后出現(xiàn)的NGS測序技術(shù),使得基因組研究進(jìn)入高通量時(shí)代,促進(jìn)了基因組學(xué)科學(xué)研究及技術(shù)轉(zhuǎn)化應(yīng)用。
在基因組學(xué)領(lǐng)域,NGS通常是next-generation sequencing的縮寫,意為下一代或者新一代測序技術(shù),亦有人稱之高通量測序技術(shù)(High-throughput sequencing,HTS)、二代測序技術(shù)(second-generation sequencing)。至于到底哪些測序技術(shù)屬于NGS,并無明確統(tǒng)一的界定,目前主要有兩種觀點(diǎn),存在些許差別。
對NGS的第一種理解
自動(dòng)化的Sanger測序技術(shù),通常被稱為“第一代”測序技術(shù)。以Sanger技術(shù)為起點(diǎn),新出現(xiàn)的技術(shù)被稱為下一代測序技術(shù)(簡稱NGS)1。
這些新技術(shù)涉原理,依賴不同的模板制備方法(例如乳液PCR、DNA納米球、橋式擴(kuò)增 、單分子模板)、序列測定方法(焦磷酸測序、基于可逆終止化學(xué)測序、基于連接反應(yīng)的測序、磷酸連接熒光核苷酸或?qū)崟r(shí)測序)、基因組比對與組裝方法等。
這種觀點(diǎn)認(rèn)為目前的大規(guī)模并行測序技術(shù)都屬于NGS,包括Roche/454測序、Illumina/Solexa測序、Life的SOLiD與ION系列以及華大基因的BGISEQ/MGISEQ系列等;此外,持這種觀點(diǎn)的學(xué)者還將Helicos BioScience、Pacific BioSciences以及Oxford Nanopore的單分子及納米孔測序技術(shù)均納入NGS技術(shù),并未單獨(dú)將其定義為第三代測序技術(shù)1~3。
02
對NGS第二種理解
另一種理解認(rèn)為 NGS主要是指基于大規(guī)模并行測序(massively parallel sequencing,簡寫MPS)的測序技術(shù)4。
大規(guī)模并行測序的關(guān)鍵技術(shù)誕生于上世紀(jì)90年代,于2005年商業(yè)化進(jìn)入市場。這一技術(shù)同時(shí)對成百上千萬的待檢測DNA模板分子進(jìn)行測序,加大了測序反應(yīng)的效率與通量,使得一次測序?qū)嶒?yàn)便能夠完成一個(gè)或更多的人類基因組序列的測定。盡管不同的大規(guī)模并行測序技術(shù)原理各不相同,但有一些共同特點(diǎn),楊煥明老師有非常簡潔的總結(jié)5:(1)“裸”、“密”并行,每一個(gè)分子簇為一個(gè)裸露的測序反應(yīng),使得測序通量提高了幾個(gè)數(shù)量級(jí);(2)測序通量 的提高,損失了下機(jī)的讀長(初期只有約20個(gè)堿基,現(xiàn)在已有顯著提升)。
盡管MPS的標(biāo)本制備和測序原理不同于Sanger測序,但它與Sanger 測序一樣,仍需要對測序分子進(jìn)行擴(kuò)增,因而也不可避免的增加引入序列誤差的概率和GC偏差,也不能直接分析不同修飾的核苷酸5。
按照這一觀點(diǎn),單分子測序不屬于NGS,而是更加新的技術(shù)。
03
NGS:Next-generation 還是 Now-generation?
隨著MPS成熟穩(wěn)定,在2008~2010年左右,NGS有了一個(gè)新的含義,即Now-generation sequencing6、7,直譯為“當(dāng)代”或者“現(xiàn)代“測序技術(shù)。
也就是說,“下一代”測序技術(shù)變成了“現(xiàn)代”測序技術(shù)。不過,Now-generation sequencing這一說提法并未被廣泛使用。因此在多數(shù)情況下,NGS主要是指Next-generation sequencing。
在高通量測序技術(shù)剛剛問世時(shí),人們并沒有預(yù)料到測序技術(shù)的后續(xù)發(fā)展如此迅猛。因此,無論是Next-generation 還是Now-generation,其實(shí)都是一個(gè)比較籠統(tǒng)的提法,本身也意味著變化和發(fā)展。這也就不難理解為什么目前對于哪些技術(shù)屬于NGS會(huì)存在不同觀點(diǎn)了。
04
關(guān)于測序技術(shù)的代際
上述話題牽涉出所謂的測序技術(shù)代際的問題。然而目前來看似乎并沒有統(tǒng)一的認(rèn)定。
如果按照上文對NGS的第一種理解,目前的代際劃分似乎更多的用來區(qū)分Sanger 測序與非Sanger 測序。這兩類技術(shù)在原理和測序通量上都有存在較大差異,但也有相通之處。例如,無論是Sanger雙脫氧核苷酸測序,還是高通量測序中的邊合成邊測序技術(shù),或者是基于連接反應(yīng)的測序,其原理都依賴核苷酸的聚合反應(yīng)。
目前測序儀代際劃分的分歧點(diǎn)主要圍繞“二代測序”和“三代測序”技術(shù)。“三代測序”這種提法出現(xiàn)于2008~2009年,當(dāng)時(shí)主要是指有別于NGS的新型測序技術(shù)。一些學(xué)者認(rèn)為單分子測序、實(shí)時(shí)測序以及核心方法有別于已有技術(shù)的方法,應(yīng)是三代測序技術(shù)的定義性特征。目前,三代測序通常是指無需DNA擴(kuò)增的單分子測序技術(shù)4。這種技術(shù)從原理與特點(diǎn)來看,有其自身優(yōu)勢(比如測序能夠獲得較長的讀長,有望解決單倍體基因組組裝和結(jié)構(gòu)變異識(shí)別),是測序技術(shù)發(fā)展的重要思路。
有學(xué)者指出,目前測序技術(shù)代際劃分,也許更多的是出于商業(yè)上的考慮,因?yàn)槿藗兺ǔA?xí)慣性的認(rèn)為技術(shù)代際升級(jí)代表了技術(shù)的演化。例如,Pacific BioSciences 公司在其發(fā)表的論文中,將單分子實(shí)時(shí)測序技術(shù)與NGS進(jìn)行了區(qū)分,被歸入三代測序技術(shù)8,其用意是不言而喻的。
單分子測序技術(shù)早在2003年就有概念性的論文發(fā)表9。2008年,Helicos BioSciences推出了第一臺(tái)單分子測序儀,隨后Pacific BioSciences與Oxford Nanopore也推出了各自商業(yè)化的測序儀。不過,也許是由于單分子測序?qū)夹g(shù)體系要求更高,這項(xiàng)技術(shù)的發(fā)展遠(yuǎn)不如當(dāng)初人們預(yù)想得那般迅猛,直至今日尚未達(dá)到NGS這樣的市場規(guī)模。這期間,Helicos BioScience已于2012年破產(chǎn),盡管其技術(shù)符合目前對三代測序技術(shù)的界定。
隨著更多的應(yīng)用,單分子技術(shù)也陸續(xù)暴露出一些技術(shù)問題。例如,在近期的一篇論文中,研究人員對利用長讀長測序技術(shù)組裝的人類基因組進(jìn)行分析,發(fā)現(xiàn)與短讀長組裝相比,長讀長組裝的蛋白編碼區(qū)域含有更多的錯(cuò)誤10。盡管有學(xué)者指出,新的生物信息學(xué)工具已經(jīng)能夠改善納米孔測序的組裝結(jié)果,有望從Oxford Nanopore和PacBio的測序數(shù)據(jù)中獲得高質(zhì)量的序列11。但是,真正的長讀長技術(shù),只有達(dá)到或超越現(xiàn)有技術(shù)的性能和準(zhǔn)確度時(shí),才有實(shí)用意義。
從測序技術(shù)應(yīng)用角度來看,某些應(yīng)用也許并不需要長讀長的單分子測序技術(shù)。例如,基于外周血游離DNA測序的無創(chuàng)產(chǎn)前檢測,因目標(biāo)DNA本身就是一百多個(gè)堿基的短片段,采用NGS就能夠比較好的進(jìn)行檢測與分析,且成本也在逐漸下降。此外,通過一些間接技術(shù)手段,比如華大智造近期推出的stLFR測序12,也能夠在全基因組范圍內(nèi)提供基因組長片段信息,包括分型、突變及基因組結(jié)構(gòu)變異。
單分子測序技術(shù)從原理上具備潛力與優(yōu)勢,值得進(jìn)一步研發(fā)完善。但是未來能否達(dá)到預(yù)期的市場規(guī)模,甚至成為主流測序技術(shù),還需要經(jīng)過實(shí)踐檢驗(yàn)。技術(shù)發(fā)展代際內(nèi)的升級(jí)相對比較頻繁,而代際間的升級(jí)則相對緩慢,只有核心原理有創(chuàng)新并且跨越式超越前一代的技術(shù),也許才更適合被定義為新一代技術(shù)。
總之,目前測序技術(shù)代際劃分較為模糊,且測序技術(shù)目前仍處于快速發(fā)展中。其中,SANGER與 NGS均引領(lǐng)了基因組技術(shù)的革命,推動(dòng)了基因組學(xué)科技進(jìn)步。前者為人類基因計(jì)劃(HGP)做出了主要貢獻(xiàn),目前仍在是很多生物學(xué)與醫(yī)學(xué)實(shí)驗(yàn)室的常規(guī)技術(shù);后者則是當(dāng)前基因組研究與應(yīng)用的主流技術(shù),直接為基因組測序的廣泛應(yīng)用掃清了經(jīng)濟(jì)上的障礙,使其不僅能更好的服務(wù)于科研,也正在成為精準(zhǔn)醫(yī)學(xué)以及其他應(yīng)用領(lǐng)域的重要工具。單分子技術(shù)則是測序技術(shù)發(fā)展的重要方向,開始嶄露頭角,但成熟與完善尚需時(shí)日。以上這些測序技術(shù),均有各自的特點(diǎn),也有其適合的應(yīng)用范圍與應(yīng)用場景。
附筆:
寫這篇小文的初衷,是近期因?yàn)橛信笥烟岢鲞^此類問題,也有人常將測序技術(shù)類比IT技術(shù)的發(fā)展。因此在這里分享自己的觀點(diǎn),也期望與持不同意見的朋友交流探討。
特別感謝兩位曾經(jīng)參與過水稻基因組計(jì)劃等早期基因組大項(xiàng)目的同事張建國博士與李勝霆博士,在春節(jié)假期期間分享了各自的觀點(diǎn),并協(xié)助完善本文。
目前測序技術(shù)的代際劃分并沒有統(tǒng)一的認(rèn)定。即使一個(gè)人,其觀點(diǎn)也會(huì)隨時(shí)間與認(rèn)知的改變而發(fā)生某些變化。在2008年前后,我們單位的NGS平臺(tái)剛剛進(jìn)入規(guī)?;€(wěn)定運(yùn)行階段。也正是那個(gè)時(shí)候,出現(xiàn)了“三代技術(shù)”。業(yè)內(nèi)不少人都認(rèn)為這類單分子技術(shù)很快將取代NGS。但事實(shí)并非如此。我曾經(jīng)的觀點(diǎn)認(rèn)為單分子測序技術(shù)屬于三代技術(shù),而目前則傾向于將其歸入NGS。
關(guān)于測序技術(shù)的代際,可以看看IT的代際。百度上是這樣劃分的:第一代計(jì)算機(jī)被稱為電子管計(jì)算機(jī),第二代計(jì)算機(jī)被稱為晶體管計(jì)算機(jī),第三代計(jì)算機(jī)成為中小規(guī)模集成電路計(jì)算機(jī),第四代計(jì)算機(jī)成為大規(guī)模和超大規(guī)模集成電路計(jì)算機(jī),第五代計(jì)算機(jī),指具有人工智能的新一代計(jì)算機(jī)。IT的代際劃分主要源自技術(shù)原理的革新(第五代感覺主要是軟件上的革新),是認(rèn)識(shí)計(jì)算機(jī)發(fā)展史和技術(shù)原理的需要,具有客觀存在的價(jià)值。新一代在性能上全面超越前一代。
從認(rèn)識(shí)論的角度來講,大家習(xí)慣于根據(jù)技術(shù)劃分代際,代際升級(jí)代表了技術(shù)的演化。只有核心原理新并且跨越式超越前一代的技術(shù)才能被稱為新一代。新一代的出現(xiàn)首先是從技術(shù)原理上提出,有希望和潛力超越現(xiàn)有技術(shù),然后從商業(yè)角度宣傳,有一些最終行不通的被淘汰,能發(fā)展成熟超越前一代的才會(huì)真正成為新一代。也有可能方向是對的,但是技術(shù)暫時(shí)跟不上,會(huì)經(jīng)歷曲折的發(fā)展。這種代際認(rèn)識(shí)在回顧歷史的時(shí)候最清楚。

王威 博士
華大智造副總裁,醫(yī)學(xué)遺傳學(xué)研究員,科學(xué)技術(shù)委員會(huì)成員。
先后參與、負(fù)責(zé)完成“國際人類基因組單體型圖計(jì)劃中國卷”項(xiàng)目 (簡稱 HapMap 計(jì)劃) 北京區(qū)域的基因分型任務(wù)、第一個(gè)中國人基因組圖譜的繪制工作 (簡稱“炎黃一號(hào)”) 等多個(gè)重大科研項(xiàng)目。主要從事基因組醫(yī)學(xué)新技術(shù)開發(fā)、推廣與應(yīng)用。