近日,華大智造宣布其CoolMPS測(cè)序產(chǎn)品將從今年4月份開始正式進(jìn)入美國(guó)市場(chǎng),并在剛結(jié)束不久的基因測(cè)序技術(shù)全球盛會(huì)AGBT上聯(lián)合多位海外科學(xué)家共同分享了基于DNBSEQ測(cè)序平臺(tái)上的CoolMPS?測(cè)序數(shù)據(jù),從理論到實(shí)踐綜合體現(xiàn)了華大智造DNBSEQ?的技術(shù)優(yōu)勢(shì)。
華大智造首席科學(xué)家Rade Drmanac博士在AGBT上發(fā)表演講
而在此之前,該技術(shù)已引發(fā)業(yè)界廣泛關(guān)注與討論,且有諸多境外平臺(tái)及媒體對(duì)其進(jìn)行探索與分析。例如,2月19日bioRxiv發(fā)表的預(yù)印文章[1]對(duì)華大智造CoolMPS?化學(xué)進(jìn)行了全面概述。緊接著,Omics! Omics!也刊發(fā)了相關(guān)文章。本文,我們將援引海外專家Keith Robison博士發(fā)表的評(píng)論文章,以專業(yè)人士第一人稱角度對(duì)該技術(shù)進(jìn)行深入解讀。
bioRxiv預(yù)印文章對(duì)華大智造CoolMPSTM化學(xué)進(jìn)行了全面概述
Illumina的合成測(cè)序平臺(tái)和QIAGEN已淘汰的平臺(tái),均使用了熒光標(biāo)記的可逆終止子。在理想情況下,熒光標(biāo)記可成為終止子的組成部分,然而由于空間位阻原因,往往難以實(shí)現(xiàn)。熒光標(biāo)記的可逆終止子,在去除熒光和可逆終止子之后,會(huì)在核苷酸上留下“疤痕”。目前,還沒有哪種化學(xué)能在去除熒光之后留下天然核苷酸,其“疤痕”會(huì)影響后續(xù)聚合。這種可逆終止子的化學(xué)合成很復(fù)雜,而且合成步驟越多,產(chǎn)量越低。華大智造CoolMPS?使用的是沒有熒光標(biāo)記的可逆終止子,它采用特定的抗體來檢測(cè)可逆終止子。我認(rèn)為華大智造在這方面具有一定的創(chuàng)新性,他們使用了天然堿基,并且最后成功篩選出了所需抗體,預(yù)印本詳細(xì)描述了這一篩選過程。
華大智造CoolMPS高通量測(cè)序試劑套裝
抗體標(biāo)記的優(yōu)勢(shì)
更亮
與標(biāo)記核苷酸相比,標(biāo)記抗體的顯著優(yōu)勢(shì)是:一個(gè)抗體可以標(biāo)記多個(gè)熒光分子。預(yù)印本描述了標(biāo)記抗體的亮度比標(biāo)記終止子的高3倍。
更多優(yōu)化空間
通過優(yōu)化不同條件來提高抗體結(jié)合化學(xué),比如通過蛋白工程方法來提高抗體的結(jié)合能力,或者在一個(gè)抗體上標(biāo)記更多熒光分子;還可以進(jìn)一步優(yōu)化各種反應(yīng)時(shí)間和緩沖液。
克服“疤痕”帶來的信號(hào)抑制
預(yù)印本介紹了標(biāo)記的可逆終止子產(chǎn)生的疤痕可能會(huì)對(duì)信號(hào)產(chǎn)生淬滅效應(yīng):如果上一個(gè)堿基是T, G信號(hào)就會(huì)被抑制,而CoolMPS?未見任何信號(hào)抑制。
數(shù)據(jù)表現(xiàn)
在測(cè)序測(cè)試中,華大智造使用DNA納米球(將滾環(huán)復(fù)制產(chǎn)生的DNA納米球作為測(cè)序模板)進(jìn)行了200個(gè)循環(huán)測(cè)序,這些DNA納米球由平均插入長(zhǎng)度為300bp的大腸桿菌文庫制成。預(yù)印本中的曲線圖顯示了信號(hào)隨循環(huán)數(shù)的增加而衰減,以及位置不一致性,即信號(hào)中與參考?jí)A基相比較的噪聲量。他們將大部分位置不一致性的原因歸結(jié)于異相信號(hào)與染料串?dāng)_相混淆以及信號(hào)丟失,特別是在拷貝數(shù)少的DNA納米球中。最終,經(jīng)過200個(gè)循環(huán)測(cè)試后,總信號(hào)的30%是-1或+1的異相信號(hào)。奇怪的是,圖例中注釋顯示,在185循環(huán)之后,不一致性急劇增長(zhǎng),可能是由于插入片段短或者測(cè)到接頭序列造成的。對(duì)于該測(cè)試,應(yīng)使用與插入片段大小控制更佳的文庫,或特定插入片段的文庫,這樣才能準(zhǔn)確測(cè)量這一重要參數(shù)。
在PCR-free的大腸桿菌文庫中使用了100bp讀長(zhǎng)來進(jìn)行總體準(zhǔn)確性測(cè)試。由于DNA納米球不涉及PCR,而Illumina的模板準(zhǔn)備會(huì)涉及,他們強(qiáng)調(diào)PCR可能存在錯(cuò)誤。從流體學(xué)、光學(xué)和DNA納米球的尺寸方面挑選出陣列的最佳區(qū)域,他們發(fā)現(xiàn)總體不一致性為0.029%,phred質(zhì)量評(píng)分為20分或更高的堿基錯(cuò)誤率為1/20,000,即phred 43。
信號(hào)更強(qiáng)的好處是測(cè)序的數(shù)據(jù)質(zhì)量更高,即使DNA納米球的拷貝數(shù)低,也能得到明亮的信號(hào)。為了驗(yàn)證這一點(diǎn),他們使用了含400bp平均插入片段的文庫,該文庫在10分鐘滾環(huán)復(fù)制反應(yīng)中大約生成了50個(gè)拷貝,錯(cuò)誤率為0.055%。
優(yōu)化測(cè)序策略:雙端及長(zhǎng)讀長(zhǎng)
華大智造設(shè)計(jì)了雙端測(cè)序策略。標(biāo)準(zhǔn)的DNA納米球是一條鏈的許多拷貝,它們由滾換擴(kuò)增機(jī)制實(shí)現(xiàn)。對(duì)于雙末端測(cè)序,MDA反應(yīng)使用引物產(chǎn)生互補(bǔ)鏈,聚合酶將產(chǎn)生許多個(gè)這樣的鏈,以超支化幾何形式掛在原來的DNA納米球上。
在2x100測(cè)試中,二鏈信號(hào)明顯減弱,準(zhǔn)確性也有所下降,但仍可以產(chǎn)生比對(duì)率高于99%的可用數(shù)據(jù)。如果華大智造將測(cè)得的數(shù)據(jù)上傳到第三方進(jìn)行分析,就非常有價(jià)值了。缺少這樣的數(shù)據(jù)集是該預(yù)印本的重大遺憾。
華大智造嘗試的另一個(gè)方向是對(duì)合成測(cè)序系統(tǒng)進(jìn)行超長(zhǎng)讀?。篠E400 400個(gè)堿基的單端測(cè)序。如今在PacBio和牛津納米孔時(shí)代,雖然SE400不算長(zhǎng),但比Illumina或Ion Torrent提供的都長(zhǎng)——盡管454確實(shí)有1kb的試劑盒(據(jù)我了解,只有一小部分有那么長(zhǎng))。91%的堿基是Q30。同樣,如果能下載這些數(shù)據(jù)集是非常有用的,我不喜歡任何現(xiàn)成的統(tǒng)計(jì)數(shù)據(jù)。有趣的是,在300個(gè)堿基之后,預(yù)計(jì)只有30個(gè)模板拷貝給出正確信號(hào),如果給定更多初始模板拷貝的話情況會(huì)更好,當(dāng)增加每個(gè)DNB的模板拷貝數(shù),更好的標(biāo)記,解決異相位合成及信號(hào)丟失問題,則可以達(dá)到500甚至700個(gè)堿基。
華大智造MGISEQ-2000測(cè)序平臺(tái)(DNBSEQ-G400)
使用2-color成像進(jìn)行4-color測(cè)序
在很長(zhǎng)一段時(shí)間內(nèi),Illumina大多數(shù)儀器都使用的是2-color成像,其成像時(shí)間更短,但使用的是沒有任何標(biāo)記的G堿基。因此,NextSeq和NovaSeq測(cè)序儀的數(shù)據(jù)有時(shí)需要長(zhǎng)時(shí)間進(jìn)行G堿基運(yùn)行,這意味著長(zhǎng)時(shí)間無信號(hào)運(yùn)行。
據(jù)我了解,華大智造在讀取信號(hào)時(shí)可以簡(jiǎn)單地使用兩輪標(biāo)記法,分組讀取兩個(gè)堿基。除了硬件簡(jiǎn)單之外,其另一個(gè)優(yōu)勢(shì)是可以挑選由現(xiàn)有成像儀器實(shí)現(xiàn)最佳分離的兩種染料。此外,兩種染料可以很好地分離,省去了昂貴的帶通過濾器,這也意味著來自熒光的信號(hào)不會(huì)被過濾器過濾掉。華大智造將這種方法稱為“兩色成像上的四色CoolMPS”或4cs2ci,其標(biāo)準(zhǔn)為4cs4ci。對(duì)于2-color模式,首先檢測(cè)嘌呤A和G,洗脫后檢測(cè)嘧啶C和T。
將4cs4ci和4cs2ci生成的數(shù)據(jù)進(jìn)行比較,我們發(fā)現(xiàn)使用2-color模式過濾后的reads略多??傮w測(cè)序的出錯(cuò)率平均降低了5.1倍(讀T時(shí),出錯(cuò)率降低1.7倍;讀G時(shí),出錯(cuò)率降低18.6倍)。從12個(gè)可能的miscall中挑出4個(gè)來看,從G到C的錯(cuò)誤減少了52.2倍,希望已包含完整的12種miscall模式。
總結(jié)
在該pre-print最后,有一個(gè)表格總結(jié)了CoolMPS和DNBSEQ平臺(tái)上CoolMPS相對(duì)于其他方法的所有優(yōu)勢(shì)(如下表)。未標(biāo)記的核苷酸具有較低的合成成本、較高的合成率和較少的疤痕干擾??贵w檢測(cè)可以實(shí)現(xiàn)更高強(qiáng)度的標(biāo)記,更少的DNA光損傷,因?yàn)闃?biāo)記離得更遠(yuǎn),以及上面提到的兩種顏色方法的優(yōu)點(diǎn)。
其次是DNBSEQ:PCR-free,且沒有barcode交換, 高密度的200nm DNB,每個(gè)spot的高密度帶來成像優(yōu)勢(shì),以及該pre-print中并未探索的”超過90%的DNB在加載時(shí)不會(huì)出現(xiàn)overloading”,因此可以實(shí)現(xiàn)DNA低投入。
在該部分測(cè)試中,華大智造指出,低拷貝DNB的強(qiáng)信號(hào)表明可以產(chǎn)生更小的DNB,每張載片能得到更緊密堆積和更多亮點(diǎn)。此外,還可以用多種染料來標(biāo)記抗體,且需要具有這兩種染料正確signature的basecall。
我看到華大智造還展示了2個(gè)光通道上的4種顏色明顯延伸到1個(gè)光通道上的4種顏色。據(jù)推測(cè),這將用于其正在開發(fā)的DNBSEQ E系列便攜式測(cè)序系統(tǒng)。
我希望后續(xù)能與華大智造的技術(shù)專家們進(jìn)行更多交流。
參考鏈接:
[1]doi:https://doi.org/10.1101/2019.12.20.885517
[2]http://omicsomics.blogspot.com/2020/02/coolmps-revealed.html