圖1. 華大智造發(fā)布MGIEasy stLFR文庫制備試劑盒
2018年10月25日,第十三屆國際基因組學(xué)大會(簡稱“ICG-13”)在深圳隆重召開。華大智造同期舉行“基因組學(xué)技術(shù)與應(yīng)用研討會”,并在會上發(fā)布MGIEasy stLFR文庫制備試劑盒。MGIEasy stLFR文庫構(gòu)建試劑盒是世界范圍內(nèi)首款基于無分隔共標(biāo)記方法的長片段讀取試劑盒,該試劑盒利用高精度短讀序列獲得長距離信息,融匯二代三代測序技術(shù)之長,被譽(yù)為“完美的WGS建庫”。
該技術(shù)于2018年3月在國際人類基因組大會(Human Genome Meeting,簡稱HGM)正式發(fā)布,今年10月成功轉(zhuǎn)化為試劑盒產(chǎn)品并發(fā)布?;谌A大智造專利的DNA分子共標(biāo)簽技術(shù),即將來源于同一DNA長片段的短讀測序片段標(biāo)記上相同分子標(biāo)簽,stLFR實(shí)現(xiàn)了基于高精度短讀測序獲取長片段DNA信息 (圖2)。與華大智造世界領(lǐng)先的DNBseq?測序技術(shù)相結(jié)合,stLFR技術(shù)能夠?qū)崿F(xiàn)高質(zhì)量變異檢測,二倍體基因組定相,結(jié)構(gòu)變異解析及其他長讀長應(yīng)用。
為了讓用戶第一時(shí)間體驗(yàn)該技術(shù),華大智造招募首批試用客戶(可掃描文末二維碼申請)。相比傳統(tǒng)WGS文庫和其他同類產(chǎn)品,stLFR文庫僅需1 ng DNA且無需預(yù)擴(kuò)增即可獲得高質(zhì)量的全基因組測序文庫;二倍體定相區(qū)塊N50值可達(dá)10 Mb,有效檢出倒位、異位、刪除等結(jié)構(gòu)變異;單管無分隔反應(yīng),無需微量移液設(shè)備或復(fù)雜微流控系統(tǒng);全部反應(yīng)在磁珠上完成,易于高通量自動(dòng)化建庫。
圖2. stLFR技術(shù)原理示意圖。該技術(shù)從提取好的長片段DNA起始,將轉(zhuǎn)座子序列隨機(jī)插入至長片段DNA中,利用DNA雙鏈互補(bǔ)原理將該產(chǎn)物與帶有多拷貝分子標(biāo)簽的磁珠載體結(jié)合,在引入第二個(gè)接頭后進(jìn)行PCR擴(kuò)增,最終完成文庫構(gòu)建。
stLFR -數(shù)據(jù)表現(xiàn)
長片段讀取
利用DNA共標(biāo)記方法,MGIEasy stLFR試劑盒可以檢測分析DNA分子長度平均長度可達(dá)50-70 Kb,最大值可超過300 kb(圖3A)注1。不僅如此,得益于stLFR文庫超高的分子標(biāo)簽數(shù),超過85%的標(biāo)簽內(nèi)有且僅有一個(gè)DNA長分子(圖3B)注2,這賦予了stLFR文庫一些可以媲美單分子測序的數(shù)據(jù)特性。
注1:該數(shù)據(jù)表現(xiàn)決定于初始DNA提取長度。
注2:該數(shù)據(jù)表現(xiàn)決定于初始DNA投入量和DNA提取長度。
圖3. stLFR 長片段讀取特征。(A)片段長度分布。stLFR文庫可以檢測的DNA分子長度典型值一般為50 Kb左右,最長可達(dá)300 Kb。(B)每個(gè)標(biāo)簽內(nèi)的長片段數(shù)量分布。從1 ng DNA起始構(gòu)建stLFR文庫時(shí),約有85% 標(biāo)簽內(nèi)有且僅有一個(gè)DNA長分子。
覆蓋均勻性
從1 ng DNA起始,stLFR文庫即可獲得與使用100 ng DNA起始的常規(guī)全基因組測序文庫相當(dāng)?shù)幕蚪M覆蓋均勻性表現(xiàn)(圖4)。
圖4. stLFR 文庫測序深度均勻性。藍(lán)色實(shí)線為stLFR文庫,綠色虛線為100 ng起始的常規(guī)全基因組測序文庫,灰色虛線為理論預(yù)期深度分布(泊松分布),數(shù)據(jù)已均一化至30X覆蓋度。
SNP & InDel檢測
30X深度下,stLFR文庫SNP檢測陽性預(yù)測值(Positive predictive value, PPV)與靈敏度(Sensitivity)均可達(dá)到0.99以上,InDel檢測F值(F-measure)可達(dá)0.95,整體變異檢測表現(xiàn)達(dá)到相同深度的常規(guī)全基因組測序文庫表現(xiàn)的最佳水平(圖5)。
圖5. stLFR 文庫30X覆蓋度變異檢測能力評估。將stLFR檢測NA12878樣本的變異結(jié)果與Genome in a bottle(GIAB)提供的高置信區(qū)間檢測結(jié)果進(jìn)行比較,計(jì)算陽性預(yù)測值與靈敏度。
二倍體定相
利用共標(biāo)簽短讀序列,stLFR可以輕松獲得二倍體基因組上雜合位點(diǎn)定相信息,定相區(qū)塊N50值可達(dá)10 Mb以上(圖6)注3,可有效解析基因調(diào)控和編碼區(qū)變異組合。
注3: 該數(shù)據(jù)表現(xiàn)共同決定于初始DNA長度和測序深度。
圖6. stLFR 定相區(qū)塊在染色體上的分布情況。在40X深度下,stLFR文庫數(shù)據(jù)定相區(qū)塊N50值可達(dá)34 Mb,雜合位點(diǎn)定相比例高達(dá)99.7%
利用分子標(biāo)簽和長片段信息,stLFR可以對多種結(jié)構(gòu)變異進(jìn)行準(zhǔn)確檢測。圖7展示了stLFR對NA12878中已知的SV進(jìn)行檢測,檢出率達(dá)到100%。圖8展示了利用stLFR文庫分別對攜帶5號染色體和12號染色體平衡易位病人樣本(圖8A)和已知2號染色體染色體內(nèi)倒位的GM20759細(xì)胞系樣本(圖8B)進(jìn)行檢測的結(jié)果。
圖7. 對NA12878中已知的SV進(jìn)行檢測,檢出率能達(dá)到100%
圖8. stLFR 文庫結(jié)構(gòu)變異結(jié)果展示。(A)攜帶5號染色體和12號染色體平衡易位病人樣本的stLFR檢測的分子標(biāo)簽重疊熱度分布圖。(B)已知2號染色體染色體內(nèi)發(fā)生倒位的GM20759細(xì)胞系樣本分子標(biāo)簽重疊熱度分布圖。
stLFR變異檢測能力總結(jié)
古語有云,十年磨一劍。華大智造已經(jīng)投入了五年時(shí)間進(jìn)行stLFR技術(shù)的研發(fā),并且會繼續(xù)對該技術(shù)進(jìn)行優(yōu)化升級。更多基于stLFR的技術(shù),如二倍體從頭組裝等,也將陸續(xù)面世。希望在不遠(yuǎn)的將來,可以通過stLFR技術(shù)最終實(shí)現(xiàn)完美基因組測序。
什么是完美基因組?怎么獲得完美基因組?請持續(xù)關(guān)注MGI華大智造公眾號,稍后為您揭曉。
掃描下方二維碼,申請測試stLFR文庫制備試劑盒