作為一款軟硬件雙重加速的生信分析工具,MegaBOLT提供可視化界面,操作簡單便捷,可實現(xiàn)測序與分析的一站式全自動調(diào)度,無需人工發(fā)起計算任務(wù)。以MegaBOLT在WGS/WES生信分析和病原鑒定等方面的表現(xiàn)為例,本期回顧聚焦高通量測序分析的速度、精度和廣度。
分析速度:突破10倍-90倍的大幅提速
在Germline胚系變異檢測中,MegaBOLT僅需2小時即可完成30X的WGS數(shù)據(jù)分析,24分鐘完成400X的WES數(shù)據(jù)分析。相對于傳統(tǒng)的分析流程,MegaBOLT提速20倍以上。
在Somatic體細(xì)胞變異檢測中,MegaBOLT僅需5小時即可完成一對腫瘤細(xì)胞和正常細(xì)胞的WGS測序數(shù)據(jù)分析(測序深度:40X),42分鐘完成一對腫瘤細(xì)胞和正常細(xì)胞的WES測序數(shù)據(jù)分析(測序深度:400X)。相對于傳統(tǒng)的分析流程,MegaBOLT提速10倍以上。

特別地,針對超高通量測序平臺的分析需求,進(jìn)階版MegaBOLT——MegaBOLT-Pro僅需1天的時間就能完成高達(dá)6Tbp的WGS數(shù)據(jù)分析,滿負(fù)載的情況下一年可以完成1.7萬人的WGS數(shù)據(jù)分析。相對于傳統(tǒng)的分析流程,MegaBOLT-Pro提速近90倍。
測序精度:超過99%的INDEL和99.9%的SNP
結(jié)合谷歌公司開發(fā)的一款基于深度學(xué)習(xí)的變異檢測軟件DeepVariant,MegaBOLT集成了MegaBOLT-DV算法,在變異分析性能上更為精準(zhǔn)。通過對幾組不同數(shù)據(jù)量(20-200Gb)、不同建庫方法(PCR/PCR-Free/探針)和不同讀長(PE100/PE150)的下機數(shù)據(jù)進(jìn)行分析測試,這一結(jié)論得到了驗證:利用MegaBOLT-DV在SNP和INDEL的變異檢測性能方面具有顯著性優(yōu)勢。

此外,將PCR-free技術(shù)與MegaBOLT-DV相結(jié)合,15X WGS的數(shù)據(jù)分析可以達(dá)到SNP超過99.9%、INDEL超過99%的超高檢測精度,即在理論上達(dá)到了常規(guī)PCR建庫方法下30X WGS的分析效果,有助于節(jié)約測序成本。
應(yīng)用廣度:以病原快速鑒定系統(tǒng)為例
除了WGS/WES分析,MegaBOLT還可以集成多個特定領(lǐng)域應(yīng)用分析系統(tǒng),適用于遺傳病基因數(shù)據(jù)分析、腫瘤檢測及用藥研究和病原微生物宏基因組分析等。以病原快速鑒定系統(tǒng)為例,集成該系統(tǒng)的MegaBOLT能快速、準(zhǔn)確、全面地對原始樣本中的微生物進(jìn)行分類鑒定,并且自動出具分析結(jié)果,為感染性疾病的診療提供參考。

首先,在MegaBOLT內(nèi)置的病原快速鑒定系統(tǒng)中,收錄超過2萬種微生物做病原數(shù)據(jù)庫以及10余種常見動物參考基因組作為宿主數(shù)據(jù)庫。特別地,在該病原數(shù)據(jù)庫已添加新型冠狀病毒序列,可用于新冠病毒的快速鑒定。
其次,在MegaBOLT中集成的實驗室信息管理系統(tǒng)ZLIMS,為病原快速鑒定系統(tǒng)提供了一鍵生成網(wǎng)頁報告的功能,其中包括數(shù)據(jù)質(zhì)控、六大分類物種鑒定統(tǒng)計、毒力因子和耐藥因子鑒定。
最后,利用MegaBOLT及其病原快速鑒定系統(tǒng)已在多次疫情防控工作中發(fā)揮了重要作用。以某養(yǎng)殖基地的多只青山羊發(fā)生不明病原的感染為例,其主要癥狀為口唇出現(xiàn)膿包并結(jié)痂。該養(yǎng)殖基地將幾只病情較嚴(yán)重青山羊樣本的測序數(shù)據(jù)采用MegaBOLT(華大智造病原微生物產(chǎn)品組合的核心產(chǎn)品之一)進(jìn)行分析和組裝,分析結(jié)果表明:在送檢的DNA樣本中有64.2%、RNA樣本有44%,均檢測出Orf病毒;利用鑒定出的reads能夠組裝出Orf病毒基因組,然后將reads與組裝好的基因組進(jìn)行比對,比對率達(dá)到86.7%,平均覆蓋率為87.6%,平均測序深度為200X。
要點回顧
如有任何相關(guān)問題,可以發(fā)送郵件至: