科技創(chuàng)新不能等待,春節(jié)期間,深圳華大生命科學(xué)研究院一項(xiàng)萬人級(jí)全基因組科研項(xiàng)目依托新型計(jì)算技術(shù)加速完成。該項(xiàng)目通過華大智造ZTRON平臺(tái),對(duì)總計(jì)超過1.2Pbp的高深度全基因組測(cè)序(WGS)數(shù)據(jù)進(jìn)行了ZBOLT計(jì)算分析加速,完成了基因組比對(duì)及變異檢測(cè)分析,集中處理了超過2.5PB數(shù)據(jù),比經(jīng)典計(jì)算方案提速近300倍。

核心技術(shù)的自主可控帶動(dòng)測(cè)序成本不斷下降,華大智造自主研發(fā)的高質(zhì)量、高通量的DNBSEQTM測(cè)序技術(shù)極大地促進(jìn)了國(guó)家基因組計(jì)劃在內(nèi)的大規(guī)模人群基因組研究與應(yīng)用。海量基因組數(shù)據(jù)的分析處理需要高性能計(jì)算的加持,為科學(xué)家和臨床專家提供準(zhǔn)確、高效、可靠的計(jì)算分析平臺(tái)支持。
“非常驚喜地看到如此海量的數(shù)據(jù)分析工作,依托華大智造ZTRON平臺(tái)僅用10天左右就完成了,這極大地加速了課題的進(jìn)度,為我們理解重大疾病的遺傳機(jī)制提供了有力的支撐。同時(shí),本地部署、封閉計(jì)算的模式也最大程度確保了數(shù)據(jù)的安全。”華大研究院群體基因組方向的首席科學(xué)家金鑫博士表示。
華大智造ZTRON平臺(tái)于2020年推出,集成了自主研發(fā)的生信分析加速器ZBOLT,自動(dòng)化資源調(diào)度平臺(tái),高性能存儲(chǔ)及數(shù)據(jù)管理系統(tǒng),提供每年每U高達(dá)2Pbp WGS生信分析加速能力,較傳統(tǒng)分析方式加速300倍以上,存儲(chǔ)每U高達(dá)0.48PB存儲(chǔ)裸容量及多路100Gb/s的網(wǎng)絡(luò)數(shù)據(jù)傳輸,大大加速了大型群體基因組數(shù)據(jù)的處理能力。同時(shí),平臺(tái)采用本地化部署,基于CRC32循環(huán)校驗(yàn)機(jī)制以及磁盤冗余陣列數(shù)據(jù)保護(hù)模式,有效地保障了數(shù)據(jù)傳輸和存儲(chǔ)的安全性。
針對(duì)該項(xiàng)目分析需要,華大智造ZTRON平臺(tái)提供了5.2PB可用容量的高性能基因數(shù)據(jù)存儲(chǔ),基于大型群體基因組數(shù)據(jù)文件特點(diǎn)實(shí)現(xiàn)性能的調(diào)優(yōu),實(shí)現(xiàn)了單節(jié)點(diǎn)帶寬在10GB/s以上和多節(jié)點(diǎn)水平擴(kuò)展,有力保障項(xiàng)目的分析工作,并支撐了大型群體基因組數(shù)據(jù)的存儲(chǔ)。
華大智造ZTRON平臺(tái)
目前,華大智造ZTRON平臺(tái)已在全球范圍內(nèi)支持了十余個(gè)大型人群基因組項(xiàng)目的測(cè)序分析和數(shù)據(jù)管理工作,在基因數(shù)據(jù)存儲(chǔ)、計(jì)算和管理等方面的表現(xiàn)可圈可點(diǎn),具備充分的實(shí)力在未來支持更多科研項(xiàng)目的展開。
*該課題所涉及的數(shù)據(jù)已通過嚴(yán)格的倫理審批,并獲得了科技部人類遺傳資源辦公室的批準(zhǔn)。