stLFR以其強大的虛擬隔離共標(biāo)記技術(shù)(Virtual Co-Barcoding),通過單管操作就能輕松的獲得基因組長片段信息。為了能高效的利用龐大的barcode信息,華大智造生信開發(fā)團(tuán)隊針對stLFR數(shù)據(jù)結(jié)構(gòu)特點開發(fā)一款全新、自動化的stLFR數(shù)據(jù)分析工具。免費獲取方式為:https://github.com/MGI-tech-bioinformatics/stLFR_v1.1。
圖1. stLFR數(shù)據(jù)分析工具示意圖。
(從下機數(shù)據(jù)開始,依次進(jìn)行barcode拆分、低質(zhì)量數(shù)據(jù)過濾、基因組比對、SNP/INDEL檢測、單倍體組裝、CNV檢測和SV檢測,最終得到stLFR數(shù)據(jù)報告)
數(shù)據(jù)展示
通過對2個NA12878數(shù)據(jù)結(jié)果來介紹stLFR數(shù)據(jù)分析工具的報告內(nèi)容,詳細(xì)展示工具能提供什么結(jié)果。
Co-Barcode聚類分析
利用DNA分子共標(biāo)簽技術(shù),華大智造stLFR文庫制備試劑盒能獲取較好的長片段文庫。那么在實際stLFR數(shù)據(jù)中的表現(xiàn)將通過三個圖表展示。
圖2. stLFR數(shù)據(jù)的barcode分布、覆蓋。
每個barcode連接的片段數(shù)目(a, b)、每個片段的覆蓋度(c, d)、每個片段的長度分布(e, f)
圖3. stLFR數(shù)據(jù)深度覆蓋、插入片段、GC bias示意圖。
stLFR數(shù)據(jù)深度分布圖(a)、累積深度分布圖(b)、插入片段分布圖(c)及GC bias示意圖(d)。
單倍體組裝
作為stLFR技術(shù)的重點之一,工具使用HapCUT2軟件進(jìn)行單倍體組裝分析,得到較好的基因組組裝結(jié)果。兩個stLFR樣品的單倍體組裝的最大N50達(dá)到15M,phasing rate在99%+。