對(duì)于靶向測(cè)序數(shù)據(jù)的評(píng)估,覆蓋均一性是最為重要的參數(shù)之一,它決定了有多少目標(biāo)區(qū)域能夠達(dá)到分析要求,平均測(cè)序深度提高還不足以解決目標(biāo)測(cè)序區(qū)域能夠覆蓋的問(wèn)題,最終目標(biāo)區(qū)域的覆蓋情況還是取決于覆蓋均一性。
國(guó)產(chǎn)測(cè)序儀
均一性表現(xiàn)大大超出預(yù)期
通過(guò)華大智造DNBSEQ-T7測(cè)序平臺(tái)上進(jìn)行的大量測(cè)評(píng)工作,伯科生物科技有限公司(簡(jiǎn)稱(chēng)“伯科”)自主研發(fā)生產(chǎn)的全外顯子Panel,TargetCap? Core Exome Panel v3.0,性能表現(xiàn)已經(jīng)達(dá)到了國(guó)際一流產(chǎn)品標(biāo)準(zhǔn),尤其是在覆蓋均一性方面表現(xiàn)卓越。
華大智造DNBSEQ-T7基因測(cè)序儀
如圖1所示,在測(cè)序5Gb的情況下,Core Exome Panel v3.0與DNBSEQ-T7測(cè)序平臺(tái)的組合表現(xiàn),≥20x的區(qū)域已經(jīng)高達(dá)98.7%,大大超出了預(yù)期。

圖1. TargetCap? Core Exome Panel v3.0在不同測(cè)序深度下的均一性表現(xiàn)
覆蓋均一性決定了有多少目標(biāo)區(qū)域能夠達(dá)到分析要求。換言之,高均一性能夠減少測(cè)序數(shù)據(jù)量,節(jié)約成本(圖2A)。如圖2B所示,伯科TargetCap? Core Exome Panel v3.0與MGISEQ-2000測(cè)序平臺(tái)的組合表現(xiàn)出,當(dāng)測(cè)序7.5Gb時(shí)(101X),≥20X以上的目標(biāo)區(qū)域占比達(dá)到99.6%;當(dāng)測(cè)序5Gb時(shí)(68X), ≥20X以上的目標(biāo)區(qū)域占比仍然超過(guò)98%,遠(yuǎn)高于國(guó)標(biāo)《GB/T 37872-2019》規(guī)定的80%。
圖2. 高均一性可有效節(jié)約測(cè)序數(shù)據(jù)量
此外,伯科為用戶(hù)提供定制化基因Panel在華大智造測(cè)序平臺(tái)上面表現(xiàn)如表1所示,對(duì)于不同大小的基因Panel,在0.2x平均深度方面,可以達(dá)到99.5%以上,在0.5x平均深度可以達(dá)到95%以上,F(xiàn)old80可達(dá)1.4以下,總體上,定制基因Panel表現(xiàn)出極高的均一性。
表1. 伯科定制化基因Panel在華大智造測(cè)序平臺(tái)的性能表現(xiàn)
如此優(yōu)秀的均一性
國(guó)產(chǎn)panel是怎么做到的?
通過(guò)伯科的研發(fā)團(tuán)隊(duì)發(fā)現(xiàn),TargetCap? Core Exome Panel v3.0開(kāi)發(fā)中確實(shí)有一些“黑科技“。
2.1 獨(dú)創(chuàng)的局部探針濃度調(diào)整
在影響覆蓋均一性的因素中,目標(biāo)區(qū)域GC含量最為關(guān)鍵,通過(guò)對(duì)低/高GC區(qū)域的局部探針濃度調(diào)整可以?xún)?yōu)化Panel的覆蓋偏好。但是,除了GC含量,還有一個(gè)鮮為人知的關(guān)鍵因素-探針補(bǔ)償效應(yīng)。伯科研發(fā)團(tuán)隊(duì)對(duì)引起覆蓋偏好的因素進(jìn)行聚類(lèi)分析時(shí)發(fā)現(xiàn),目標(biāo)區(qū)域所覆蓋的探針數(shù)量的多少,與其覆蓋深度正相關(guān),也就是說(shuō)探針之間的側(cè)翼補(bǔ)償效應(yīng)會(huì)引起覆蓋偏好,其原理如圖3所示。

圖3. 探針側(cè)翼補(bǔ)償效應(yīng)產(chǎn)生覆蓋偏好示意圖
按照目標(biāo)區(qū)域覆蓋探針數(shù)量的多少,我們把目標(biāo)區(qū)域分為低、中、高補(bǔ)償區(qū)(L-FLK、M-FLK和H-FLK),以及低、中、高GC區(qū)域分別對(duì)~1.5萬(wàn)條探針組成的Panel進(jìn)行統(tǒng)計(jì)。
如圖4所示,目標(biāo)區(qū)域的覆蓋深度與其探針數(shù)量正相關(guān),也就是說(shuō),長(zhǎng)短不一的目標(biāo)區(qū)域會(huì)因覆蓋探針的多少而產(chǎn)生天然的深度差異,其與GC偏好一樣,是影響Panel覆蓋的重要因素。

圖4. GC含量和探針補(bǔ)償效應(yīng)對(duì)覆蓋深度的影響
那么,調(diào)整L/M/H-FLK這3種區(qū)域的局部探針濃度,能否改善Panel的覆蓋偏好呢?
為了驗(yàn)證這一假設(shè),研發(fā)人員合成了L/M/H-FLK區(qū)域探針不同濃度配比的Panel,并進(jìn)行捕獲測(cè)序。
如圖5所示,濃度配比2#的三個(gè)區(qū)域之間的覆蓋差異最小,數(shù)據(jù)表現(xiàn)也最優(yōu),與比例1#相比,F(xiàn)old 80降低0.1(SNP等位基因頻率并未受到影響),證明探針補(bǔ)償效應(yīng)也是影響覆蓋均一性的重要因素,調(diào)節(jié)補(bǔ)償效應(yīng)區(qū)域探針濃度是優(yōu)化Panel均一性的有效手段。

圖5. 調(diào)整不同探針補(bǔ)償區(qū)的探針配比對(duì)覆蓋均一性的影響
在此基礎(chǔ)之上,再對(duì)GC偏好區(qū)域的探針局部濃度進(jìn)行調(diào)整,也能使Fold80降低0.1,進(jìn)一步表明探針補(bǔ)償效應(yīng)是獨(dú)立于GC的覆蓋偏好影響因子(圖6)。

圖6. 調(diào)整不同GC含量目標(biāo)區(qū)域探針配比對(duì)覆蓋均一性的影響
綜上所述,針對(duì)覆蓋偏好的關(guān)鍵影響因子探針補(bǔ)償效應(yīng)和GC含量,調(diào)整對(duì)應(yīng)的探針濃度,可以明顯改善Panel的覆蓋均一性(圖7)。

圖7. 伯科生物自主研發(fā)的覆蓋偏好優(yōu)化技術(shù)原理示意圖
2.2 自主知識(shí)產(chǎn)權(quán)的生物素修飾
在WES Panel的開(kāi)發(fā)過(guò)程中,除了使用伯科獨(dú)創(chuàng)的局部探針濃度調(diào)整技術(shù),TargetCap? Core Exome Panel v3.0還采用伯科自主知識(shí)產(chǎn)權(quán)的專(zhuān)利生物素修飾。分別采用伯科自主知識(shí)產(chǎn)權(quán)的生物素與常規(guī)生物素分別制備Core Exome Panel v3.0,并進(jìn)行捕獲測(cè)序。
結(jié)果顯示,與常規(guī)生物素相比,伯科自主知識(shí)產(chǎn)權(quán)的生物素能夠進(jìn)一步提升覆蓋均一性(圖8)。除此之外,通過(guò)加入多種小分子化合物,伯科自主研發(fā)的雜交試劑能夠進(jìn)一步降低GC偏好。

圖8. 伯科生物素與常規(guī)生物素修飾的Core Exome Panel v3.0比較
綜上所述,從雜交試劑、探針修飾/合成/設(shè)計(jì)、探針局部濃度調(diào)整等多方面測(cè)試優(yōu)化調(diào)整,所謂“積跬步至千里“,每一步1%的提升積累,使得TargetCap? Core Exome Panel v3.0的覆蓋均一性在眾多競(jìng)品中脫穎而出。