近年來,大樣本低深度全基因組測序方法(low-coverage whole-genome sequencing,lcWGS)已從理論上證明能夠以極低的成本獲取全基因組高密度SNP標(biāo)記,進(jìn)而增加QTL定位的精度并更好地挖掘各類疾病的遺傳機(jī)制。近期中國農(nóng)業(yè)大學(xué)胡曉湘教授團(tuán)隊與華南農(nóng)業(yè)大學(xué)吳珍芳教授團(tuán)隊合作,基于MGISEQ-2000測序平臺,開發(fā)了畜禽全套低深度測序分析流程,并進(jìn)行豬重要經(jīng)濟(jì)性狀遺傳結(jié)構(gòu)的解析,研究成果以題為“Accelerated deciphering of the genetic architecture ofagricultural economic traits in pigs using a low-coverage whole-genomesequencing strategy ”發(fā)表在國際期刊 Gigascience (5-Year IF:7.715)。 該研究論證了低深度測序技術(shù)在沒有優(yōu)質(zhì)參考單倍型數(shù)據(jù)庫的畜禽物種中的高效高質(zhì)填充方法,解決了育種中重要的“卡脖子”問題,展示了在功能基因定位和重要經(jīng)濟(jì)性狀遺傳結(jié)構(gòu)解析中的巨大優(yōu)勢,為我國十四五規(guī)劃種業(yè)振興行動方案提供了完全自主知識產(chǎn)權(quán)的新型遺傳分析方法和育種理論依據(jù)。
研究方案設(shè)計
基于lcWGS的 BaseVar-STITCH分析流程性能評估
與15X重測序結(jié)果相比,基于低深度測序數(shù)據(jù)的BaseVar-STITCH分析流程可得到高準(zhǔn)確性基因型(R2 = 0.919, GC = 0.970) ,超過了基于GATK-Beagle分析流程結(jié)果(R2= 0.484, GC = 0.709) (圖2 A)。與GGP-80數(shù)據(jù)(SNP芯片)相比,BaseVar-STITCH結(jié)果顯示更高的GC一致性和R2值(R2 =0.997, GC = 0.990)(圖2 B)。此外,與BaseVar-STITCH數(shù)據(jù)相比,基于Fluidigm基因分型(16個位點(diǎn),191個個體),平均GC為0.991。綜上所述,BaseVar-STITCH流程是一種適用于lcWGS策略的變異檢測和基因填充的分析方法。
lcWGS測序深度可低至0.1x
基于0.5×WGS數(shù)據(jù)進(jìn)行STITCH分析,在樣本量>500時對結(jié)果影響不大。在0.1×WGS抽樣測序深度下,增加樣本量至1985可大幅提升分析結(jié)果(圖2 C和D)??傮w來說,隨著測序深度/樣本量的增加,結(jié)果持續(xù)改善,單個位點(diǎn)>200×的總測序深度可保證研究中基因型的可信度。
解析豬重要經(jīng)濟(jì)性狀遺傳結(jié)構(gòu)
研究對21個豬重要經(jīng)濟(jì)性狀進(jìn)行了全基因組關(guān)聯(lián)分析和遺傳結(jié)構(gòu)解析,并系統(tǒng)評估人工選擇在杜洛克豬育種過程中對基因組結(jié)構(gòu)產(chǎn)生的影響。對存在主效QTL的性狀,利用高密度標(biāo)記一步法鑒定到了影響豬乳頭數(shù)的候選主效基因ABCD4、背膘厚的候選主效基因HMGA1;對于遺傳力高但不存在主效基因的性狀,挖掘到了影響采食行為的重要神經(jīng)通路中大量微效基因,并清晰地展示了數(shù)量遺傳經(jīng)典的“無窮小模型”,為下一代基因組選育提供了理論基礎(chǔ);此外,本研究還發(fā)現(xiàn)該群體經(jīng)受長期人工選擇后,生長類性狀所表現(xiàn)出來的QTL固定、遺傳力丟失等顯著遺傳變化,證明了該父系群體生長性狀前期選育取得的顯著成效。
本次研究首次建立了適用于低深度測序的BaseVar-Stitch基因分型流程,以極低成本獲得了目前杜洛克豬最大群體 (2869頭) 的高密度SNP標(biāo)記集 (11.7M),用三種不同方法評估的分型準(zhǔn)確性均超過99%,證明了本研究創(chuàng)制的大樣本無參自我填充策略相較于傳統(tǒng)基于小樣本高深度數(shù)據(jù)填充,具有顯著先進(jìn)性。
研究產(chǎn)業(yè)轉(zhuǎn)化亮點(diǎn)
亮點(diǎn)一:基于lcWGS的基因分型SNP 數(shù)量高
大樣本低深度重測序展示出極高的基因分型準(zhǔn)確性(>99%),遠(yuǎn)高于傳統(tǒng)基于少量樣本高深度數(shù)據(jù)作為ref進(jìn)行填充的策略(86%-95%)。
在設(shè)計低深度重測序項目方案時,推薦樣本量應(yīng)>2000個,測序深度應(yīng)在0.4X-1X之間。
亮點(diǎn)三:基于lcWGS的基因分型周期快
lcWGS基因分型為大樣本量項目,因此研究團(tuán)隊不斷在優(yōu)化實驗和分析環(huán)節(jié)的大通量樣本的速度,通過在建庫環(huán)節(jié)引入自動化,在分析環(huán)節(jié)進(jìn)行加速,以進(jìn)一步降低測序和分析中的時間成本,加速項目周期,以契合產(chǎn)業(yè)化分子育種周期效益需求。
亮點(diǎn)四:基于lcWGS的基因分型成本低
中國農(nóng)業(yè)大學(xué)楊瑞飛博士、郭曉莉博士、博士研究生朱迪為本研究共同第一作者,中國農(nóng)業(yè)大學(xué)新進(jìn)教師王宇哲博士和華南農(nóng)業(yè)大學(xué)吳珍芳教授為本研究通訊作者,中國農(nóng)業(yè)大學(xué)胡曉湘教授為本研究資深作者。本研究受到國家轉(zhuǎn)基因重大專項 (2016ZX08009003-006),農(nóng)業(yè)部948計劃 (2012-G1(4)),廣東省重點(diǎn)領(lǐng)域研發(fā)計劃 (2019B020203002),廣東省院士工作站 (2011A090700016) 的支持。
華大智造助力中國分子育種平臺建設(shè)
華大智造致力于成為生命科技核心工具締造者,專注于生命科學(xué)與生物技術(shù)領(lǐng)域,為精準(zhǔn)醫(yī)療、精準(zhǔn)農(nóng)業(yè)和精準(zhǔn)健康等行業(yè)提供實時(Real Time)、全景(Whole Picture)、全生命周期(Life Long)的生命數(shù)字化設(shè)備和系統(tǒng)。
華大智造MGISEQ-200、MGISEQ-2000、DNBSEQ-T7不同通量測序儀可滿足分子育種應(yīng)用中企業(yè)、研究單位和政府機(jī)構(gòu)對不同檢測樣本量和檢測速度的需求,同時搭配MGISP-960自動化核酸提取和樣本文庫制備系統(tǒng),可進(jìn)一步較少人力和時間成本,加速產(chǎn)業(yè)化中分子育種周期。
參考資料:
[1]Yang R, Guo X, Zhu D, et al. Accelerated deciphering of the genetic architecture of agricultural economic traits in pigs using a low-coverage whole-genome sequencing strategy[J]. GigaScience, 2021, 10(7): giab048.