大腦是哺乳動物體內最復雜的器官,具有多種多樣的生理機能,錯綜復雜的細胞結構以及極為豐富的基因表達。在不同腦區(qū)、細胞和亞細胞層面鑒定大腦的分子構成,必將推進我們對正常和患病狀態(tài)下大腦功能的認識和理解。
美國時間3月5日,由卡羅林斯卡學院、瑞典皇家理工學院和華大等團隊共同完成的一項題目為“人類、豬、小鼠大腦中的蛋白編碼基因圖譜”的研究發(fā)表于Science(影響因子41)。該研究基于多種轉錄組學方法和抗體圖譜技術,對大腦不同區(qū)域進行了全面、深入的分子解析,并且提供了高質量的蛋白編碼基因的分子圖譜,為進一步研究提供了有力的武器。
人類蛋白圖譜(The Human Protein Atlas,HPA)是一個大規(guī)模研究項目,旨在結合轉錄組學與蛋白組學,探索不同細胞、組織和器官的轉錄本和蛋白質的空間表達水平。目前,HPA下的組織圖譜(The Tissue Atlas)僅僅包含有限的幾個人類大腦區(qū)域(大腦皮層、海馬、尾狀核和小腦)的數(shù)據。正因如此,我們迫切需要更加深入的研究,從而增進對于中樞神經系統(tǒng)的細胞動力學背后復雜的分子過程的理解。
該研究成功地構建了哺乳動物大腦的基因圖譜,是對現(xiàn)有的若干個大腦圖譜項目的重要補充。為了確定大腦在不同系統(tǒng)發(fā)育順序上的差異和相似性,研究涵蓋了三個物種的表達譜:靈長類動物(人),偶蹄目(豬)和嚙齒目動物(小鼠)。研究的重要部分之一是將蛋白圖譜和轉錄組數(shù)據相結合,對小鼠大腦多個區(qū)域的特定蛋白進行了深入研究。所有數(shù)據——包括高分辨率圖像和元數(shù)據——全部公開以便后續(xù)研究。
研究團隊首先對GTEx、CAGE和HPA數(shù)據庫的人轉錄組數(shù)據,以及豬和小鼠的轉錄組數(shù)據進行了歸一化,從而消除批次效應,便于進行比較分析。團隊利用UMAP(The Uniform Manifold Approximation and Projection,一種降維算法)分析不同腦區(qū)間的基因表達模式,并借助現(xiàn)有的HPA腦圖譜數(shù)據,將豬和小鼠的轉錄組數(shù)據一對一地對應到人的同源基因上。三個物種的大腦均被劃分成10個區(qū)域,分別是嗅球、大腦皮質、海馬體、杏仁核、基底核、下丘腦、丘腦、中腦、腦橋和延髓,以及小腦。聚類結果顯示,三個物種的腦干區(qū)(中腦、丘腦、腦橋和延髓)的基因表達較為接近,與下丘腦的差異也較小,而大腦皮質、海馬體和杏仁核互相之間更為接近。為了確定不同腦區(qū)的分子特征,研究團隊根據基因表達特異性進行了分類。在三個物種中,小腦都是包含最多特異性上調基因的腦區(qū)。為了進一步分析不同物種間上調基因的差異,研究人員按大腦結構進行了劃分:大腦、下丘腦、腦干和小腦。圍繞這些上調的基因,分層樹分析支持了先前的大腦結構理論,下丘腦和小腦被聚類到了一起,與此同時腦干和大腦也聚類到一起。
圖1.三個物種不同腦區(qū)的基因表達特征
研究團隊鑒定出537個不同腦區(qū)高表達的基因,包括人們較為熟知的甘丙肽、催產素、加壓素編碼基因(下丘腦),TBR1, SATB2和NEUROD6等轉錄因子(大腦),Hox基因(腦干)等,也有一些高表達基因的功能尚待進一步的探索。對這些基因的表達進行物種間的比較帶來了許多新發(fā)現(xiàn),比如,由中間神經元細胞表達的轉錄因子TFAP2B在三個物種間有著相似的表達,而促泌素(secretagogin,SCGN),一種在嗅球中表達的鈣結合蛋白,在人小腦的星狀細胞中也有表達,而在豬和小鼠中則沒有。這些差異表達基因可能與大腦的某些功能相關聯(lián)。
圖2.物種間的基因表達比較
大腦功能的實現(xiàn)有賴于不同類型的、具有不同“化學表型”的神經元構成的復雜回路。研究人員分析了三個物種細胞識別基因的分布情況,包括:1053個轉錄因子;與神經遞質生成、運輸和清除相關的63個相關基因;以及118個已知的神經遞質和神經肽的受體的基因。某些轉錄因子在物種間是高度保守的,如EMX1和BHLHE22。而某些則在物種間差異較大,如NEUROD1作為小鼠小腦發(fā)育的關鍵基因之一,不僅在小腦,而且在豬和小鼠的視網膜細胞中也有表達,人視網膜細胞則沒有。
圍繞神經遞質產生和運輸?shù)南嚓P基因,研究人員發(fā)現(xiàn)負責合成神經遞質的酶在三個物種的分布較為相似,體現(xiàn)出哺乳動物大腦構成的保守性,而少數(shù)例外情況,也即不同物種間的差異,可能會為神經藥理學研究提供一些線索。比如和目前至少30%處方藥的作用機制密切相關的G蛋白偶聯(lián)受體(GPCRs)的相關基因,在三個物種間的表達模式存在差異,因此在新藥研發(fā)的動物實驗中應該加以考慮。
圖3.哺乳動物大腦中細胞識別基因的表達譜
研究人員對大腦相對于全身其他組織/器官的基因表達進行了比較分析,分為腦組織上調基因、其他組織上調基因和低組織特異性基因。對于公認的420個神經元、星形膠質細胞、少突膠質細胞和小膠質細胞的特征基因(signature gene)的分析表明,這些基因在其他組織也可能有高表達,在相關的研究中應該采取更為全面與整體性的視角。
圖4.大腦中特征基因在全身各組織的表達
總而言之,該研究結合轉錄組學、蛋白圖譜等多維度數(shù)據,對人、豬、小鼠腦中的編碼基因進行了深入、細致的解析。人類大腦圖譜(Human Brain Atlas,http://www.proteinatlas.org/brain)的構建,將為全世界研究者提供更為豐富的數(shù)據資源,以利于對哺乳動物大腦的基因組學研究和進一步探索。
附
華大智造測序平臺
本項研究基于華大智造MGISEQ-2000和BGISEQ-500測序平臺完成。據悉,MGISEQ-2000是華大智造基因測序儀的主力機型,單機運行數(shù)據產出達75-1440GB, 支持多種讀長,滿負荷PE150最快僅需38小時,支持科研、醫(yī)學臨床、司法、農業(yè)等領域應用。
華大智造MGISEQ-2000測序平臺
該測序儀以華大智造獨有的DNBSEQTM技術為核心,是一款全面靈活型的大通量測序平臺,可靈活支持多種不同的測序模式,能在較短時間內完成完整的測序流程。其數(shù)據產出具有高準確性、低重復序列率和低標簽跳躍的優(yōu)勢(MGISEQ-2000在部分海外國家產品名稱切換為DNBSEQ-G400)。