藏族人對(duì)高海拔的適應(yīng)是研究現(xiàn)代人類進(jìn)化史上適應(yīng)的理想模型,因?yàn)槠洵h(huán)境控制的很好。在高海拔地區(qū),高原反應(yīng)(包括急性高山病、肺水腫和腦水腫等)較為常見,但藏族人群的患病率低于漢族人群,以往的研究主要集中在缺氧誘導(dǎo)因子(HIF)途徑上。然而,這種適應(yīng)性在種群規(guī)模上仍然不足。結(jié)構(gòu)變異(SVs)在基因組生物學(xué)功能和人類進(jìn)化適應(yīng)中扮演重要角色,可以影響遠(yuǎn)程基因調(diào)控、基因簇?cái)U(kuò)增和強(qiáng)效適應(yīng)性變化。然而,但人類基因中SV熱點(diǎn)的分布模式仍不完全清楚。
2023年12月,中國人民解放軍總醫(yī)院何昆侖教授團(tuán)隊(duì)在期刊Nature Communications(IF=16.6)發(fā)表題為《Structural variants involved in high-altitude adaptation detected using single-molecule long-read sequencing》的研究論文,該研究構(gòu)建了一個(gè)大規(guī)模的漢族和藏族人口的SV景觀,揭示了SVs藏族人對(duì)高海拔適應(yīng)的潛在作用。通過增強(qiáng)子報(bào)告基因,細(xì)胞敲除,DNA pull-down實(shí)驗(yàn),研究發(fā)現(xiàn)藏族基因特性的缺失破壞了超級(jí)增強(qiáng)子,并下調(diào)了EPAS1的表達(dá),揭示了基因調(diào)控回路重組在人類適應(yīng)中的作用。青蓮百奧為該研究提供了DNA pull-down質(zhì)譜檢測分析服務(wù)。
文章題目:Structural variants involved in high-altitude adaptation detected using single-molecule long-read sequencing
發(fā)表期刊:Nature Communications
影響因子:16.6
發(fā)表時(shí)間:2023年12月13日
發(fā)表單位:中國人民解放軍總醫(yī)院
樣本選擇:320例人血液(201例漢族和119例藏族)用于ONT長讀長測序;150例人血液(75例漢族和75例藏族,其中123例既測長讀長又測短讀長)用于短讀長測序。
實(shí)驗(yàn)技術(shù):單分子長讀長測序,短讀長測序,CRISPR/Cas9介導(dǎo)的基因敲除,RT-qPCR,DNA pull-down
這項(xiàng)研究使用了ONT(Oxford Nanopore Technologies)的PromethION平臺(tái)對(duì)201個(gè)漢族和119個(gè)藏族個(gè)體的基因組進(jìn)行了長讀長測序,平均覆蓋深度為20.24。每個(gè)樣本通過cuteSV,sniffles和nanovar調(diào)用的SVs,并使用dbSVmerge將320個(gè)SV調(diào)用合并成最終的漢族和藏族SV調(diào)用集。在漢族人群中檢測到了116,773個(gè)SVs,在藏族人群中檢測到了94,312個(gè)SVs,總共檢測到了136,257個(gè)SVs。這些SVs主要包括71,437個(gè)刪除、56,799個(gè)插入、7198個(gè)復(fù)制和823個(gè)反轉(zhuǎn),平均每個(gè)樣本包含19,272個(gè)SVs(圖1b)。在50%的樣本中,漢族和藏族種群中超過90%的SVs被捕獲,表明,樣本量足以描述漢族和藏族人群的SV景觀。
通過手動(dòng)驗(yàn)證、PCR驗(yàn)證和與其他平臺(tái)(如PacBio、HiFi)的結(jié)果進(jìn)行比較,來驗(yàn)證SV調(diào)用集的質(zhì)量,結(jié)果顯示,他們的SV調(diào)用集具有高質(zhì)量。結(jié)果還顯示,長讀長測序平臺(tái)在處理具有GC偏向性的基因組區(qū)域時(shí)也表現(xiàn)良好。與NGS相比,ONT平臺(tái)在GC含量較高的區(qū)域中檢測到了更多的SVs。最后,將SV調(diào)用集與其他公共SV集進(jìn)行了比較,發(fā)現(xiàn)該研究擴(kuò)展了東亞人群的SV調(diào)用集,增加了約43%的新SVs。此外,該研究還貢獻(xiàn)了42,261個(gè)新的全局SVs,其中包括11,137個(gè)藏族特有的SVs和20,571個(gè)漢族特有的SVs。
總的來說,這項(xiàng)研究為漢族和藏族人群提供了高質(zhì)量的SV調(diào)用集。
圖1:119例藏族樣本和201例漢族樣本中SV的發(fā)現(xiàn)
SVs主要分布在重復(fù)區(qū)域(約67%在重復(fù)區(qū)域),如轉(zhuǎn)座子和衛(wèi)星重復(fù)區(qū)域。這可能是因?yàn)橹貜?fù)區(qū)域更容易發(fā)生非等位同源重組、復(fù)制滑脫和非同源末端連接等過程,導(dǎo)致SVs的產(chǎn)生。在各類重復(fù)元素中,SVs在SINEs、LINEs和LTRs中的分布比例分別為15%、8%和4%,而在衛(wèi)星重復(fù)區(qū)域和簡單重復(fù)中的比例分別為4%和21%(圖2a)。不同類型的SVs在各類重復(fù)和功能元素中的分布存在偏差。例如,刪除、插入和復(fù)制與SINEs和簡單重復(fù)相關(guān),而反轉(zhuǎn)則與LINEs、SINEs、簡單重復(fù)和LTRs相關(guān)。此外,SV的長度分布顯示了兩個(gè)明顯的峰值,分別位于約300bp(Alu)和約6kb(LINE)。SVs在基因組中的熱點(diǎn)區(qū)域也被揭示,這些熱點(diǎn)區(qū)域是SVs密度極高的區(qū)域,與其他區(qū)域相比,它們更容易發(fā)生SVs。例如,C7orf50區(qū)域就與大量的SVs相關(guān),表明這個(gè)區(qū)域容易發(fā)生DNA斷裂和SVs的形成。SVs與基因表達(dá)的調(diào)控密切相關(guān)。由于啟動(dòng)子和增強(qiáng)子與SINEs相關(guān),因此它們也與SINE相關(guān)的SVs相關(guān)。此外,刪除、復(fù)制、插入和SINE相關(guān)的SVs在調(diào)控基因轉(zhuǎn)錄方面比其他類型的SVs更為重要。
圖2 SV組成、長度頻率和染色質(zhì)分布
結(jié)構(gòu)變異是一種基因組的變異形式,可以作為區(qū)分不同人群的一個(gè)重要特征。研究發(fā)現(xiàn),漢族和藏族共同擁有74,828個(gè)SVs。通過主成分分析(PCA),漢族和藏族的SVs可以明顯區(qū)分。當(dāng)將PCA擴(kuò)展到1KGP數(shù)據(jù)庫中的其他人群(如非洲、美洲、東亞、歐洲和南亞人群)時(shí),發(fā)現(xiàn)漢族和藏族與東亞人群關(guān)系密切,而與其他人群距離較遠(yuǎn)。這表明藏族在遺傳上與漢族更接近,與其他人群相比,這兩個(gè)人群可能來源于一個(gè)共同的祖先(圖3a)。此外,通過混合分析和所有SVs的進(jìn)化樹分析,發(fā)現(xiàn)漢族和藏族在SVs上存在明顯的分離(圖3b)。層次聚類分析也顯示,漢族和藏族具有民族特異的SVs和共同的SVs?;谝睬宄仫@示了漢族和藏族之間的分離(圖3c)。
這些結(jié)果表明,除了單核苷酸多態(tài)性(SNPs)外,SVs也是區(qū)分遺傳上密切相關(guān)人群的一個(gè)穩(wěn)健的代表性特征。
圖3 漢族和藏族群體遺傳學(xué)
本文研究了藏族人適應(yīng)高海拔環(huán)境的基因組信號(hào),藏族人適應(yīng)高海拔環(huán)境的基因組信號(hào)是由SNPs、InDels和SVs協(xié)同作用所實(shí)現(xiàn)的。通過深度短讀長測序和長讀長測序數(shù)據(jù)的綜合分析,在EGLN1和EPAS1等基因區(qū)域中發(fā)現(xiàn)了明顯的進(jìn)化選擇信號(hào)。在藏漢人群的差異研究中,篩選了FST>0.1的SVs,發(fā)現(xiàn)了240個(gè)SVs,其中19個(gè)是新穎的,169個(gè)在藏族人中的頻率高于漢族人(圖4b)。這些SVs可能與高海拔適應(yīng)性相關(guān),特別是EGLN1基因中的一個(gè)插入物與先前報(bào)道的高海拔相關(guān)性一致。SVs可以通過改變順式調(diào)控電路來實(shí)現(xiàn)廣泛的遠(yuǎn)端調(diào)控,作者發(fā)現(xiàn)52%的SVs與增強(qiáng)子、沉默子或拓?fù)潢P(guān)聯(lián)域(TAD)邊界重疊,進(jìn)一步表明了SVs在調(diào)控網(wǎng)絡(luò)中的重要性。
深入研究了17個(gè)FST>0.2的SVs,包括3個(gè)新穎的SVs,這些SVs附近的蛋白編碼基因與缺氧反應(yīng)、炎癥、葡萄糖、脂質(zhì)和能量代謝、胰島素受體信號(hào)傳導(dǎo)、血液凝固和角蛋白絲等生物學(xué)特性有關(guān)。特別是dbsv66240 SV破壞了一個(gè)超級(jí)增強(qiáng)子,下調(diào)了EPAS1的表達(dá),這是藏族人中最強(qiáng)的特異性信號(hào),表明SVs在高海拔適應(yīng)性中的重要作用。這些結(jié)果表明,這個(gè)SV與這些SNPs和InDels協(xié)同作用,影響高海拔適應(yīng)性。此外,EPAS1和TMEM247在藏獒中也受到正向選擇,并顯示出不同的關(guān)聯(lián)信號(hào),表明它們都對(duì)適應(yīng)性有功能貢獻(xiàn)。
圖4 漢族、藏族種群比較揭示進(jìn)化適應(yīng)的遺傳景觀
研究了藏族人群體中的兩個(gè)特定結(jié)構(gòu)變異(SVs):dbsv66240的刪除和dbsv124029的插入,以及它們對(duì)生物學(xué)功能和適應(yīng)性的影響。研究發(fā)現(xiàn):dbsv6620刪除涉及基因調(diào)控增強(qiáng)子和啟動(dòng)子,可能在腎臟細(xì)胞中發(fā)揮順式調(diào)控作用,影響缺氧反應(yīng)相關(guān)基因的表達(dá),如EPAS1。該刪除還通過反式調(diào)控電路影響基因轉(zhuǎn)錄活性,改變了與轉(zhuǎn)錄因子結(jié)合的基因組區(qū)域,從而可能下調(diào)基因表達(dá)。通過DNA pull-down實(shí)驗(yàn),發(fā)現(xiàn)202個(gè)結(jié)合蛋白,包括轉(zhuǎn)錄因子、中介復(fù)合物和鋅指蛋白。GO分析顯示,與dbsv66240序列結(jié)合的蛋白質(zhì)主要富集在與轉(zhuǎn)錄共調(diào)節(jié)因子結(jié)合、轉(zhuǎn)錄共激活因子結(jié)合和DNA結(jié)合轉(zhuǎn)錄阻遏活性等分子功能相關(guān)的類別中。另一方面,dbsv124029插入與藏族人的長壽、睡眠質(zhì)量和情緒有關(guān),位于C7of50和ZFAND2A之間,且位于與失眠癥狀和舒張壓相關(guān)的遺傳區(qū)域內(nèi),并可能通過復(fù)雜的順式和反式調(diào)控電路影響相關(guān)基因的表達(dá)。這些發(fā)現(xiàn)表明,藏族人中最具特色的SVs通過重塑與高原適應(yīng)相關(guān)的基因表達(dá),對(duì)適應(yīng)性表型差異有所貢獻(xiàn)。研究還發(fā)現(xiàn)了與藏族人頭痛發(fā)生率、脂質(zhì)代謝、跟骨密度和出生體重相關(guān)的基因變異。例如,位于TIMD4基因內(nèi)含子中的一個(gè)變異可能會(huì)影響TIMD4的表達(dá),從而影響頭痛發(fā)生率,同時(shí)也與甘油三酯、低密度脂蛋白(LDL)膽固醇和總膽固醇水平有關(guān)。此外,研究還發(fā)現(xiàn)了一些功能不明的基因變異,這些變異可能與學(xué)習(xí)、發(fā)聲行為、突觸前組裝和自閉癥等相關(guān)。
這些發(fā)現(xiàn)揭示了藏族人通過基因變異來適應(yīng)高海拔地區(qū)的環(huán)境壓力,增進(jìn)了對(duì)人類適應(yīng)性進(jìn)化的理解,也提供了新的視角來研究其他復(fù)雜的人類性狀和疾病。
圖5 藏族高原適應(yīng)基因的進(jìn)化選擇
該研究通過對(duì)320例藏族和漢族樣本進(jìn)行長讀長測序,破譯結(jié)構(gòu)變異在高海拔適應(yīng)中的作用,發(fā)現(xiàn)基因間缺失通過破壞超級(jí)增強(qiáng)子來下調(diào)EPAS1的證據(jù)。
@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號(hào)