人精子ChIP-seq和DNA甲基化WGBS揭示與生育和發育相關重疊區域
瀏覽次數:522 發布日期:2023-11-30
來源:本站 僅供參考,謝絕轉載,否則責任自負
目前,六分之一的夫婦患有不孕不育,其中多達一半的病例由男性因素引起,在過去的40年中,精子數量下降了50%。盡管導致精子質量和數量下降的因素知之甚少,但環境-表觀基因組相互作用是可能的。暴露于有毒物質、飲食和 BMI 升高與精子表觀基因組變化和男性臨床人群的生育能力降低有關。然而,這些研究的重點主要集中在DNA甲基化水平上,而對染色質與精子中DNA甲基化之間相關性知之甚少。父系不良環境暴露與不孕不育和不良結果相關,這種作用可能通過精子的組蛋白修飾傳遞。到目前為止,對男性精子染色質的深入分析還很有限。
2021年7月20日,加拿大麥吉爾大學Vanessa Dumeaux和Sarah Kimmins團隊在《Cell Reports》雜志發表題為“Whole-genome sequencing of H3K4me3 and DNA methylation in human sperm reveals regions of overlap linked to fertility and development”的研究論文,該研究以男性精子樣本為對象,通過ChIP-seq和WGBS等技術研究了 H3K4me3 在精子中的位點及其與相同樣本中精子 DNA 甲基化譜的關系。

標題:Whole-genome sequencing of H3K4me3 and DNA methylation in human sperm reveals regions of overlap linked to fertility and development(人類精子中H3K4me3和DNA甲基化的全基因組測序揭示了與生育和發育相關的重疊區域)
時間:2021-7-20
期刊:Cell Reports
影響因子:8.8
技術平臺:ChIP-seq、WGBS等
研究摘要:
本研究使用深度測序來表征37名男性代表性參考群體中精子的組蛋白H3賴氨酸4三甲基化(H3K4me3)和DNA甲基化圖譜。分析結果表明,H3K4me3靶向全基因組和生育和發育相關基因。在原始生殖細胞、胚胎增強子和短穿插核元件(short-interspersed nuclear elements,SINEs)中逃避表觀遺傳重編程區域也表現出富集。H3K4me3和DNA甲基化在全基因組中存在顯著重疊,表明這些標記之間存在潛在的相互作用,而此前報道的這些標記在精子中互斥。精子中H3K4me3標記區域與胚胎轉錄組的比較分析表明,父本染色質對胚胎基因表達有影響。
研究要點
- 深度測序鑒定人類精子中攜帶H3K4me3的區域
- H3K4me3廣泛分布于基因組中,在啟動子和SINE處富集
- 精子H3K4me3標記發育基因并與胚胎基因表達相關
- 除了DNA低甲基化位點外,H3K4me3還與高甲基化區域重疊

研究摘要
研究結果:
圖1:H3K4me3在人類精子的CpG區域、啟動子區和SINE區富集
從30名男性的精子中制備樣本上進行H3K4me3的ChIP-seq,使用MACS2來命名peaks。
- 基于基因組和CpG注釋以及重復元件和低復雜性DNA序列重疊的H3K4me3 peaks位點。從Bioconductor軟件包annotatr (Cavalcante and Sartor, 2017)和RepeatMasker (http://www.repeatmasker.org/)中獲得注釋。不同注釋之間peaks重疊通過連接節點來表示,重疊peaks數量顯示在它們上方條形圖上,顯示前10個重疊。
- 每個特定注釋的H3K4me3 peaks富集。通過使用Bioconductor封裝區域器(Gel et al., 2016)確定Z分數來表示陽性和陰性富集。對于所有顯示的注釋,通過排列測試,p < 0.001。
- 每次重復注釋的H3K4me3 peaks富集;排列檢驗P < 0.001。
D-E. 箱形圖顯示精子中啟動子不攜帶H3K4me3的基因表達水平,在位于CpG缺失區域或CpG富集區的啟動子上標記了H3K4me3,以及在精子發生(D)和發育©期間啟動子與SINEs、低復雜性重復或hESCs增強子重疊。轉錄水平是基于表達為精原干細胞(SSCs)、精原細胞(有絲分裂期)、精母細胞(減數分裂)和精子細胞(精子發生)中精子發生的TPM轉錄本豐度或為發育繪制的RPKM片段的千堿基reads來可視化的。P值由成對Wilcoxon秩和檢驗確定,多重檢驗采用Benjamini-Hochberg校正。NS表示調整后的p值不顯著。*調整后p< 0.05, * * *調整后p < 0.001。
(2)SINE、低復雜性重復序列或胚胎增強子的攜帶H3K4me3啟動子與不同的胚胎過程有關

圖2:精子H3K4me3 peaks與CpG富集區、重復元件和hESC增強子之間的重疊
(A-F)基因組瀏覽器快照顯示參考基因組的ChIP-seq軌跡(藍色)、MACS2 calling的H3K4me3 peaks值(深藍色框)、CpG島位點軌跡(紅色框,UCSC)、GC百分比熱圖(藍色,低GC百分比;白色,50%GC;紅色,高GC百分比)、SINE位點(深灰色框)、低復雜性重復序列(深紫色框),LINE位點(紫色框)(從RepeatMasker獲得)和hESC增強子的位置(淺藍色框)。H3K4me3與這些元件中的每一個重疊是RNA介導的基因沉默AGO4(A)的Argonaute基因家族成員,編碼微管蛋白亞型TUBA4A和TUBA4B(B)的兩個基因,輔助雙鏈斷裂修復RAD51(C)的基因,發育基因ID4(D)和SOX11(E),以及最后對于隨機基因間區域(F)進行了說明。
(3)H3K4me3 和 DNA 甲基化同時發生在人類精子的功能基因組區域

圖3:人類精子中H3K4me3 peaks值區域的DNA甲基化水平
對用于H3K4me3 ChIP-seq的30名男性精子進行WGBS,并評估位于H3K4me3 peak內CpGs的DNA甲基化水平。然后計算peaks標記區域的平均DNA甲基化水平。
A. 具有低DNA甲基化(低甲基化,甲基化≤20%)、中等DNA甲基化(20%≤甲基化≤80%)或高DNA甲基化(高甲基化,甲基化≥80%)的H3K4me3 peaks數。
B. H3K4me3信號(單位:RPKM)中低甲基化(23023個peaks)、中等甲基化(8,087個peaks)或高甲基化(16,777個peaks)H3K4me3 peaks中心(±5kb)的DNA甲基化水平熱圖(單位:%)。每條線代表一個H3K4me3 peaks。所有peaks的H3K4me3信號和DNA甲基化在熱圖的頂部總結。
© H3K4me3 peaks內基因組、CpG、RNA和重復序列注釋的低甲基化、中等甲基化和高甲基化DNA比例。

圖4:人類精子中H3K4me3和DNA甲基化譜
H3K4me3 peaks和DNA甲基化之間的重疊顯示在基因組瀏覽器快照中,顯示了HOXA發育基因簇(A)的ChIP-seq軌跡(藍色)、MACS2 calling的H3K4me3 peaks(深藍色)、WGBS軌跡(黑色)、CpG島位點軌跡(紅色,UCSC)和GC百分比熱圖(藍色,低GC %;白色,50% GC;紅色,高GC %),染色質修飾蛋白ARID5B (B),精原細胞標記物ZBTB16/PLZF (C)和精子發生基因CYLC2 (C)。H3K4me3 peaks位于非DNA甲基化的CpG島(黃色),包括不同甲基化水平區域(紫色),CpG DNA低甲基化區域(綠色)和中等DNA甲基化區域(灰色)。
(4)精子H3K4me3與DNA甲基化在精子發生和胚胎發生過程中基因調控的功能關系探討

圖5:DNA甲基化水平在精子發生、胚胎發生和基本細胞過程的功能基因啟動子區H3K4me3 peaks變化
- H3K4me3過表達在精子發生相關基因啟動子區域具有低、中、高平均DNA甲基化peaks值。與早期精子發生、減數分裂和精子發生相關的基因選自兩個數據庫:Db1(Jan et al.,2017)和Db2(Wang et al.,2018)。給出了Benjamini-Hochberg校正的超幾何最小似然p值。
- 基因啟動子(TSS上游1kb)中的H3K4me3 peaks的GO分析。通過PANTHER過表征測試(GO生物過程完成)檢測特定生物過程中的富集度。P值通過Fisher精確檢驗確定,并對多次檢驗進行Bonferroni校正。過濾富集度≥1.25的非冗余過程后,顯示p值最低的前10個過程。
圖6:H3K4me3精子peaks區域的H3K4me3/H3K27me3二價性,存在低、中或高DNA甲基化
H3K4me3和H3K27me3信號(單位:RPKM)在H3K4me3 peaks中心(±5kb)在人類精子(參考30名男性的H3K4me3和已發表的H3K27me3數據(hamoud etal ., 2009))、8細胞人類胚胎和內細胞團(Xia etal .,2019)、 hESC (Grandy etal ., 2015)和人類胎兒器官(Yan etal .,2016) 熱圖。每個通道代表在參考人群中鑒定的具有DNA低甲基化(23,023)、中甲基化(8,087)、高甲基化(16,777)或未知甲基化(沒有CpG或在WGBS中覆蓋小于10倍的CpG)的H3K4me3 peaks區域,或者未被H3K4me3標記的H3K27me3精子peaks區域。
(5)精子中的H3K4me3靶向增強子和逃避表觀遺傳重編程區域

圖7:H3K4me3在hESC增強子和逃避重編程區域富集
(A) H3K4me3富集在已鑒定的hESC增強子和超級增強子處達到峰值(Barakat等人,2018),在亞穩態表等位基因區域(Kessler et al.,2018)以及在人類原始生殖細胞(PGCs)中通過DNA甲基化缺失而逃避重編程區域達到峰值(Tang等人,2015)。正富集Bioconductor包regioneR確定的Z評分表示。對于顯示的所有區域,通過排列檢驗,p<0.001。
(B) 與感興趣區域相交或不相交的低甲基化、中等甲基化和高甲基化H3K4me3 peaks比例。不相交于感興趣區域的peaks和相交的peaks比例變化通過χ2檢驗進行檢驗,星號表示p<0.001。
本研究的局限性
本研究遵循ENCODE指南,使用DNA甲基化分析的金標準——WGBS,和H3K4me3的深度ChIP-seq分析了加拿大男性代表群體的精子表觀基因組。ChIP-seq在7名男性個體中進行驗證,WGBS通過定制精子MCC-seq方法進行驗證。這種方法的局限性是MCC-seq不能覆蓋全基因組。但本研究捕獲中覆蓋區域驗證了WGBS的區域。當然有可能忽略到某些區域的H3K4me3和DNA甲基化存在很強的個體變異性。在未來的研究中,盡管組蛋白保留水平低,但一旦染色質的單細胞分析足夠敏感,可以分析精子,就可以解決精子與精子之間的異質性。
參考文獻:
Lu Y, Zhou J, Li F, Cao H, Zhang X, Yu D, He Z, Ji H, Lv K, Wu G, Yu M. The Integration of Genome-Wide DNA Methylation and Transcriptomics Identifies the Potential Genes That Regulate the Development of Skeletal Muscles in Ducks. Int J Mol Sci. 2023 Oct 23;24(20) pii: ijms242015476.