850,000個 CpGs, 分布于增強子、基因編碼區、啟動子區和 CpG 島。相比較于全基因組甲基化檢測,該芯片周期短、價格低,并可以接受 FFPE 樣本。
,北京諾禾致源科技股份有限公司 ">
甲基化是指在 DNA 甲基化轉移酶的作用下,在基因組 CpG 二核苷酸的胞嘧啶5'碳位共價鍵結合一個甲基基團。DNA 甲基化能引起染色質結構、DNA 構象、DNA 穩定性及DNA 與蛋白 質相互作用方式的改變,從而控制基因表達。
850K甲基化芯片包含>850,000個 CpGs, 分布于增強子、基因編碼區、啟動子區和 CpG 島。相比較于全基因組甲基化檢測,該芯片周期短、價格低,并可以接受 FFPE 樣本。
850K 甲基化芯片流程展示
探針一:
對于每個甲基化位點,都對應設計有兩種探針:M 型磁珠、U 型磁珠。M 型磁珠尾部為 G,用來檢測甲基化位點;U型磁珠尾部為 A,用來檢測未甲基化位點。
基因組上的某一位點如果被甲基化了,那么在亞硫酸氫鹽的處理下,GC 仍為 GC,與M 型磁珠配對,熒光標記的核苷酸摻入后能被檢測到熒光信號,M 型磁珠發光。反之,如果沒有被甲 基化,那么在亞硫酸氫鹽的處理下,GC 變為 GT,與 U 型磁珠配對,延伸后U 型磁珠發光。
探針二::
Infinium Ⅱ 探針只使用一種磁珠,探針末端為 C,配對后只摻入單個堿基。根據熒光類型判斷摻入的堿基類型,即可判斷是否被甲基化。
(1)>90%的 HumanMethylation450 BeadChip 位點
(2)CpG 島以外的 CpG 位點
(3)人類干細胞中的非 CpG 甲基化位點(CHH位點)
(4)腫瘤(多種類型的癌癥)VS 正常樣本中的不同甲基化位點,可以檢測多種樣本類型
(5)FANTOM5 增強子
(6)ENCODE 開放染色質和增強子
(7)脫氧核糖核酸酶超敏位點
(8)miRNA 啟動子區域
(1)廣泛的基因組覆蓋范圍:每個樣本檢測>850,000個 CpG 位點。
(2)分辨率高:單堿基分辨率,可以直接檢測到發生甲基化的確切位點。
(3)高質量的數據:同時采用 Infinium I 及 II 探針設計,使檢測范圍最大化。
(4)可重復性高:自身技術重復相關性R2>0.98;850K VS 450K 交集探針間相關性R2>0.98。
(5)起始模板量低:僅需250 ng,大大節約了樣本量。
(6)適用于 FFPE 樣品。
從材料選取、探針捕獲、到檢測分析,每一步都需要科學、縝密的設計,以保障高質量研究成果。
850K甲基化芯片可以進行DMP、DMR信息挖掘,并進行系列數據分析,助力高分文章發表
分析內容 |
1. 樣本的 β 值密度曲線 |
2. 各樣本的 β 值箱線圖 |
3. PCA 圖 |
4. 標準化后的甲基化位點總表 |
5. 差異甲基化位點(DMP)列表 |
6. 差異甲基化區域(DMR)列表 |
7. 差異甲基化位點熱圖 / 散點圖 / 火山圖 |
8. DMP 對應基因的 GO 和 KEGG 富集 |
9. DMR 對應基因的 GO 和 KEGG 富集 |
10. Functional Epigenetic Modules 分析 |
11. CNV 展示 |
對下機數據進行數據質控以及標準化,通過樣本 beta 值密度曲線圖、PCA、箱線圖等展示樣本間、組間的甲基化情況 以及相互關系,能夠對項目樣本的整體情況有個直觀了解,初步分析樣本情況是否滿足預期的實驗設計。
差異甲基化位點(differentially methylated CpG positions,DMP)是甲 基化研究的主要環節,對于尋找后續 biomarker 有重要意義。DMP 分析 通過比對 case 組與 control 組的 β 值獲得Δβ值,從而得到 case 組差異甲 基化位點;DMP的展示可以通過繪制火山圖、散點圖、熱圖等來反應組間 整體差異情況。
圖3 組間差異甲基化位點火山圖示例
在基因組中差異甲基化位 點經常會成 簇出現,形成一段差異性甲基化區域 (Differentially Methylated Region,DMR),區段的范圍小至數百 bp,大到 Mb 級別,DMR被認為在基因印記調節中起重要作用。
圖4 DMR 展示示例圖
Gene Ontology(簡稱 GO)是基因功能國際標準分類體系。 作為基因本體聯合會(Gene Onotology Consortium)所建 立的數據庫,它旨在建立一個適用于各種物種的,對基因和蛋 白質功能進行限定和描述的,并能隨著研究不斷深入而更新 的語言詞匯標準。GO 分為分子功能(Molecular Function)、生物過程(Biological Process)、和細胞組成(Cellular Component)三個部分。基因或蛋白質可以通過 ID 對應 或者序列注釋的方法找到與之對應的 GO 編號,而 GO 編號可 用于對應到 Term,即功能類別或者細胞定位。
圖5 分子功能示例圖
KEGG 可利用分子水平信息,尤其是大型分子數據集 生成的基因組測序數據和其他高通量實驗技術的實 用程序數據庫資源,把從得到的基因目錄與更高級別 的細胞、物種和生態系統水平的系統功能關聯起來, 用以了解高級功能和生物系統(如細胞、生物和生態 系統)。
圖6 顯著富集 KEGG pathway 示例圖
DNA 甲基化會調控基因的表達水平,進而影響基因的相互作用。將 基因的相互作用網絡和差異甲基化信息結合起來,基于那些甲基化 水平發生差異的基因,從整個相互作用網絡挖掘出這些基因的相互 作用模塊,這些模塊可以看作是與樣本表型數據相關的基因集合, 這種研究方式叫做 Functional Epigenetic Modules(FEMs)。圖中 的每個節點是一個基因,其相互關系是 PPI 網絡中定義好的,節點 的顏色根據差異甲基化的 T 值定義,小于-1.5的為白色到黃色的漸 變色,大于1.5為淺藍色到藍色的漸變色,中間的是灰色。
圖7 FEM 示例圖
據報道,拷貝數變異(Copy number variations,CNV)與許多疾病的發生發展有重 要關系。對于同一個樣本,挖掘多組學信息可以更好地解釋疾病的發生與發展,已成 為一種流行趨勢。通過850K 甲基化芯片檢測,可以在得到樣本甲基化情況的同時, 獲得拷貝數變異信息。如下圖,橫坐標代表染色體位置;縱坐標代表矯正后的綜合強 度值,每一個綠色、紅色的點代表一個探針倉 bins,藍色線為一個 segment(通過合 并相同拷貝數狀態的 bins 獲得)。整 體上看,離0越遠表明 CNV 變異越大。
圖8 CNV 示例圖