與具有詳盡注釋的蛋白編碼基因不同, lncRNAs常常缺乏注釋,信息分散且收集不全。Arraystar擁有高質量的轉錄組和lncRNA數據庫,通過生物信息學方法建立了科學、嚴謹的lncRNA篩選流程。Arraystar人類LncRNA V4.0芯片共收錄了40,173 個lncRNAs,主要分為兩大類:7,506個金標準LncRNAs和32,667個可靠的LncRNAs,實現了對所有權威數據庫(如Refseq, USCS Known Genes, GENCODE, lincRNA catalogs, lncRNAdb, T-UCRs, RNAdb, NRED 等)、高水平文章和超過47 Tb RNA-seq數據中的lncRNA最全面、最可靠和最及時的整理和收集。
金標準lncRNAs全部采用經過詳細注釋和實驗驗證確定的lncRNAs,剔除了公共數據庫中大量的lncRNA部分片段、不完整的UTRs和不可靠的lncRNAs。 金標準lncRNAs具有完善的信息標注,包括轉錄單位、轉錄本異構體、功能機制以及亞細胞定位。它們的主要來源如下:
·lncRNAdb v2.0匯集了功能性lncRNAs ;
·Arraystar篩選和收集了高水平文章中的lncRNA;
·Level 1 GENCODE v21精心挑選了具有RT-PCR-seq方面實驗數據支持的LncRNAs ;
·Refseq 嚴格篩選了可信度高、具有全長序列的LncRNAs ;
·Arraystar通過ENCODE CAGE Clusters,,PolyA-seq,深度RNA-Seq以及capture seq獲得的,具有5’TSS、3’末端和表達量信息的全部lncRNA轉錄本 。
可靠的lncRNAs (Reliable LncRNAs)
除了金標準lncRNA外,其他的 lncRNA序列主要通過整合數據庫和經典文獻中的轉錄單位(Transcription Units)而獲得。DNA鏈的轉錄起始于DNA模板的一個特殊起點,并在一個終點處終止,此轉錄區域稱為轉錄單位。根據轉錄本長度、來源數據庫和其他有效信息,每個轉錄單位挑選一個最具代表性的lncRNA進行檢測。最終從308,525個lncRNA序列中篩選出32,667個可靠的 LncRNAs分子。
編碼蛋白的mRNAs (Protein Coding mRNAs)
根據與UniProt蛋白數據庫的匹配程度,將RefSeq 及GENCODE數據庫中收錄并篩選的蛋白編碼mRNA分為3類,依次為權威的、非權威的和不匹配的。Arraystar的人類V4 LncRNA芯片共挑選并收錄了 20,730個編碼蛋白的轉錄本。
lncRNA研究的信息寶藏:系統而實用的lncRNA注釋
一站式芯片技術服務包含系統而詳細的lncRNA注釋、子類分析等重要分析項目,這些信息有助于揭示lncRNAs復雜的生物學功能。通過研究發現,lncRNAs在凋亡、分化、發育等多種生物學過程以及人類疾病,如癌癥、神經系統疾病及心血管疾病中發揮重要功能。針對上述研究報道的所有LncRNAs,我們提供了全面的注釋便于交叉引用,幫助您深入了解lncRNAs的生物功能和分子機制。
基因組結構 根據LncRNAs在基因組上相對于蛋白編碼基因的位置關系,可以系統的將其分為 (1) Intergenic (LincRNA),(2) Intronic,(3) Bidirectional,(4) Sense-overlapping,(5) Antisense ,(6) Pseudogene這6種類型 ,這種位置關系對于推測lncRNA的功能具有很大幫助,包括調控方式是順式(cis)還是反式(trans),調控層面是轉錄還是轉錄后。
高度保守的LncRNAs 基因組中高保守區域(UCR)或高保守非編碼元件(UCNEs)轉錄出來的lncRNAs可能具有重要的生物學功能。在其他物種中與人類基因組結構相同的lncRNAs(即使只有中度同源)也會被收錄。因為與全序列保守性相比,基因組結構與基因調控的關系更加密切。
組織特異性lncRNAs LncRNAs呈現出嚴格的組織或時序特異性,可能與其發揮的功能密切相關。其中特別標示出6,059個與細胞譜系或癌癥相關的lncRNAs分子。
疾病相關 lncRNAs 包含了LncRNADisease數據庫中收錄的已知與疾病相關的lncRNAs 。
疾病SNP相關lncRNAs 覆蓋帶有疾病易感位點的LncRNAs ,可能與疾病發生發展密切相關。
在生物學功能中LncRNAs和mRNA的共表達 收錄了與生物學過程或功能基因集相關的LncRNAs(例如,血管生成、缺氧、代謝、增殖、細胞周期、細胞黏附、DNA損傷修復)。
癌癥相關LncRNAs LncRNAs可以在不同類型癌癥中發揮作用,通過上千例癌癥樣本中lnRNA的大范圍研究表明,其表達量發生了癌癥特異性改變。
基因間超長鏈非編碼RNAs(vlincRNA) 長度從50 kb到1 Mb,作用涉及多種生物學過程, 例如多能性、癌癥、細胞凋亡、細胞周期以及細胞衰老。
其他類型 例如,缺氧誘導型非編碼高保守轉錄本(HINCUTs),壓力誘導型長鏈非編碼轉錄本 (LSINCTs)。
科學的“轉錄本特異”探針
與mRNA一樣,LncRNAs是以轉錄本的形式發揮功能的。特定基因位點往往可以轉錄出多個沒有開放閱讀框,不同功能的轉錄本。大部分芯片平臺只針對基因的3’端設計“基因特異性”探針,無法有效區分不同轉錄本。而Arraystar LncRNA芯片針對剪切連接位點或外顯子序列設計了“轉錄本特異性”探針,能夠實現對不同轉錄本的準確、特異性檢測(圖 1) 。

Arraystar LncRNA 芯片參數
|
人類V4.0
|
小鼠V3.0
|
大鼠V2.0
|
探針總數
|
60,903
|
60,804
|
38,237
|
探針結合位點
|
轉錄本的外顯子或剪接位點處設計特異性探針
|
探針特異性
|
轉錄本特異性
|
標記方法
|
標記cRNAs的全長,沒有3’序列偏好性;即使對低豐度或部分降解的RNA轉錄本也可進行靈敏、高效的標記
|
檢測LncRNAs數目
|
40,173
|
35,923
|
13,611
|
金標準LncRNAs
|
7,506
|
|
|
可靠的 LncRNAs
|
32,667
|
|
|
具有開放閱讀框的LncRNAs
|
|
1,428
|
1,428
|
轉錄的假基因
|
699
|
3,419
|
2,140
|
蛋白編碼mRNAs
|
20,730
|
24,881
|
24,626
|
LncRNA來源
|
數據庫(更新至 2015):
Refseq, UCSC, GENCODE, LncRNAdb, RNAdb, NRED, lincRNA catalogs (Cabili et al 2011, Clark et al 2015, Iyer et al 2015), ENCODE CAGE Clusters, PolyA-seq, deep RNA-Seq 及capture seq 數據庫。
Arraystar 收集并篩選的LncRNA。
引用文獻:
2015年以前的科學出版物。
|
數據庫:
Refseq (05/2013), UCSC Known Gene 6.0, Ensembl 38.71, Fantom3, RNAdb 2.0, and NRED。
引用文獻:
lincRNAs [7,18,22,23], T-UCRs [11], Evolutionary constrained LncRNAs [24], Evolutionary Conserved LncRNAs [25].
|
數據庫:
NCBI Refseq[12], Ensembl 5.0.79[43], lncRNAdb[21];
引用文獻 [10,11,15,18, 20]:
T-UCRs,進化上保守的 LncRNAs
|
mRNA來源
|
Refseq, GENCODE關聯 UniProt 數據庫
|
共識編碼序列(CCDS) 數據庫
|
NCBI Refseq[12], Ensembl 5.0.79[43]
|
參考文獻
1. Cabili, M.N. et al. (2011) Genes Dev 25(18):1915-27 [PMID: 21890647]
2. Labaj, P.P. et al. (2011) Bioinformatics 27(13):i383-91 [PMID: 21685096]
3. Kretz, M. et al. (2012) Genes Dev 26(4):338, -43 [PMID: 22302877]
4. Xu, W. et al. (2011) Proc Natl Acad Sci U S A 108(9):3707-12 [PMID: 21317363]
5. Guttman, M. et al. (2010) Nat Biotechnol 28(5):503-10 [PMID: 20436462]
6. Derrien, T. et al. (2012) Genome Res 22(9):1775-89 [PMID: 22955988]
7. Khalil A.M. et al. (2009) Proc. Natl. Acad. Sci. U.S.A. 106(28):11667-72 [PMID: 19571010]
8. Cabili M.N. et al. (2011) Genes Dev. 25(18):1915-27 [PMID: 21890647]
9. Ørom U.A. et al. (2010) Cell 143(1):46-58 [PMID: 20887892]
10. Rinn J.L. et al. (2007) Cell 129(7):1311-23 [PMID: 17604720]
11. Bejerano G. et al. (2004) Science 304(5675):1321-5 [PMID: 15131266]
12. Pruitt K.D. et al. (2005) Nucleic Acids Res. 33(Database issue):D501-4 [PMID: 15608248]
13. Pang K.C. et al. (2005) Nucleic Acids Res. 33(Database issue):D125-30 [PMID: 15608161]
14. Pang K.C. et al. (2007) Nucleic Acids Res. 35(Database issue):D178-82 [PMID: 17145715]
15. Mercer T.R. et al. (2008) Proc. Natl. Acad. Sci. U.S.A. 105(2):716-21 [PMID: 18184812]
16. Hsu F. et al. (2006) Bioinformatics 22(9):1036-46 [PMID: 16500937]
17. Harrow J. et al. (2006) Genome Biol. 7 Suppl 1:S4.1-9 [PMID: 16925838]
18. Guttman M. et al. (2009) Nature 458(7235):223-7 [PMID: 19182780]
19. Dinger M.E. et al. (2009) Nucleic Acids Res. 37(Database issue):D122-6 [PMID: 18829717]
20. Benson D.A. et al. (2004) Nucleic Acids Res. 32(Database issue):D23-6 [PMID: 14681350]
21. Amaral P.P. et al. (2011) Nucleic Acids Res. 39(Database issue):D146-51 [PMID: 21112873]
22. Sun L. et al. (2012) BMC Bioinformatics 13:331 [PMID: 23237380]
23. Ramos A.D. et al. (2013) Cell Stem Cell 12(5):616-28 [PMID: 23583100]
24. Ponjavic J. et al. (2009) PLoS Genet. 5(8):e1000617 [PMID: 19696892]
25. Willingham A.T. et al. (2005) Science 309(5740):1570-3 [PMID: 16141075]
26. The ENCODE Consortium. . https://genome.ucsc.edu/ENCODE/protocols/dataStandards/ENCODE_RNAseq_Standards_V1.0.pdf
27. Clark M.B. et al. (2015) Nat. Methods 12(4):339-42 [PMID: 25751143]
28. Iyer M.K. et al. (2015) Nat. Genet. 47(3):199-208 [PMID: 25599403]
29. Quek X.C. et al. (2015) Nucleic Acids Res. 43(Database issue):D168-73 [PMID: 25332394]
30. Skroblin P. and M. Mayr (2014) Circ. Res. 115(7):607-9 [PMID: 25214572]
31. Kurian L. et al. (2015) Circulation 131(14):1278-90 [PMID: 25739401]
32. Hu Y. et al. (2014) Cancer Res. 74(23):6890-902 [PMID: 25277524]
33. Fang X.Y. et al. (2015) Cancer Lett. 356(2 Pt B):357-66 [PMID: 25444905]
34. Howald C. et al. (2012) Genome Res. 22(9):1698-710 [PMID: 22955982]
35. Miura P. et al. (2013) Genome Res. 23(5):812-25 [PMID: 23520388]
36. St Laurent G. et al. (2015) Trends Genet. 31(5):239-51 [PMID: 25869999]
37. Yan X. et al. (2015) Cancer Cell 28(4):529-40 [PMID: 26461095]
38. Hackermuller J. et al. (2014) Genome Biol. 15(3):R48 [PMID: 24594072]
39. St Laurent G. et al. (2013) Genome Biol. 14(7):R73 [PMID: 23876380]
40. Chen G. et al. (2013) Nucleic Acids Res. 41(Database issue):D983-6 [PMID: 23175614]
41. Ferdin J. et al. (2013) Cell Death Differ. 20(12):1675-87 [PMID: 24037088]
42. Silva J.M. et al. (2010) Genomics 95(6):355-62 [PMID: 20214974]
43. Cunningham, F., M. R. Amode, et al., Ensembl 2015. Nucleic Acids Res 2015 43(Database issue): D662-669.
康成生物國內獨家提供Arraystar LncRNA芯片全程優質技術服務;目前康成客戶LncRNA芯片研究文章已超180篇,其中多篇發表在國際頂尖雜志Cancer Cell, Molecular Cell, Hepatology等上。
詳情請咨詢康成生物銷售工程師,或致電免費熱線:400-886-5058;800-820-5058。