小技能一条评论

1

 云生信@云生信学生物信息学

 

从小RNA干扰到miRNA,从miRNA到lncRNA,从lncRNA到环状,我们对生命现象本质的探索从来就不曾停止。circRNA作为RNA界的后起之秀,最近几年被研究者们大力追捧。大部分的环状RNA是由外显子序列构成,在不同的物种中具有保守性,同时存在组织及不同发育阶段的表达特异性。由于环状RNA对核酸酶不敏感,所以比线性RNA更为稳定,这使得环状RNA在作为新型临床诊断标记物的开发应用上具有明显优势。如此保守、稳定又特异表达的RNA,让研究者爱爱爱不完!

 

作为RNA界一颗冉冉升起的新星,circRNA必然有它雄厚的后援力量,各式各样的数据库层出不穷,八卦的我今天就和大家一探究竟吧!

 

 

1、circBase[1]网址:http://www.circbase.org/。一个通过收集和整合已经发布的circRNA数据构建的数据库。目前该数据库收集包括以下6个物种的circRNA信息:人 (hg19)、小鼠(mm9) 、秀丽线虫(ce6)、黑腹果蝇 (dm3)、矛尾鱼 (latCha1)、腔棘鱼 (latCha1)。

 

该数据库的使用方法及作用

1

在这个搜索框中输入要搜索的内容,可输入的内容有:circBase标识符(例如mmu_circ_0000010)、refseq转录本ID(NM_027671),基因名称(Pvt1),genomiccoordinates (基因组位置的输入格式和UCSC的一样:chr:start-end,如chrII:123456-7891011)或GeneOntology term identifiers。搜索不区分大小写。

2

使用list search可以搜索多个circRNA。在Organism中选好物种,在list中输入circRNA的名字或者与circRNA相关的基因名即可。

3

使用table browser通过设定一组条件来检索一组数据集(用法类似UCSC)。

4

使用blat可以通过一段fasta序列来和数据库中的circRNA序列比对,从而找到对应的circRNA,类似于NCBI的blast。

5

在download中可以下载各物种中的circRNA数据,如果发现自己测序得到的circRNA不在这里面,那有可能就是新发现的circRNA啦!并且circBaseID cross-references模块提供了circRNA ID与circRNAname之间的对应关系。据我观察,circRNAname数字为6位,circRNAID为7位。二者很像,千万别混淆了!

6

2、CircInteractome[2] 网址:https://circinteractome.nia.nih.gov/。该数据库预测了已知的109个RNA结合蛋白数据集与circbase中的circRNA的结合位点,并利用Targetscan软件预测了miRNAs与circRNA的潜在结合位点。

 

该数据库的使用方法及作用

 

7

通过Circular RNA模块,我们可以根据circRNA或者基因名进行搜索,在GeneSymbol后面的对话框中输入基因名,然后单击circRNA Search,就能检索到这个基因来源的各个circRNA,基因组的位置、长度等。

8

通过RBP on CircRNA模块,我们可以输入RBP或者circRNA的名字,比如RBP我们用HNRNPC,在输出outputtype里面可以选择excelfile download也可以选择web,然后单击RNA-bindingProtein Search,就能看到预测到的与HNRNPC结合的circRNA。

9

通过miRNA Target Sites模块,我们可以在右侧输入框中输入circRNA的名字或miRNA名字,比如我们输入circRNA:hsa_circ_0000234,然后单击miRNAtarget search,就可以看到预测到的miRNA了。

10

通过Divergent Primers模块,我们可以在右侧输入框中输入circRNA的名字,比如我们输入circRNA:hsa_circ_0000234,然后单击DivergentPrimers search,就可以对感兴趣的circRNA设计引物了。

11

通过siRNA Design模块,我们可以在右侧输入框中输入circRNA的名字,比如我们输入circRNA:hsa_circ_0000234,然后单击siRNAsearch,就可以对感兴趣的circRNA设计siRNA序列了。

 

3、Circ2Traits[3]网址:http://gyanxet-beta.com/circdb/(个人亲测,经常打不开,需要翻墙)。是一个收集与人类疾病或性状潜在关联的circRNA数据库。该数据库通过预测miRNAs和人类的蛋白质编码基因、长链非编码基因及环状RNA间的相互作用关系,构建了相互作用网络,并对miRNAs-circRNA相互作用组中的蛋白编码基因进行了GO富集分析;此外,将与疾病相关的SNPs位点定位到circRNA基因座上,并鉴定了环状RNAs上的Ago相互作用位点。

 

该数据库的使用方法

12

不知道为什么该数据库的首页即使翻墙也打不开,只有下载页面,不过这也没关系,我们可以通过下载该数据库的原始文件,通过疾病名称关键词或circRNA名字,找到疾病相关的circRNA,同时找到相关的miRNA和编码蛋白基因等,从而构建疾病相关circRNA-miRNA-target网络。

13

通过下载该原始文件,我们可以通过检索感兴趣的疾病,将与疾病相关的SNPs位点定位到circRNA基因座上,并鉴定环状RNAs上的Ago相互作用位点。

 

4、circRNADb[4]网址:http://reprod.njmu.edu.cn/circrnadb。首个汇总可编码蛋白的环状RNA的数据库(瓦特!!circRNA不是非编码RNA吗?这个跨界RNA又颠覆了我的认知)。共收集了32914条人类外显子环状RNA记录,每条记录都包括基因组位置信息,RNA编辑情况,所对应的基因组序列,IRES序列元件,预测的ORF以及相关的参考文献。作者发现了有16328条环状RNA包含了编码超过100个氨基酸的ORF,其中7170种环状RNA存在IRES序列元件,基本符合翻译蛋白的特征。

 

备注:IRES是internalribosome entry site的简写,是一种具备募集核糖体并实现核糖体组装和后续阅读框翻译蛋白的RNA调控元件。ORF是OpenReading fr ame的简写,指的是对应于蛋白氨基酸序列的密码子序列,从ATG其实密码子开始,到终止密码子结束。值得一提的是,不是每个ORF都有机会翻译出蛋白质的,还需要有上游的核糖体募集组装以及一些翻译调控元件的存在才可以,IRES就是一类特殊的翻译调控元件。

 

该数据库的使用方法

14

没错,这么高大上的数据库检索就是这么简单粗暴!通过基因名称(Genesymbol),PubMed ID及细胞或组织类型三种检索途径,满足不同客户的需求。

15

这里以ABCA1为例,检索得到15个相关circRNA。这里选择hsa_circ_27359进行说明。

16

首先介绍了具体的单个环状RNA记录的基本信息,包含了所对应基因的ID号,基因组位置,链长度,基因名称,组织和细胞来源信息等。

17

其次介绍了单个环状RNA的具体信息,包含了该环状RNA的外显子序列和信息,RNA剪接序列长度,环状RNA的序列信息,IRES和ORF对应信息,预测多肽的基本特征,对应的疾病信息及参考文献。

 

好了,今天的数据库介绍就到这里,总之,目前大多数circRNA都是作为非编码RNA,以RNA的形式调控下游基因表达:或作为竞争性内源RNA(ceRNA)结合miRNA,阻断miRNA 对靶基因的抑制作用,或直接结合蛋白,阻止蛋白行使功能,产生生物学效应。当然挑战我们认知的事情总是会发生,《Molecular Cell》上的一篇关于circ-ZNF609在肌发生过程中通过翻译蛋白调控的报道[5],让我们大开眼界。于是circRNADb数据库无疑将成为circRNA编码蛋白研究的一大利器!

 

参考文献:

1. Glažar P,Papavasileiou P, Rajewsky N. circBase: a database for circular RNAs.[J]. Rna-aPublication of the Rna Society, 2014, 20(11):1666-1670.

2. Dudekula D B,Panda A C, Grammatikakis I, et al. CircInteractome: A web tool for exploringcircular RNAs and their interacting proteins and microRNAs[J]. Rna Biology,2016, 13(1):34-42.

3. Ghosal S, DasS, Sen R, et al. Circ2Traits: a comprehensive database for circular RNApotentially associated with disease and traits[J]. Frontiers in Genetics, 2013,4(283):283.

4. Chen X, Ping H,Tao Z, et al. circRNADb: A comprehensive database for human circular RNAs withprotein-coding annotations[J]. Sci Rep, 2016, 6:34985.

5.Legnini I , DiTimoteo G , Rossi F , et al. Circ-ZNF609 Is a Circular RNA that Can BeTranslated and Functions in Myogenesis[J]. Molecular Cell, 2017,66(1):22-37.e9.

circRNA-moban

1 条评论

发表评论