circBase其实只是简单地对几篇文章的circRNA进行了汇总,最初包含Memczak、Salzman等达人在2013年发表的circRNA大规模识别的先锋作品,随后陆续更新了一些文章。数据库中circRNA识别的方法多种多样,但主要是Memczak的find_circ流程。
circBase的初衷可能是想像mirBase一样对circRNA的命名等基本信息进行统一规范化。但目前circRNA并没有统一的命名,一般使用基因组位置作为名字,或者用circ-作为前缀而宿主symbol作为后缀(例如, circ-CDR1),对于一些个别的circRNA研究,研究者都愿意用自己的设计,例如CDR1as——与lncRNA命名相似(一些研究者认为circRNA也算是长的非编码RNA,但circRNA是否编码蛋白质目前还有待进一步考证)。
理想很丰满而现实很骨感,由于实验技术以及识别方法的缺憾12,circBase提供的circRNA的信息在进行进一步研究时还需要特别注意,特别是对结构以及表达的评估。
circBase提供了基因组位置、细胞系或组织、参考文献等信息,还提供了circRNA序列查询及下载功能,另外研究者可以获取到circRNA剪切掉中间内含子后的序列(由于circRNA的识别工具只能识别junction即环状剪接位置,而中间的序列无法完全确定,所以这里的circRNA完整序列还只是作者的假设)。
当然,数据库还提供了find_circ的程序,但推荐去github下载最新版本。
circBase的作者动作很快,抢注了这样一个非常好的域名,但要想circRNA像miRNA那样具有规范及精确的定位,还需要研究者的进一步研究,至于该网站能不能成为circRNA真正的base,让我们拭目以待!
来源:CircRNA Knowledge Base
很棒,怎么收藏帖子?
不用收藏,占用你空间,需要是来看看就行,记不住可以在上面的“在文章中搜索”框中搜索关键词就可以找到你想要的文章
所以说自己做RNA-seq测出来的circRNA例如rno_circ:chr20:20259263-20303087这样的名称在发文章时可以直接改为circ-Ank3对吧?gene symbol为circ-Ank3。
是的,这样也是对你研究的circRNA进行一个保护,别人看的文章,想确定哪个是哪个circRNA也不容易。
根据RNA-seq测出来的circRNA例如rno_circ:chr20:20259263-20303087怎么早知道它的gene symbol是circ-Ank3呢?
根据RNA-seq测出来的circRNA例如rno_circ:chr20:20259263-20303087怎么知道它的gene symbol是circ-Ank3呢?
我想请教各位,如果circRNA的genonic length与spliced length相同,都是<1000,说明什么?谢谢!