该篇文章由上海生科院计算所杨力团队(德国马普计算生物学伙伴研究所 )最新在线发表在GBP上的数据库升级文章,文章题目为:CIRCpedia v2: An Updated Database for Comprehensive Circular RNA Annotation and Expression Compariso.本次更新内容包含六个不同物种的180多个RNA-seq数据进行circRNA注释,包括人类和小鼠间circRNA的保守分析,在线地址 http://www.picb.ac.cn/rnomics/circpedia,允许用户搜索、浏览及下载各种细胞/组织类型的circRNA表达谱。
数据库概况
1. CIRCpedia v2 的数据内容来源于Gene Expression Omnibus (GEO), Encyclopedia of DNA Elements (ENCODE) project, 及EMBL-European Bioinformatics Institute (EMBL-EBI)三大RNA-seq数据库,提供circRNA的注释及不同细胞系/组织的可变剪切事件注释。当前版本的CIRCpedia v2 总共包含185个数据集 (较上一版本更新86个),包括 ribo–, poly(A)–, ribo–/RNase R, or poly(A)–/RNase R RNA-seq (Figure 1B)。更新的数据库中,39个来自于人类,27分小鼠,12个来源于果蝇,同时补充了两个其他物种,分别为6个ribo– 大鼠RNA-seq 及斑马鱼的一个ribo– RNA-seq和一个ribo–/RNase R RNA-seq。通过鉴定反向剪切接头位点,CIRCpedia v2提供BED格式的circRNA的注释文件、5‘可变反向剪切注释文件(A5BS) 、3’可变反向剪切注释文件(A3BS) ,总共涵盖262782条circRNA,39225个A5BS事件及34747个A3BS事件。
2. 人类circRNA的注释同时使用CIRCexplorer2及MapSplice 两种程序,并通过LiftOver 分析整合人类及小鼠间circRNA保守性信息。根据每百万map片段上反向剪切接头的map片段数量 (FPM) 来计算circRNA的表达,并同时支持单端及双端测序数据。
3. circRNA基因组位置等可视化通过内置JBrowse工具实现,不同细胞系中circRNA的差异表达数据可视化由Tool工具实现。
4. 支持CSV格式文件下载,用于检索来自所选细胞系/组织和物种的circRNA和反向剪接事件的信息以进行后续分析。
用户向导
1. 搜索框支持genomic locations, gene symbols, or CIRCpedia IDs (circIDs)三项在选定物种的某个/全部细胞系搜索。输入网页中提供的例子,人类基因组(hg38)中Chr9:135808487–135907224位置上的circRNA信息如下图,除图中显示的信息及数据来源外,还包括LiftOver工具对人类/小鼠间circRNA的保守性分析,MapSplice比对的注释信息及RNase R 处理以后变化倍数的富集结果。同时,A5BS和A3BS的输出文件,列出了物种,基因,亚型,位置,正反链信息,环化位点所占比例(percent circularized-site usage),及测序类型和细胞系的信息。输出文件格式包括JSON, XML, CSV, or TXT。同时对人类circRNA搜索结果提供可视化工具(下一步)及GeneCards网站上来源基因的鉴定信息。
2. 上一步的搜索结果能够直接连接至内嵌网站的JBrowse进行可视化。面板的左边提供在9号染色体该位置上所有的能够鉴定的A3BS、A5BS、circRNA等信息,并通过,面板右边可视化体现,包括基因注释、RNA-seq数据集、circRNA注释和备选反向拼接事件,点击具体的图形能够获得详细序列。上方的工具栏中可以切换其他基因组。另外,单击JBrowse中给定circRNA的track,将对其表达值(FPM)以进行可视化。
3. Tool工具能够根据circRNA基因组的位置对比其在不同细胞系中差异表达(FPM值),并提供两种表达数据可视化:热图和点图。
小结
1. 首先CIRCpedia v2整合了185个RNA-seq数据集、260000多条转录组鉴定的circRNA,目前,人类数据上已使用CIRCexplorer2及MapSplice进行分析,并支持来源基因鉴定信息的搜索(GeneCards websites)。
2. 介于很小比例的人类的circRNA (10%-20%) 同样出现在小鼠样本中,网站整合了LiftOver对两者间circRNA保守性分析的结果,结合JBrowse可视化工具,可对潜在环化位点附近的内含子序列特征进一步分析。
3. CIRCpedia v2提供在线比较circRNA差异表达的可视化工具。
CIRCpedia v2是一个包含circRNA搜索,可视化,下载和在线分析功能的circRNA更新数据库,能够快速直观的搜索不同转录组测序数据中circRNA的具体信息及表达情况。随着鉴定工具多样化及RNA反向互补序列计算工具的引入,将进一步减少转录组数据预测的假阳性及丰富circRNA的下游分析。
mark一下