作者:百迈客医学(微信号)
我们之前也对外泌体做过介绍,外泌体是由大多数细胞都可以分泌的纳米级的内吞囊泡,含有大量不同类型的RNA,可以调节受体细胞的行为,并可作为疾病的循环生物标志物。今天为大家介绍一个人类血液外泌体circRNA、lncRNA和mRNA的数据库——exoRBase。
这篇文章中,作者介绍了其团队开发了的web可访问的数据库exoRBase,这是一个人类血液外泌体的RNA-seq数据分析的circRNA、lncRNA和mRNA的存储库,还包括已发表文献的实验验证。exoRBase对标准化RNA-seq数据的RNA表达谱进行了整合和可视化,这些数据涵盖了正常个体和不同疾病患者。exoRBase旨在收集和描述人类血液外泌体中所有长的RNA。第一次释放的exoRBase包含58330个环状RNA、15501个 lncRNA和18333个mRNA,提供了注释、表达水平和可能的来源组织,并将定期更新,提供更多的外泌体RNA信息。exoRBase将帮助研究人员识别血液外泌体中的分子特征,并将引发人类疾病的新的外泌体生物标志物的发现和功能研究。
作者从GEO、SRA中提取的人类血样,并结合了circBase等数据库,整理了RNA-seq数据,目前包含来自92个RNA-seq实验的数据,包括正常人(NP)、冠心病(CHD)、结直肠癌(CRC)、肝细胞癌(HCC)、胰腺腺癌(PAAD)和乳腺癌(BC)等样本。所有收集到的数据都经过相同的预处理,并通过HISAT2比对到人类参考基因组(GRCh38),并进而计算表达量。除此之外,还分析了lncRNA和mRNA在人类组织中的组织特异性,以及circRNA的来源等。
整个数据库可以通过网页轻松浏览、查询和下载,还允许研究人员提交新的外泌体RNA及其在人血外泌体中的表达谱。该网站已经在几个常用的浏览器中进行了测试,包括Internet Explorer、Google Chrome和Firefox。数据库网址为:
http://www.exoRBase.org
数据库整体设计
数据库的浏览选项介绍
1. circRNA、lncRNA和mRNA共用的浏览选项
“Sample types”选项允许用户浏览在单个或多个样本类型中检测到的RNA。用户还可以使用“Detection frequency”、“Expression rank”和“Validation”选项过滤检索结果。
┣ “Detection frequency”表示在所有样本中检测到RNA的频率。频率值从0到1。0的值表示在任何样本中都没有检测到所选的RNA, 1表示在所有样本中都检测到了RNA;
┣ “Expression rank”表示同一类型RNA(circRNA、lncRNA或mRNA)的表达等级。RNA按其表达水平分为10个等级。例如,“0-10%”表示的表达水平在前十分位;
┣ “Validation”表示选择的RNA是否在已发表文章中验证;
2. circRNA、lncRNA或mRNA分别特有的浏览选项
对于circRNA,用户可以选择circBase 中是否有注释的circRNA。此外,用户可以通过‘Gene symbol’中的来源基因、基因组位置来过滤浏览结果。
对于lncRNA和mRNA,提供了选择“Tissue specificity”选项,可以选择RNA是否在某个组织中特异表达。它们是在一个组织中明确表达的。在血液中检测到的一些RNA可能来自特定的组织。这个选项可以帮助用户选择某些特定组织产生的血液外泌体RNA。这些特殊的RNA可能对某些疾病的临床诊断有意义。
浏览器的搜索和下载
用户可以根据环状RNA的基因组位点或lncRNA和mRNA的基因名查询感兴趣的RNA。环状RNA是一种新兴的RNA类型,所以很多环状RNA都没有统一的名称。因此,我们将外泌体染色体环状RNA命名为exo-circ-XXX。用户可以通过基因组位置或新的circRNA名称搜索circRNA。此外,为了方便搜索功能,还允许根据来源基因的名称进行搜索。搜索结果将以表格显示查询的RNAs的基本信息。
当用户按基因名搜索时,可在搜索框中输入一个或多个gene symbol。多个基因名应该用逗号分隔。此外,不同样本组的表达水平也会显示为折线图或热图,且折线图有一定交互功能。点击基因名超链接将引导用户进入一个包含有关相应基因的详细信息的页面,并显示每个样本组的表达水平。此外,所有这些绘图都可以保存到本地磁盘中。
在每个样本组中的circRNA、lncRNA和mRNA的表达谱和相关样本均可下载并进行分析。此外,可以在“Downloads”页面上下载描述RNA详细信息的注释文件。用户也可以访问经过验证的RNA的手动管理信息。
参考文献:Shengli Li, Yuchen Li, Bing Chen, et al. exoRBase: a database of circRNA, lncRNA and mRNA in human blood exosomes. Nucleic Acids Research (IF=10.162). 2017.
来第一个抢占沙发评论吧!