文章:生信草堂
作者:土豆力
自circRNA首次在拟南芥中报道后,植物circRNA中的研究便拉开序幕。今天要分享的文章是一篇早期植物circRNA鉴定的文章,题目是Widespread noncoding circular RNAs in plants。该篇文章发表于New Phytologist(影响因子7.33),ISI期刊引文报告排名:9/211(植物科学)。
背 景
1.早在上世纪,陆续有报道显示真核细胞中环状 RNA 的存在,但在当时被认为是剪切错误的产物。随着高通量测序技术和生物信息学分析的发展,Salzman 等人首次指出环状 RNA 由 mRNA 前体可变剪切得来,是一类 3’ 与 5’端共价闭合,广泛大量存在于真核生物体内的内源性RNA,参与转录后调控过程。
2.circRNA形成的模型如图1所示,在转录过程中发生head-to-tail splicing (back splicing),当剪切体两端自身发生互补配对时,则转录出circRNA。
3.根据来源,circRNA可以分为三类:外显子、内含子和基因间区域circRNA.
4.在人类的研究中,circRNA环化过程具有以下特征:
a.相邻长的内含子序列中通常富集ALU重复片段.
b.侧翼内含子具有反向互补的特征.
c.RNA结合蛋白Quaking参与调控circRNA的形成。
5.circRNA能够组织时空特异性表达,且能够通过miRNA sponges实现调控功能。
Fig 1 A model showing linear and back splicing for generating linear mRNA and circRNA, respectively.
材料与方法:
1.数据来源:O. sativa根部(GenBank accession PRJNA215013; read length 101 bp);A. thaliana叶片(PRJNA218215; read length 100 bp).
2.使用 BOWTIE2 (v2.0.5)获得未比对到参考基因组上的RNA测序序列,提取首尾20-nt再次比对到参考基因组找寻唯一的接头(anchor)位置,并通过侧翼剪切位点GU/AG来确定circRNA的候选序列。每一个候选circRNA至少包含两个独立的反向剪切序列。(图2)
Fig 2 The pipeline for computational identification of circRNAs in plants following the method used in animals (Memczak et al., 2013)
3.circRNA的实验验证:简单来说,作者通过发散性引物(divergent primers)在DNA和cDNA模板上扩增信息的不同来验证circRNA的存在。PCR条件详见文章。值得一提的是,实验对象是参照下载数据的文章所述相同条件和部位。同时,为了验证下载数据的真实性,作者采用相同条件种植水稻,并取相同部位进行扩增实验。
4.Blast用于序列保守性分析,GO富集分析用于序列功能注释,MEME用于侧翼内含子中5-60nt 保守基序的鉴定。
5.表达分析采用FPKM算法计算,通过Pearson correlation coefficien判断circRNA与来源基因的共表达相关性。
结果:
1.对鉴定的数据进行描述,包括circRNA的数量、来源分类,见表1。水稻和拟南芥中有 12037 和 6012 个环状 RNA,其中外显子circRNA数量较多。同时,作者从中随机选取 (10/18) 个高表达的外显子circRNA进行PCR扩增实验结果验证测序结果。
Table 1 Genome-wide identification of circular RNAs (circRNAs) in plants based on RibominusSeq data
UTR, untranslated region
aOther circRNAs refer to those derived from two or more genes.
2.比对分析了水稻和拟南芥中鉴定circRNA的同源性,其中直系同源对数目超过700,其中超过 300 个直系同源亲本基因的环状 RNA 均来自于基因组相同位点,如图3例子所示。
Fig 3 An example showing conservation of exonic circRNAs.
3.根据动物circRNA研究基础,分析植物中circRNA侧翼序列结构特征,发现植物外显子circRNA侧翼内含子序列并不富含重复和反向互补序列。同时,在水稻和拟南芥的circRNA中,未发现保守的侧翼内含子序列。相较于动物,植物circRNA侧翼内含子要长于线性基因的。
4.磷处理下水稻根部circRNA表达与其来源基因的相关性分析发现349对具有显著正相关,且暂未发现呈负相关的组合。不同处理下的水稻circRNA的表达不尽相同,说明其表达具有一定时空特异性。其中,27个外显子circRNA在响应磷胁迫中发挥功能。
5.通过对产生circRNA的基因组区域是否包含miRNA结合位点来预测circRNA分子靶miRNA,发现只有小部分的circRNA分子具有miRNA结合位点,其中水稻5.0%,拟南芥6.6%.
小结
作者选用植物中最基本的研究对象展开circRNA的研究,涵括单子叶及双子叶植物,通过对比动物研究,初步得到植物circRNA同样具有特异性时空组织表达的特性,其表达与来源基因相关,且序列保守。但在circRNA形成模式上,植物与动物间的特征并不相同,如侧翼序列的重复片段、内含子长度等方面。结果显示,circRNA在植物生长过程中同样起到重要作用,值得深入研究。
该篇文章把握了当下研究热点,为植物circRNA的鉴定研究提供了一个研究模板。下一篇我们将继续分享NP中发表的另一篇circRNA研究的文章,学习优秀文章的研究策略。
来第一个抢占沙发评论吧!