作者:李纪伟(微信号:上海生命基因)
Changes in circular RNA expression patterns during human foetal brain Development
人胎儿脑发育过程中circRNAs表达谱变化
期刊:Genomics 影响因子:2.801
发表单位:新南威尔士大学生物技术与生物分子科学学院
1 摘要
Circular RNAs (circRNAs)是近些年新鉴定的一类长链非编码RNAs,其表达具有组织和发育阶段特异性。研究表明circRNAs具有潜在调控功能,尤其是脑,脑中含有丰富的circRNAs。本研究目的是阐明人胎儿脑发育期circRNAs的表达谱变化。检测到大量差异变化的基因包括环状的和线性的转录本,许多来源于同一个基因,说明这两种分子的调控是不同的。综合研究显示环状与线性的RNA的表达谱是独立的,circRNA转录本的丰度和种类在不同的发育阶段有不同的特征。
2 研究方法
2.1 材料(作者并未做RNAseq实验,而是下载的数据)
根据来源数据的描述:人大脑皮层组织的获取,处理,测序等按照Liu et al.描述的进行。本研究过程获得Human Gamete, Embryo, and Stem Cell Research(GESCR) Committee (Institutional Review Board) at University of California, San Francisco (10-03379)的批准。病人捐献的样本也已获得知情同意,并通过法律伦理的要求。所有的实验方法遵从Helsinki的声明。由中心向周边辐射取圆柱形组织50-100mg,TruSeq Stranded Total RNA with Ribo-Zero Gold kits (Illumina)建库。
我们下载4个rRNA去除的 RNAseq数据(GEO编号,GSE71315,一个是GW13, 一个是 GW14.5, 两个是GW23;GW13, GW14.5是同一组的两个生物学重复,代表胎儿大脑组织发育的早期,GW23代表后期)。
2.2.0 生信分析技术路线(Fig. S1)。
2.2.1 线性转录本分析:reads比对,转录本拼接,差异检测
4个样品共获得632 百万成对reads,两个来源于早期,两个是后期。Tophat将reads比对到UCSC human reference genome build hg38,Tophat使用默认参数即允许两个错配。Cufflinks将比对好的reads拼接成转录本。Fragments Per Kilobase of transcripts per Million fragments mapped (FPKM)对转录本进行定量和标准化,gencode v26 annotation用于拼接时注释。至少一个阶段基因FPKM≥1认为基因有表达。Cuffdiff两分组基因差异分析,并基于t-test得到的p-value计算校对值q-value。q-value<0.05认为有统计学意义。
2.2.2 环状转录本分析:reads比对,转录本拼接,差异检测
上述来源的FASTQ文件,先用BWA MEM (http://bio-bwa.sourceforge.net/)比对到UCSC human reference genome build hg38,设置仅保留比对得分值大于19bp。使用CIRI (version 2.05)进行环状RNA的检测和定量,该软件对比对的reads扫描PCC信号(paired chiastic clipping signals),连接reads的两部分比对到参考基因组相反的顺序。gencode v26 annotation用于注释参考,R包:edgeR基因表达差异分析。FDR<0.1认为有统计学意义。
2.2.3 线性、环状转录本pathway分析
ClusterProfiler包用于线性和环状RNA通路分析,用cuffdiff基因差异分析得到的1125个基因进行富集,对edgeR circRNA差异分析得到104个基因(p<0.05)进行通路富集分析。
3 结果
3.1 早期和后期胎儿大脑皮层线性转录本表达谱
基于一个比较基准,我们分析了大脑皮层组织基因表达谱,首先分析每个样品的线性转录本,早期(GW13 and GW14.5) and后期 (GW23)分析显示共有16591个基因表达(Table 1)。其中1125个基因有显著差异(q < 0.05)(Table S1)。GO富集结果包括DNA packaging(DNA包装),regulation of mitotic nuclear division(有丝分裂调控), and positive regulation of nervous system development(正调控神经系统发育)并分为三大类(Fig. S2),themed cell division(特定细胞分裂), DNA replication(DNA复制), and the nervous system(神经系统)。
3.2 早期和后期胎儿大脑皮层环状转录本表达谱
3.2.1 环状转录本鉴定
在早期和后期胎儿大脑皮层中分别鉴定到4324 and 4425 circRNAs;6550个在两个阶段共有表达(Table 1)。39%表达的基因会产生circRNA转录本。大部分的circRNAs由基因外显子剪接而成,占93-94%(Fig. 1)。少部分比对到基因组的内含子和基因间区。
3.2.2 热点基因(Hotspot genes)
能够产生10以上不同circRNAs的基因称为热点基因,如Table 2,鉴定到19个这类基因。3个热点基因主要在早期表达,9个主要在后期,7个两期都有。大部分基因表达一个circRNA,与组织区域没有依赖性(Fig. 2)。
使用配对精确检验,edgeR共鉴定到104个差异表达的circRNA (p < 0.05, Table S2),前三个circRNAs FDR<0.1: SATB homeobox 2(SATB2), regulating synaptic membrane exocytosis 1 (RIMS1), and CTC-525D6.1 (also known as AC011474.1) 三个circRNAs表达均升高。如(Table 3),我们发现倍数变化最大的circRNAs是SATB2,log2-scale值是8.21,三者的线性转录本的差异不明显(Fig. 3),circRNA是该基因仅差异表达的类型。
3.2.4 差异表达circRNAs通路分析
共104个差异表达circRNAs,ClusterProfiler鉴定到80个可用于通路分析的基因。结果显示,差异的circRNAs主要与轴突与神经元发育有关:axon development(轴突发育), axon guidance(轴突导向),axonogenesi(轴突生成), neuron projection guidance(神经元凸起导向), forebrain neuron differentiation(前脑神经元分化),positive regulation of neuron projection development(正调控神经元凸起发育)(Table 4)。14 GO术语柱状图,及网络图如Fig. 4。
4 讨论
在人胎儿大脑皮层发育早期和后期共鉴定到6550个circRNAs。39%的基因既能表达线性转录本也能表达环状RNA。有报道称5.8-20%的脑表达蛋白基因能够产生circRNA转录本。本研究发现了如此量大的circRNAs说明circRNA在胎儿脑发育过程中表达丰富。
circRNAs: SATB2, RIMS1, and CTC-525D6.1表达显著上调而其线性转录本表达没有显著差异。最近有研究也显示小鼠发育期脑突触发生时circRNAs的表达与其蛋白编码来源基因的表达没有依赖性。同一个基因两种转录本分开表达说明二者不仅独立合成,而且转录调控也不一样。
三个差异表达的circRNAs的基因或在脑中有重要的功能,或特异性表达。SATB2编码DNA结合蛋白。发育期小鼠大脑皮层,Satb2调控轴突延伸到胼胝体,结果引起胼胝体轴突缺失。人体SATB2缺失,引起发育异常包括智障,语言迟缓,说明SATB2在神经发育中的重要性。本研究中,差异表达的SATB2主要是以各种环状形式的转录本存在。CircRNA的种类由早期的3种增加到后期16种。RIMS1是 RAS基因大家族中的一个,在调控神经传递物质释放,突触前长时程增强时发挥重要作用。小鼠同源基因Rim1a敲除会严重损伤小鼠学习记忆能力。有趣的是,一个遗传视网膜失养症由于RIMS1突变,显著的提高了对许多方面认知功能,而RIMS1突变是这种认知提高的唯一可能解释。CTC-525D6.1: 根据GTEx project (gtexportal.org; data not shown)报道53个人组织,CTC-525D6.1几乎仅在脑组织中表达,说明其在脑组织重要性。综合来看,研究展示了三个基因产生的上调表达circRNAs在脑和神经发育中重要的作用,具体的功能和机制有待后续研究。
差异表达的circRNA、线性转录本通路分析能够富集到特定的分类。线性RNA主要富集到DNA packaging, protein complex assembly and the chromatin silencing,而circRNA主要富集到神经发育激活相关的通路including axon guidance, neuron projection guidance, and forebrain neuron differentiation,提示circRNA的一些生物学功能。我们之前对小鼠脑区域的基因表达谱进行分析也表现出相同规律:差异表达的线性RNA主要与脑功能相关的功能有关如learning, memory, and cognition。而circRNA主要与神经相关的通路有关比如dendrite morphogenesis, synapse organization and axonogenesis。而且,本研究脑形态和功能成型的妊娠期后期,富集到的GO条目涉及到与胎儿发育相关的关键事件如axon development, neuron development, and forebrain development,提示circRNA在脑发育时扮演重要角色。
我们之前发表的人相关研究报道了>20个热点基因,本研究鉴定到了19个热点基因。SYNE2在早期有11环状转录本,后期有3个环状转录本。SYNE2编码外核膜蛋白能够结合胞质蛋白F-actin,该蛋白在人各种组织中广泛表达,其在脑中的功能也已研究很多。SYNE2其中一个环状转录本在后期下降(pvlue 0.03)。SYNE2转录本的表达量和种类下降提示其活性下降。SATB2转录本由早期的3种增加到后期的16种,其中一个circRNAs是表达差异最显著的一个,并在后期大量表达。这些发育阶段特异性的热点基因产生不同转录本,提示不仅是转录本的表达量,转录本的多样性在阶段特异性调控中也起重要作用,可以看出circRNA功能的复杂性。
近期研究显示circRNA能够调控年龄相关的疾病,比如癌,神经组织退化疾病,说明circRNAs在临床实践中有重要的潜能。肝细胞癌中hsa_circ_0001569 and hsa_circ_0005075,胃癌病理相关的hsa_circ_0001895 and hsa_circ_0000190。高表达的circ_001569, hsa_circ_0000069 and CDR1as与结肠癌的病理特征相关如differentiation, distant metastasis, patients' age and tumor, node and tumor size。circRNA在Alzheimer's disease (AD)中可能也有重要的作用。miRNA-7在人脑中高丰度表达,并与ciRS-7相关。推测AD影响的脑细胞缺乏ciRS-7的海绵吸附作用,可能增加MiRNA-7的水平,进而下调MiRNA-7靶基因表达。
5 结论
本研究描述了胎儿脑皮层两个发育时期circRNA转录组的特征,鉴定到差异表达最显著的circRNAs:SATB2, RIMS1, and CTC-525D6.1以及19个热点基因。早期与后期circRNAs表达量与种类均有明显的特异性,提示其在脑发育中关键作用。这些发现说明circRNAs是一类极具潜力的疾病分子标志物,或可成为神经疾病药物靶标。
6 研究思路
材料:
下载4个rRNA 去除的 RNAseq数据(GEO编号,GSE71315,一个是GW13, 一个是 GW14.5, 两个是GW23;GW13, GW14.5是同一组的两个生物学重复,代表胎儿大脑组织发育的早期,GW23代表后期)
分析方法:
线性转录本定量及差异表达分析:Tophat(比对)- Cufflinks(拼接)-Cuffdiff(差异分析)。
CircRNA定量及差异表达分析:CIRI (version 2.05)鉴定和定量,edgeR差异分析。
通路分析:ClusterProfiler进行线性转录本和circRNA的通路分析。
展示结果:
1 生信分析技术路线(Fig. S1)。
2 线性转录本:差异表达统计表(Table 1),差异表达列表(Table S1),GO富集图柱状图和网络图(Fig. S2)。
3 cicRNA:差异表达统计表(Table 1),基因组类型来源统计(Fig. 1),热点基因数量统计表(Table 2),基因与产生circRNA数量关系柱状图(Fig. 2),差异circRNA列表,三个circRNAs差异统计表(Table 3),三个circRNA与其线性转录本散点图(Fig. 3),circRNA通路富集列表(Table 4),柱状图(Fig. 4)。
来第一个抢占沙发评论吧!