原创:
Translation and functional roles of circular RNAs in human cancer
环状RNA在人类癌症中的翻译和功能
期刊:Mol. Cancer 影响因子:10.679
发表单位:徐州医科大学
最近几年circRNA研究是科研的一个重要热点,circRNA翻译蛋白发挥功能成为circRNA研究的新星。
本文是一篇描述circRNA的综述,总结了近年来新发现的circRNA的编码能力相关信息。主要包括:
1)circRNA的编码蛋白通过怎样的机制产生;
2)如何检测和验证circRNA的编码潜能;
3)circRNA的编码蛋白发挥了怎样的功能,特别是在人类癌症中的作用。
摘 要
环状RNA(circRNA)是一类由共价闭合环通过反向剪接形成的非编码RNA。最近的研究方法已经能够对circRNA进行深入的研究和鉴定潜在功能。circRNA在各种生物学功能中起着重要作用,例如作为microRNA海绵、转录调节剂以及与RNA结合蛋白的结合。最近的研究表明,一些胞质circRNA可以有效翻译成可检测的多肽,揭示了circRNA在细胞生理功能中的重要性。内部核糖体进入位点(IRES)和N6-甲基腺苷(m6A)修饰帽的非依赖翻译起始被认为是circRNA翻译的潜在机制。迄今为止,已发现几种翻译的circRNA在人类癌症中起关键作用。本篇综述介绍了circRNA的特性和功能,并对circRNA翻译起始的可能机制和翻译能力的复杂性进行了阐述,以及总结circRNA编码蛋白在人类癌症中的功能。circRNA翻译的工作将打开一个隐性的人类蛋白质组,增强我们对circRNA在人类癌症中重要性的了解,但目前为止这方面的研究还很少。
正 文
环状RNA(circRNA)是一种由非标准的反式剪接事件产生的新型内源RNA。在circRNA中,下游剪接供体位点可与上游剪接受体位点共价连接。1976年在RNA病毒中发现了第一个circRNA分子,1991年通过电子显微镜在真核细胞系中观察到了circRNA。此后,circRNA长期以来一直被认为是异常的剪接事件。由下一代测序项目和生物信息学算法产生的基因组和转录组数据已经在真核生物中发现了大量circRNA,清楚地表明它们不仅仅是偶然的副产物或“剪接噪音”。
高通量技术以及circRNA挖掘生物信息学算法的改进,使circRNA的识别和潜在功能的深入表征成为可能。circRNA已被证明是一类丰富且保守的RNA,并以复杂的组织,细胞类型或阶段特异性方式广泛表达。最近的研究证实了circRNA的重要生物学功能,尤其是在人类癌症中。circRNA可以作为转录调节因子调控宿主基因的表达,或充当microRNA海绵调控miRNA-mRNA调节轴。由于circRNA具有稳定的特性,它们可以作为预后的生物标志物。已有多项研究证实了circRNA编码隐性肽,在很大程度上拓宽我们对细胞生理功能的认识。circRNA被认为是“非编码”元件,circRNA的翻译将为癌症的治疗和诊断提供新的见解。本篇对circRNA翻译起始的可能机制和翻译能力的复杂性进行了描述,并总结了circRNA编码蛋白在人类癌症中的新功能。
1、 circRNA特征
circRNA的属性
circRNA由前体mRNA的3'剪接位点连接到下游5'剪接位点剪接产生。根据circRNA包含的序列类型可分为3类:外显子circRNA(EcRNA)、内含子circRNA(CiRNA)和外显子-内含子circRNA(EIcRNA)。已有文献报道,一些内含子circRNA被隔离在细胞核,而外显子circRNA则被输出到细胞质。目前发现的circRNA主要以外显子circRNA为主,广泛在细胞质中检测到。
circRNA的结构缺少5'帽和3'尾,这使其对核糖核酸酶(如RNase R)的消化具有抗性,并具有比线性RNA高10倍的半衰期。大多数circRNA序列是高度保守的,最近的研究表明,最近的研究表明,大约15000个人类circRNA序列可以在小鼠或大鼠基因组中检测到。circRNA通常在绝大多数人体组织中表达,在人脑中尤其高表达。circRNA的表达总是以组织或细胞特异性的方式进行,这使得它们成为人类癌症生物标志物研究的合适候选。
circRNA的全基因组分析
去核糖体RNA的RNA-seq方法已广泛用于发现新的circRNA。该方法可以同时提供编码和非编码RNA的表达数据。circRNA的可靠定量需要足够的测序深度,以确保circRNA的识别。Salzman等使用去rRNA的RNA-seq鉴定了人类癌症中“杂乱”的外显子和潜在的circRNA。在最近的研究中,Memczak等系统地研究了人类、小鼠和线虫circRNA,发现circRNA以组织和发育阶段特异性方式表达。在测序前采用全基因组RNA外切酶富集策略产生样品中circRNA的富集,可以鉴定出更丰富的circRNA。
用于鉴定新circRNA的生物信息学方法正在不断发展,这些方法主要根据跨测序reads的反式剪接连接的存在鉴定circRNA,将连续比对到基因组或转录组的测序reads过滤,非连续比对的用于识别反式剪接连接。测序错误和比对不匹配会导致假阳性识别,开发这些算法是为了减少基于reads计数、已检测样本数量、RNase R抗性的假阳性,但也不可避免地导致无法检测某些特定的circRNA亚型。在缺乏明确的金标准数据的情况下,多个circRNA预测算法的组合可以在很大程度上将假阳性率降至最低。
circRNA的功能
迄今为止,仅对一小部分已鉴定的circRNA的生物学意义得到了研究,其中大部分是在细胞质中起miRNA海绵的作用。最具代表性的circRNA是ciRS-7,它包含miR-7的70多个保守结合位点。circHIPK3充当各种miRNA的海绵,以微调转录活性。circRNA的另一个重要功能是充当蛋白质海绵,通过特定蛋白质与circRNA的结合,形成蛋白质的分子库,并充当诱饵促进对细胞外刺激的快速反应。
2、 circRNA的翻译
传统观点认为,5'和3'非翻译区(UTR)是真核细胞中翻译起始的必要元件。由于不存在5'和3'末端,因此circRNA被视为非编码RNA。最近越来越多的证据表明,circRNA可能与多聚体有关,其中一些包含起始密码子AUG和具有良好长度的假定开放阅读框(ORF),表明circRNA具有蛋白编码潜能。circRNA实际上可以编码调节肽,并且可能存在由circRNA编码的隐性蛋白质组。
Chen和Sarnow人工构建的工程circRNA可以募集40s核糖体亚基,并在体外启动可检测肽的翻译,但是该试验不支持circRNA在体内也可以是可翻译分子的观点。Abe等证明了内源性circRNA作为翻译模板的有力证据,包含无限ORF的circRNA可以通过滚动循环放大机制进行高效翻译,产生大型蛋白聚合体。Legnini等报道circ-ZNF609是ZNF609外显子2的反向剪接产物,可以在成肌过程中以剪接依赖性和帽依赖性的方式翻译成蛋白质。这些工作有力地支持了内源性circRNA的编码潜力,同时提出了一个
问题:circRNA如何被非规范启动机制翻译?
circRNA的非帽依赖性的翻译起始机制
帽依赖性翻译是真核细胞中mRNA翻译起始的主要模式,在RNA合成过程中将7-甲基鸟苷帽添加到mRNA的5'端以进行翻译起始,这种结构可以由eIF4E翻译起始因子(一种包含eIF4E、eIF4G和eIF4A的蛋白质复合物)来组织。某些情况下,例如细胞应激或病毒感染,采用了一种帽依赖性翻译的替代机制通过内部核糖体进入位点(IRES)启动mRNA翻译,IRES是位于mRNA 5'UTR中的序列,可以直接募集核糖体启动翻译。IRES介导的翻译最初在RNA和DNA病毒中鉴定出,一些研究报道真核mRNA也可以在应激条件下通过IRES介导的方式进行翻译,当经典翻译发生改变时,该翻译机制可以补偿有缺陷的帽依赖性翻译。最近已表明,IRES介导的翻译在哺乳动物发育过程中起着关键的调控作用。人类基因组中IRES元件的高通量筛选表明,约10%的人类mRNA含有IRES元件,然而IRES介导的翻译的生物学意义仍有待发现。由于缺少5'帽和3'末端,circRNA的翻译只能以非帽依赖性的方式启动,IRES介导的方式是circRNA翻译起始的广泛形式之一。最近的研究表明,在人工构建体中体外合成的circRNA可以通过工程IRES和分离的GFP序列的反向剪接成功翻译。如果所得的circRNA可以从IRES成功翻译,则可以生成功能性GFP蛋白。但迄今为止,circRNA中的IRES数量仍然未知。最近使用细胞报告系统进行的无偏见工作鉴定出大量具有类IRES活性的富含AU的基序(~10 nt)能够启动circRNA翻译。片段长度大于50 nt的任何circRNA都可能偶然包含类IRES六聚体,可以很容易地满足IRES对circRNA的需求,表明IRES介导的circRNA非帽依赖性翻译机制在细胞质中的重要性和普遍性。(注:circRNA IRES翻译模式)
另一种重要的非帽依赖性翻译机制是通过5'UTR中以N6-甲基腺苷(m6A)形式存在的甲基化腺苷残基。已有研究表明,5'UTR中的m6A可以直接与真核起始因子3 (eIF3)结合,征募43S预启动复合物并绕过m7G帽,实现了非帽依赖性翻译启动模式。最近的一项研究表明,5’URT m6A残基在综合应激反应过程中控制核糖体扫描和随后的起始密码子选择。ATF4 mRNA的重新启动受eIF2α信号通路和响应氨基酸饥饿的m6A修饰的调节,干扰m6A脱甲基酶和甲基转移酶会影响ATF4翻译,因此m6A形式的5'UTR甲基化在选择性翻译中起动态调节作用。利用m6A-seq方法,发现其它转录本5’UTR中的m6A也可以调节起始密码子的选择,从而控制选择性翻译。利用circRNA报道基因,发现一些含有m6A的短RNA元件具有类IRES的活性启动circRNA翻译。Yang等人发现,最丰富m6A的短RNA元件在circRNA序列中富集。单个m6A修饰足以启动带有起始因子eIF4G2和m6A reader蛋白YTHDF3对circRNA的翻译,耗尽m6A脱甲基酶FTO可抑制circRNA的翻译,敲除m6A甲基转移酶METTL3/14则可在应激条件下促进circRNA的翻译。使用RNase R处理的高通量m6A-seq表明,至少13%的circRNA携带m6A修饰,250个circRNA与多聚体相关,它们可能具有积极的翻译潜力。(注:circRNA m6A翻译模式)
IRES和m6A介导的翻译起始都是circRNA翻译的重要机制(图1)。尚不清楚真核细胞中是否还有其它非帽依赖性机制来启动circRNA翻译。
图1,circRNA在真核细胞中的非帽依赖性翻译。circRNA可以分为三种不同类型:外显子circRNA(EcRNA)、内含子circRNA(CiRNA)和外显子-内含子circRNA(EIcRNA)。CiRNA和EIcRNA通常位于细胞核中,EcRNA通常位于细胞质中。内部核糖体进入位点(IRES)和N6-甲基腺苷(m6A)介导的非帽依赖性翻译起始是circRNA翻译的潜在机制,这些结构允许内部募集40S核糖体亚基。
用于识别circRNA编码能力的生物信息学工具
利用生物信息学方法对具有编码潜力的circRNA进行系统识别是必要的,并可为circRNA衍生蛋白的功能研究提供思路。本篇总结了预测circRNA编码能力的生物信息学工具(表1)。(注:circRNA翻译蛋白预测工具,在上海生因生物做全转录组测序分析,可免费提供circRNA编码能力预测)
1)准确定量评估circRNA的编码潜力。ORF Finder可以按用户提供的序列查找所有可能的ORF。CPC(编码潜能计算器)是一种广泛使用的算法,可基于六个生物学上有意义的序列特征来评估转录本的蛋白质编码潜能,对编码潜力的预测依赖于使用成对同源性搜索蛋白质证据的序列比对。PhyloCSF(系统发生密码子替换频率)使用多重比对计算系统进化保守评分确定该序列是否可能代表保守的蛋白质编码区。CPAT(编码潜能评估工具)是一种无需比对的算法,可以使用逻辑回归基于四个序列特征来区分编码和非编码转录本。结合这些工具进行编码电位预测,可以在很大程度上减少误报。
2)IRES元素识别,其基于许多IRES的序列和结构是已知的。IRESite是一个数据库,可用于检查细胞内部核糖体进入位点。CircInteractome数据库允许通过IRES序列研究潜在的circRNA翻译。IRES finder是一种改进的计算方法,可用于执行IRES的全面搜索。
3)具有编码潜力的circRNA特征分析。Pfam是用于推定序列同源性搜索的工具,一个域的识别为其功能提供了生物学上的见解。使用NetNGlyc 1.0、NetOGlyc 3.1和NetPhos 3.1工具可以预测NG糖基化位点、粘蛋白型O-糖基化位点和磷酸化位点。有些研究建立了集成的生物信息学工具来识别具有蛋白编码潜力的circRNA,如CircPro和CircCode。
评估circRNA翻译的试验方法
经过计算评估,希望通过试验验证circRNA是否确实可翻译,核糖体谱分析和多体分级分离使翻译的全局分析成为可能。核糖体图谱可以捕获主动翻译的核糖体足迹,从这些足迹中可以推断出核糖体的密码子运动。最近在人类心脏中使用核糖体分析对全基因组全转录组进行了表征,在存在于核糖体印迹中的反式剪接连接处,共鉴定了由39个基因产生的40个核糖体结合的circRNA。通过蔗糖密度梯度离心的多体分级分离可以在全基因组范围内直接确定circRNA的翻译效率。这两种方法是互补的,可实现全基因组翻译分析。对于那些由circRNA编码的潜在肽,质谱是一种广泛用于肽检测的平台。
circRNA在人类癌症中的翻译
到目前为止,已经发现了几种翻译的circRNA在人类癌症中起着关键作用(表2)。
circSHPRH在神经胶质瘤中的翻译
一个由SNF2组蛋白连接蛋白PHD环解旋酶(SHPRH)基因产生的新circRNA被鉴定。成熟的circSHPRH通过外显子26至29的反向剪接形成,总长度为400个核苷酸。UGAUGA的motif包含重叠的起始密码子和终止密码子(起始密码子为AUG,终止密码子为UGA)。circSHPRH是在真核细胞中发现的第一个在蛋白翻译过程中具有重叠起始和终止密码子的circRNA,编码146个氨基酸的蛋白质(SHPRH-146aa),并在肿瘤发生过程中表现出抑癌活性。进一步的分析表明,SHPRH-146aa保护SHPRH蛋白免受泛素蛋白酶体的降解。另一项研究表明,circSHPRH被鉴定为肝细胞癌的生物标志物,因此有理由推测circSHPRH有可能在其它人类癌症中被翻译。
circLINC-PINT在脑胶质瘤中的翻译
circLINC-PINT源自p53诱导的长基因间非编码RNA转录本(LINC-PINT),其编码具有87个氨基酸的肽(PINT87aa),该1084 nt 的circRNA是由外显子2的环化形成。PINT87aa主要集中在细胞核内,对细胞的增殖和肿瘤的发生具有抑制作用。PINT87aa可以与PAF1复合物相互作用,抑制多种致癌基因的转录延伸。作为PAF1复合物的结合伴侣,PINT87aa在决定PAF1复合物的正确定位中起着重要作用。
circβ-catenin在肝细胞癌中的翻译
Wnt/β-catenin通路在肝细胞癌已得到广泛的研究。GSK3β诱导的β-catenin磷酸化和降解可导致Wnt通路的激活,这与肝细胞癌的肿瘤发生和不良预后有关。circβ-catenin是由CTNNB1基因的外显子2到7反向剪接产生的,形成1129 nt circRNA分子。在circBase中,总共24个circRNA可以来源于CTNNB1基因,而circβ-catenin是肝细胞癌中唯一表达的同工型。circβ-catenin产生一个370个氨基酸的肽(β-catenin-370aa),主要位于细胞质中。体外和体内试验表明,circβ-catenin可通过激活Wnt途径促进肝细胞癌细胞生长。β-catenin-370aa充当GSK3β的诱饵,可以逃避GSK3β诱导的β-catenin降解。
circFBXW7在神经胶质瘤和乳腺癌中的翻译
抑癌基因E3连接酶FBXW7产生了一个名为circFBXW7的circRNA。circFBXW7源自FBXW7基因的外显子3至外显子4的反向剪接,长度为620 nt,编码一个185个氨基酸的肽(FBXW7-185aa)。FBXW7-185aa被认为在神经胶质瘤中起抑癌作用,它与去泛素化酶USP28竞争性相互作用,后者拮抗USP28诱导的c-Myc稳定性。另一项最新研究表明,FBXW7-185aa可通过增加FBXW7的丰度并诱导c-Myc降解来抑制三阴性乳腺癌细胞的增殖和迁移。
circPPP1R12A在结肠癌中的翻译
由PPP1R12A基因产生的新circRNA,circPPP1R12A,具有216 nt的ORF,可编码一个73个氨基酸的肽段(circPPP1R12A-73aa)。与circSHPRH类似,环化过程在蛋白质翻译过程中包含重叠的起始和终止密码子。circPPP1R12A的表达在肿瘤中显著上调,在结肠癌中表现出抑癌活性。功能分析表明,circPPP1R12A -73aa可以通过激活结肠癌中的Hippo-YAP信号通路促进增殖和转移能力。
circAKT3在胶质母细胞瘤中的翻译
由AKT3基因产生的名为circAKT3的circRNA,从AKT3基因的第3外显子到第7外显子生成,全长524 nt,编码一个174个氨基酸的新蛋白(AKT3-174aa)。circAKT3表达的分析表明,AKT3-17aa具有潜在的抑癌活性。AKT3-174aa可以与磷酸化的PDK1相互作用,并限制AKT3-thr308磷酸化作为分子诱饵,并在调节PI3K/AKT信号强度中起负调节作用。
3 、未来展望
尽管circRNA是介导许多基本细胞过程的关键调节因子,但由于其任意位点的重构,它们一度被认为是非编码的。但最近的研究表明,circRNA在人类癌症中起着关键作用。circRNA的翻译将打开一个隐性的人类蛋白质组,并增强对circRNA在人类癌症中的重要性的了解,但目前为止,该研究还很少进行探讨。据报道,一些circRNA通过编码的肽和基于RNA的调节机制发挥其生物学功能。例如,circ-SHPRH可以编码SHPRH-146aa肽抑制神经胶质瘤的肿瘤发生,并且它以作为miRNA海绵抑制肝细胞癌过程。circZNF609可以作为miRNA海绵促进乳腺癌过程,并且可以编码肌发生蛋白。某些circRNA在人类癌症中具有双功能,而circRNA的双功能能力仍有待探索。
这些报道的circRNA编码的肽通过干扰癌症的新陈代谢或转移而具有显著的抗肿瘤功能。因此,circRNA编码的肽具有成为治疗靶标和肿瘤生物标志物的巨大潜力。circRNA编码的多肽具有较高的肿瘤特异性,将成为抗肿瘤蛋白药物筛选的新资源。迄今为止,肿瘤生物标志物在早期发现、精准医疗和预后预测中起着重要作用。这些circRNA编码的肽具有巨大的潜力,可以用作有用的肿瘤生物标志物。综上所述,对circRNA编码蛋白的研究将为癌症的诊断和治疗提供新的途径。
结 论
circRNA的翻译及其在人类癌症中的功能作用已获得新的见解。在这篇综述中,总结了circRNA可以用作翻译模板的可能情况。circRNA的研究开辟了一个新的视角,毫无疑问,不久的将来将会发现越来越多的新circRNA编码蛋白。隐性的人类蛋白质组将使我们了解circRNA在人类癌症中的重要性。
来第一个抢占沙发评论吧!