非编码 RNA( non-coding RNA,ncRNA) 是生物体内普遍存在,且对生命活动具有重要调控作用的生物分子[1]. 环状 RNA( circular RNA,circRNA) 是广泛且多样地存在于多种生物细胞中,具有调控基因表达作用的一类内源性 ncRNA 分子。 对 circRNA的逐步认识不仅丰富了竞争性内源 RNA( competingendogenous RNA,ceRNA) 的调节网络,而且为我们深入研究一些疾病的发生发展机制和治疗手段提供了新方向。
1 circRNA 的发现
circRNA 最早于 20 世纪 70 年代在 RNA 病毒中被发现[2,3]. 1990 年,人们利用双向凝胶电泳和电镜等技术在一种酿酒酵母( Saccharomyces) 真菌中观察到了 circRNA 分子的踪迹。 这是一种缺少 5'和 3'末端的 20S RNA,具有与丁型肝炎病毒( hepatitis Dvirus,HDV) 相似的特性[4]. 在随后的几十年,人们从一些转录本中也发现了一些由外显子构成的circRNA,如结肠直肠癌缺失基因( delete in colorectalcarcinoma gene,DCC) 转录本[5]、人类 Ets-1 基因( E-Twenty-Six-1,Ets-1) 转录本[6]、性别决定基因( sexdetermining region Y,SRY ) 转录本[7]、细胞色素P450 2C24 基因转录本[8]和环状 INK4 基因座反义非编码 RNA ( circular antisense non-coding RNA inthe INK4 locus,cANRIL)[9]等,但当时它们被认为是转录的"噪音",未引起人们太多的关注。
近年来,随着生物信息学技术的快速发展,circRNA 这一类古老且具有保守特征分子的神秘面纱逐渐被揭开[10]. Salzman 等[11]发现了数以百计的与人类基因表达相关的 circRNA. Jeck 等[12]在人类成纤维细胞中检测到了高达 25 000 多种 circRNA.Memczak 等[13]则从 RNA 测序数据中鉴定出 1 950种人类 circRNA,1 903 种小鼠 circRNA 和 724 种线虫 circRNA. Guo 等[14]发现了与多种人类细胞系相关的 39 种生物样本中的 7 112 种 circRNA. 目前发现的 circRNA,根据其在基因组中的来源及其构成序列的不同,可以分为以下 3 类: 外显子来源的环形RNA 分子 ( exonic circRNA)[11-13,15],内含子来源的环形 RNA 分子( circular intronic RNA,ciRNA)[16]和由外显子和内含子共同组成的环形 RNA 分子( retained-intron circRNA)[17].
circRNA 具有 以下特征:
1 ) 表达水平差异较大[10,11];
2) 不易被核酸外切酶 RNase R 降解[11,12];
3) 具有序列保守性[10,11];
4) 偏好于细胞浆中[15];
5)外显子来源为主;
6) 属于 ncRNA;
7) 可充当 ceRNA的角色调控靶基因的表达;
8) 在转录或转录后水平发挥调控作用[15].
2 circRNA 的主要功能
现有的研究表明,circRNA 在转录及转录后水平具有非常重要的基因表达调控作用( Fig. 1) ,而且,它们通常还呈现组织或发育阶段的特异性表达。
2. 1 具有 miRNA 海绵作用
哈佛医学院 Salmena 等[18]于 2011 年 7 月提出了着名的 ceRNA 调控假说。 该假说认为: ceRNA 的生物 学 功 能 是 通 过 miRNA 应 答 元 件 ( miRNAresponse element,MRE) 完成的,ceRNA 具有数量和种类不等的 MRE,可以竞争性地结合 miRNA,降低miRNA 对其靶标的抑制作用,也就是 miRNA 的海绵作用。 circRNA 上存在多个 miRNA 的互补结合位点,可海绵般吸收 miRNA,以减少 miRNA 对靶基因的负性调控。 同时,因为 circRNA 缺乏多聚( A) 尾和 5'末端,可逃脱脱腺苷、脱帽和降解等[19],所以在充当 miRNA 海绵方面具有明显的优势[13,20]. 具有代表性的 circRNA 有小脑退化相关蛋白 1 反义转录物 ( antisense to the cerebellar degeneration-relatedprotein1 transcript,CDR1as) 和 SRY 的反义链。
CDR1as 由 Hansen 等[21]于 2011 年首次发现。它定位于胞浆中,主要在人和小鼠脑中表达[13,20],含有 74 个 微 小 RNA-7 ( microRNA-7,miR-7) 的MRE,远远多于目前已知的"线性海绵". 它是miR-7的环状抑制剂,对 miR-7 起到负调控作用[22]. 因此,CDR1as 又 被 称 为 miR-7 的 环 状 RNA 海 绵( circular RNA sponge for miR-7,CiRS-7)[22]. 目前还没有发现其它 circRNA 能与 CDR1as 的 miRNA 海绵效果相媲美[14]. 当 CDR1as 高表达时,它能大量结合 miR-7 而导致 miR-7 靶标的表达水平同步增加; 而当 CDR1as 低表达时,miR-7 靶标的表达水平也同步降低[18]. Memczak 等[13]在对斑马鱼的研究中发现,运用 3-氨丙基吗啉敲低 miR-7 表达水平或应用表达人或小鼠线性或环状 CDR1as 序列的质粒转入斑马鱼胚胎中,均可引起中脑容量减少。 但是在注入 miR-7 的前体后,中脑容量的减少能够得到挽救,充分说明了 CDR1as 对 miR-7 的海绵作用。
Hansen 等[21]研究发现,miR-671 能与 CDR1as 完全互补并触发 CDR1as 的裂解,说明 miR-671 能通过抑制 CDR1as 间接调控 miR-7 的表达。研究证实,SRY 基因外显子的反向重复序列可转录成 circRNA 分子[23 -25]. Hansen 等[21]研究发现,SRY 基 因 相 关 的 睾 丸 特 异 性 circRNA 具 有 与CDR1as 类 似 的 功 能,它 拥 有 miR-138 的 16 个MRE,可调控 miR-138 的表达水平。
2. 2 调控基因转录Zhang 等[16]鉴定出一种来源于基因内含子区域的 circRNA,发现这种 ciRNA 分子在细胞核内含量丰富,可参与基因转录调控。 其中具有代表性的为锚蛋白重复结构域 52( ci-ankyrin repeat domain 52,ci-ankrd52) ,它大部分定位于转录位点附近,并可以影响 RNA 聚合酶 II 复合体的延长,是聚合酶 II 复合体的正调节因子,对其母系基因发挥顺式调控作用。 沉默信息调节因子 7( silent information regulator7,ci-sirt7) 也具有类似的作用机制[16].
INK4 / ARF 位点相关的长链非编码 RNA-ANRIL 通过结合 PcG 复合物抑制了编码基因 INK4 /ARF 的转录,该位点同时编码了 cANRIL,推测它也可能具有转录调控功能[9].
2. 3 调控 RNA 结合蛋白。研究显示,有些 circRNA 分子可以吸附蛋白质因子。 如 CDR1as 和 Sry 可与 miRNA 效应因子阿格蛋白( argonaute,AGO) 相结合[13,20],从而被切割或者抑制翻译,最终被降解; 而 ci-ankrd52 与 RNA 聚合酶 II 复合体相互作用可影响该酶的活性,最终调节转录[16]. 另外,Bohjanen 等[26]设计了一种能够特异 地 结 合 反 式 激 活 调 控 蛋 白 ( transactivatingregulatory protein,Tat) 的 circRNA 分子,从而抑制 1型人类免疫缺陷病毒 1 ( human immunodeficiencyvirus type 1,HIV-1) 基因的表达。
2. 4 参与蛋白质翻译。大多数 circRNA 存在于胞质中[27],提示它们可以被装载到核糖体而被翻译成多肽。 与许多没有 5'帽和 3'多聚( A) 尾的线性 mRNA 相似,circRNA 也缺乏有效的翻译起始结构,但是一旦启动了一个内部核糖体进入位点 ( internal ribosome entry site,IRES) ,两者都是可以被翻译的[14]. 丁型肝炎病毒( hepatitis D virus,HDV) 的核心包含有单股负链共价闭合 circRNA 分子,它编码的相关蛋白 HDV 抗原( hepatitis D virus antigen,HDAg) 在疾病发展中起到了重要的作用[28]. 另外,研究者发现,人骨肉瘤细胞 U2OS 中,circRNA 具有翻译功能,尽管其翻译效率非常低[14]. 但是,随着越来越多核糖体分析数据的获得,circRNA 在其它细胞类型或物种中是否能被翻译是一个值得深入研究的课题[14].
另外,Talhouarne 等[29]发现,热带爪蟾的卵母细胞核含有大量的 ciRNA,大多是 1000 nt 的长度,耐核酸外切酶 RNase R,且胞浆内的含量明显多于胞核的含量。 在受精卵发育过程中,ciRNA 可传给子代,显示它在 RNA 介导的遗传和表观遗传中发挥了重要的作用。
3 circRNA 与疾病的关系
随着对 circRNA 结构及功能的逐步认识,人们发现它们在疾病的发生及发展中发挥了重要的作 用[9,22,28,30-56]( Table 1) .
3. 1 circRNA 与肿瘤
肿瘤是机体在各种致癌因素作用下,组织细胞在基因水平失去对其生长的正常调控,导致其克隆性异常增生而形成的异常病变。 肿瘤发病机制复杂,对其发病机制的研究是医学的重大课题之一。如前所述,CDR1as 能间接调控 miR-7 靶标的表达,CDR1as/miR-7 可以通过多种途径影响肿瘤的发生和发展[22]( Fig. 2) . miR-7 直接作用的一些靶标是癌症相关信号通路中的重要癌症相关蛋白,如: 表皮生长因子受体 ( epidermal growth factor receptor,EGFR)[30]、胰岛素受体 底 物 1 ( insulin receptorsubstrate-1,IRS-1 )[30]、IRS-2[30]、p21 蛋白活化激酶-1 ( p21-activated kinase-1, Pak1 )[31]、癌 基 因Raf1[32]、活化的 CDC42 激酶 1 ( activated CDC42kinase 1,Ack1)[33]和磷脂酰肌醇-3 激酶催化亚基 δ( phosphatidylinositol 3-kinase catalytic subunit δ,PIK3CD)[34]等。
在胶质瘤细胞株中,miR-7 能有效抑制 EGFR的表达,同时通过抑制蛋白激酶 B( protein kinase B,PKB) 降低 IRS-1 及 IRS-2 的表达水平,从而降低其活力及侵袭性[30]. Pak1 是丝氨酸苏氨酸蛋白激酶中的一种,内源性 miR-7 与 Pak1 的表达水平成负相关,与同源结构域转录因子 HOXD10 的水平呈正相关。 在乳腺癌低侵袭表型至高侵袭表型转化过程中,Pak1 蛋白水平逐步上调,而 miR-7 及 HOXD10逐步下调。 在高侵袭性乳腺癌细胞中,miR-7 可抑制其增殖活性、侵袭性及致瘤潜能。 显示 miR-7/Pak1通路在乳腺癌发生过程中具有重要的作用[31]. 在肺癌、乳腺癌及胶质母细胞瘤细胞株中,Webster等[32]发现 miR-7 显着降低 EGFR 相关 mRNA 的表达,基因芯片进一步发现癌基因 Raf1、PKB 及细胞外信号调节激酶 1/2 的下降。
在神经鞘瘤细胞中,Ack1 是 miR-7 的直接作用靶标,且两者的表达成反比[33]. 在肝癌细胞中,PIK3CD 是 miR-7 的直接作用靶标,且两者的表达成反比; 在体外实验中,miR-7的过表达通过磷脂酰肌醇 3-激 酶( phosphatidylinositol 3-kinase,PI3K) /Akt 信号通路参与肝癌细胞的周期阻滞和细胞迁移,且 Akt、哺乳动 物 雷 帕 霉 素 靶 蛋白 ( mammalian target ofrapamycin,mTOR) 靶标和 p70S6K 表达下降[34]. 肿瘤干细胞( cancer stem cell,CSC) 在肿瘤的进展及转移中扮演了重要的角色[35]. 研究证实,miR-7 是CSC 中减少最多的 miRNA[36]. Kruppel 样因 子 4( Kruppel like factor 4,KLF4) 是 CSC 中 4 大转录因子之一。 miR-7 的抑癌作用部分可归因于其伴随对KLF4 的去抑制,这在乳腺癌脑转移中发挥了重要的调节作用[36]. 另外,miR-7 通过胰岛素样生长因子 1受体( insulin-like growth factor 1 receptor,IGF1R) 和局灶黏附激酶间接上调钙黏附素导致上皮间质转化( epithelial-to-mesenchymal transition,EMT) 的下降,从而延缓了肿瘤的生长及转移,这在胃癌、鳞状细胞癌、乳腺癌和恶性胶质瘤发生过程中发挥了重要的作用[37 -40]. miR-7 可通 过调控细胞凋亡相关基因---B 淋巴细胞瘤-2 ( B-cell lymphoma-2,BCL-2)的表达来抑制人非小细胞肺癌 A549 细胞的生长[41]. 虽然大量的证据证实了 miR-7 具有抑癌作用,但是相反的作用也有报道,如在结直肠癌中,miR-7 是下调最多的 miRNA,它以癌基因 YY1 转录因子为靶基因,最终导致 p53 的失活[42]. 但是,在结直肠癌组织中 CDR1as 的表达水平明显上升[43].在表达 miR-7 的肺癌 CL1-5 细胞株中,miR-7 的水平与裸鼠移植瘤的体积增大和裸鼠生存率的下降成正相关[44]. 另外,在宫颈癌和肺腺癌细胞株中,抑制 miR-7 分别显示了增殖的下降和凋亡的上升,提示高表达的 miR-7 不一定是抑制肿瘤发生的有利因素[45]. 另外,肾癌细胞的侵袭 和增殖等被认为与miR-7 的高表达有关[46].Bachmayr-Heyda 等[43]在结直肠癌的研究中显示,在肿瘤组织中一些 circRNA 与线性 RNA 的比例( circ0817/CUL5; circ3204/USP3; circ6229/METTL3; circ7374 / TNS4) 较正常组织低,而在结直肠癌细胞株中则更低,这提示 circRNA 的丰度与肿瘤的增殖指标成负相关。
3. 2 circRNA 与动脉粥样硬化
动脉粥样硬化是一组常见且最重要的动脉硬化性血管病。 2010 年,Burd 等[9]发现,cANRIL 表达受人类 INK4a/ARF 转录本调控,且与人类动脉粥样硬化风险相关。 这种影响与剪切位点的单核苷酸多态性相关,它可影响转录抑制因子多梳家族( polycombgroup,PcG) 介导 INK4a / ARF 位点的表达抑制作用,从而影响动脉粥样硬化的发生。 对 cANRIL 表达的进一步研究可望用于预防或治疗动脉粥样硬化。
3. 3 circRNA 与神经系统疾病
小脑退化相关蛋白 1 ( cerebellar degeneration-related protein 1,CDR1 ) 与小脑退化相关蛋白 2( cerebellar degeneration-related protein 2,CDR2) 是浦肯野氏细胞( Purkinje's cell) 抗原。 自 20 世纪 80年代末以来,CDR1 及 CDR2 基因被认为与自身免疫神经系统紊乱密切相关。 CDR1as 是 CDR1 的环状天然反义转录物( natural antisense transcript,NAT) ,最早发现表达于脑组织,尤其是小脑,这与近年分析CDR1as 的图谱结果相符。 通过分析各种肿瘤来源细胞株中 miRNA 的表达情况,显示 miR-7 在神经母细胞瘤中广泛表达[47]. miR-7 也可直接调控 α-突触核蛋白( α-synuclein) 的表达,被认为在帕金森病发病机制中发挥了一定的作用[48].
一些含量丰富的 ciRNA 可以作为在细胞核内针对反式激活反应 DNA 结合蛋白 43 ( trans-activation responsive DNA binding protein-43,TDP43) 和其它 RNA 结合蛋白的"分子海绵",在特定的环境下通过反式作用调节基因的表达。 最近的研究显示,在肌萎缩性脊髓侧索硬化( amyotrophiclateral sclerosis,ALS) 模型中,去除核脱分支酶后,一些内含子来源的套索状结构聚集在细胞浆中,通过降解 TDP43 而抑制其毒性[49]. 为此,我们可以认为一些 ciRNA 在 ALS 的发病过程中起了重要的作用。
3. 4 circRNA 与糖尿病
糖尿病是一组以高血糖为特征的代谢性疾病。
2009 年,Correa-Medina 等[50]发现,miR-7 在胰腺的发育和分化过程中均起着重要的作用。 胰腺 β 细胞的凋亡是 1 型和 2 型糖尿病以及移植后的胰岛丧失的主要原因。 在成人胰腺 β 细胞中,miR-7 抑制剂可诱导 mTOR 信号通路在增殖中的后续刺激效应[51]. 提示 miR-7 是胰腺 β 细胞更新低的可能原因,在糖尿病的发生中发挥了重要的作用,有望成为糖尿病治疗的靶点[51].
3. 5 circRNA 与朊病毒病
朊病毒病( prion disease) 是人类和动物致死性中枢神经系统退行性疾病,包括疯牛病( bovinespongiform encephalopathy,BSE) 、羊痒病( scrapie) 、鹿慢性消耗性疾病( chronic wasting disease,CWD) 、水貂传染性脑病( transmissible mink encephalopathy,TME) 及人的克-雅氏病 ( creutzfeldt-jakob disease,CJD) 和库鲁病( kuru) 等[52]. 绝大部分朊病毒疾病具有传染性,其特征在于由朊蛋白( prion protein,PRNP) 基因编码搔痒型或致病型朊病毒 ( scrapieprion protein,PrPSc) 在脑内蓄积,它是细胞型朊蛋白( cellular prion protein,PrPC) 的同分异构体,在氨基酸序列上具有一致性[52]. 从生物化学的角度来讲,与 PrPC 不同,PrPSc 因富含 β 折叠结构,具有去污剂不溶性和抗蛋白酶降解[53]. 2009 年,Satoh等[53]利用 KeyMolnet 生物信息学工具,揭示了 PrPC及其相互作用蛋白的复杂分子网络,发现它们与AKTJNK 和 MAPK 信号通路显着相关。 为了进一步识别人类细胞中受 PrPC 调控的基因,Satoh 等[54]利用位点特异性重组技术建立了一种 P1 指定稳定表达 PrPC 的人胚肾 HEK293 细胞系,利用微阵列在12 814 个基因中确定了 P1 和母系朊蛋白非表达细胞株间表达差异的 33 种基因,进一步利用 Northern印迹分析,验证了 P1 脑特异性蛋白磷酸酶 2A 调节性 β 亚 基 ( protein phosphatase 2A,regulatory βsubunit B,PPP2R2B) ( 它是脊髓小脑共济失调 12致病相关基因相关表达产物) 和 CDR1 基因与副肿瘤性小脑变性相关,并且发现 PrPC 的高表达可促进CDR1as 的表达。 这些结果表明,PrPC 可能参与了CDR1as 的调控,揭示了 CDR1as 在朊病毒病中的作用是值得研究的方向[19].
3. 6 circRNA 与病毒性肝炎
丁型肝炎病毒( hepatitis D virus,HDV) 基因组是一条反义单股负链闭合 circRNA 分子,直径约 36nm,含有约 1 780 个 nt,是已知感染动物最小的病毒。 HDV 能产生丁型肝炎病毒抗原( hepatitis Dvirus antigen,HDAg) ,它有 2 种形式: 大 HDAg ( 27kD) 和小 HDAg( 24 kD) . 它们在 HDV 感染过程中发挥不同的作用,小 HDAg 在感染的早期阶段产生,进入细胞核,并支持病毒复制; 大 HDAg 与此相反,在感染的晚期阶段生产,抑制病毒复制。 HDV 被认为是一种"缺陷病毒",只有在感染乙型肝炎病毒( hepatitis B virus,HBV) 情况下才能传播[55]. HDV的感染分为两种情况: 一种是 HBV 和 HDV 同时感染( coinfection) ,另一种是慢性乙型肝炎或乙肝携带者状态的基础上重叠感染( superinfection) ,它们较HBV 单独感染患者更容易引起严重的并发症,如肝衰竭、肝硬化及肝癌[56].
3. 7 circRNA 与疾病的治疗
基因敲除、反义寡核苷酸和 miRNA 海绵是使miRNA 功能丧失的 3 种经典方法[57]. 基因敲除动物模型的构建是耗时、昂贵和困难的。 化学修饰的反义寡核苷酸在短期实验是有用的,但是无法实现miRNA 的长期抑制。 miRNA 的海绵技术被认为有可能替代基因敲除技术的一种新型技术[58]. 当miRNA 海绵被转染入人细胞中,它们抑制 miRNA靶标的强度与反义寡核苷酸具有同等效力。 针对致癌基因的海绵能够逆转人类肿瘤细胞的恶性表型[59]. 人工海绵是 RNA 治疗中强有力的手段[60],随着近年来多种线性海绵的发现,circRNA 海绵也初现端倪。 如 Liu 等[61]运用 T4 噬菌体基因 td 自身剪切所构建的针对 miR-21 及 miR-221 的 circRNA海绵导入黑色素瘤细胞株中,结果发现,circRNA 较线性 RNA 分子显示了出众的抗癌效果。 显示circRNA 在疾病治疗中具有广阔的前景。
4 问题与展望
随着对 RNA 调节网络研究的深入,circRNA 在其中发挥的作用逐步凸显。 最近的研究显示,circRNA 将超越线性 RNA 分子,成为下一代的"miRNA 海绵". 针对这类 RNA 分子的鉴定和功能研究,不仅丰富了我们对真核生物转录组的认识,而且对于如肿瘤、动脉粥样硬化及糖尿病等常见、多发及难治性疾病的发病机制及治疗手段的研究提供了新的方向,如探索 circRNA 在疾病发生中的作用机理、作为分子标记物的诊断价值及在疾病治疗中的作用等。 我们相信,随着对 circRNA 的进一步研究,在后基因组时代将为我们开启一扇基因及疾病研究的大门。
为什么没有参考文献?