基因编辑技术发展及其在家畜上的应用( 二 )


02
TALEN 技术
TALEN 也是一种人工合成的核酸酶,1989 年转录激活样效应因子(trancription activator-like effector, TALE)首次在感染植物的一种细菌—黄单胞菌(Xanthomonas)中被发现(Bonas et al., 1989) 。TALE 通过细菌III类分泌系统进入细胞,通过与特异基因启动子结合来调节转录,促进细菌的集落形成 。科学工作者将 TALE 具有的特异性结合能力与 FokI核酸酶具有的切割能力相结合,制作出了具有特异性基因组编辑能力的工具 TALEN,TALEN 技术由此产生,并被迅速用于生物技术方面的研究,逐渐取代了ZFN技术(Bedell et al., 2012) 。
与ZFN相类似,TALEN也由两部分组成 。一部分是 TALE 蛋白 DNA 结合结构域,另一部分是与 ZFN 相同的 FokI核酸酶切割域,前者负责目标序列的特异性识别,后者进行靶位点的切割(Moscou, Bogdanove, 2009) 。TALE由N端转运信号、C端核定位信号、转录激活结构域和 DNA 结合结构域构成(Deng et al., 2012; Ul et al., 2015) 。DNA结合结构域由多个重复序列组成,每个重复序列由33~35 个氨基酸组成,其模块内的第 12 和 13 位的氨基酸具有两个多态性,称为双氨基酸残基(repeatvari- able diresidues, RVD) (Osborn et al., 2013) 。鉴于该 DNA 结合结构域的模块化特性,可以将具有不同特异性的 RVD 组装成阵列以靶向特异性的 DNA 序列 。FokI核酸酶与TALE 的 C 端相连,通过识别特异的 DNA 序列,对其进行定点切割,引起 DSBs,并且启动细胞自我修复机制,以 HDR 或 NHEJ 的方式,实现对特定基因的靶向修饰,包括基因敲除、敲入和基因定点突变等(Hinkley et al., 2011; Li et al., 2011) 。Carlson 等(2012)将 TALEN 技术应用于猪 (Sus scrofa)和牛(Bos taurus)的胚胎基因组编辑,引起家畜基因组的的特定遗传修饰,包括单等位基因敲除、双等位基因敲除以及基因敲入等等,改变了家畜物种的遗传学组成和基因组的结构和功能 。TALEN 基因编辑技术是一种崭新的分子生物学工具,被认为是基因编辑技术发展史上的里程碑,是继 ZFN 之后的第二代基因编辑技术,被《Science》杂志评选为 2012 年度十大科学突破的新技术 。
03
CRISPR/Cas9 技术
Ishino等(1987)在大肠杆菌(Escherichia coli)中发现了成簇的规律间隔的短回文重复序列,到 2012 年,科学家才正式命名为 CRISPR 。后来又一种经过人工改造的核酸内切酶,即 CRISPR/Cas 技术,迅速在动物、植物、微生物上得到广泛应用(Nakasuji et al., 2017; Ryder et al., 2017; Xie et al., 2018) 。
CRISPR/Cas 系统两部分构成,即 CRISPR 和 Cas 核酸酶 。CRISPR 是指成簇的规律间隔的短回文重复序列(Mojica et al., 2000),其序列由一个前导区(leader)、多个短的重复序列区(repeat)以及多 个间隔区(spacer)构成(Makarova et al., 2006) 。leader长度通常在400bp左右,其序列上富含A、T碱 基,负责启动 CRISPR 序列的转录(Sorek et al., 2008) 。repeat形成发卡结构,含有长度为22~48 bp 的回文序列(Grissa et al., 2007) 。长度为26~73 bp 的 spacer 将各个重复序列隔开(Deltcheva et al., 2011; Karginov, Hannon, 2010) 。Cas核酸酶即 CRISPR 相关蛋白,现在基因工程中最常用的核酸酶是 Cas9 蛋白,该蛋白是一种多结构域核酸酶蛋白(Mojica, Montoliu,2016) 。
CRISPR/Cas 系统主要被分为三类:I型、II型 和III型 。目前,被广泛应用的是来源于II型的 CRISPR/Cas9系统由Cas9核酸内切酶、CRISPR RNA(crRNA)、反式激活crRNA(tracrRNA) 组成。Cas9 核酸酶与两种 RNA 成分形成复合物,crRNA 在目标识别中发挥作用,而 tracrRNA 在复合物形成过程中在 crRNA 成熟和 Cas9 蛋白的稳定中发挥重要的作用(Jinek et al., 2012) 。crRNA和tracrRNA均具有非编码能力并且彼此部分互补(Feng et al., 2013),两种 RNA 组分形成一种称为单向导 RNA (sgRNA)的嵌合 RNA(Doudna, Charpentier, 2014) 。Cas9 核酸酶具有两个独立的 Ruvc 和 HNH 结构域,当CRISPR/Cas9复合物与PAM(protospacer adjacent motif)序列结合时,这些结构域都被激活,HNH 参与互补链的切割,而 Ruvc 参与切割非互补链,两条链在重新接合后导致移码突变或插入缺失(Jinek et al., 2012) 。Cas9核酸酶行使功能最重要的区域是PAM序列区域,PAM序列涉及CRSIPR/Cas9复合物与靶区域的早期关联,PAM 基序的序列通常是 NGG,且存在于靶序列的下游区域(Ran et al., 2015) 。现在,CRISPR 系统组件已经简化为两部分,即Cas9核酸内切酶和sgRNA(Doudna, Charpentier, 2014; Jinek et al., 2012; Ma et al., 2016) 。
CRISPR/Cas 系统的发展日新月异,呈现了多元化发展的趋势 。2015 年美国麻省理工学院张锋团队发现了类似于 Cas9 但结构更简单的核酸酶— Cpf1,Cpf1不需要核糖核酸酶(RNase III)和 tracrRNA 便可独自完成对 crRNA 的加工成熟过程 (Zetsche et al., 2015) 。该研究团队还发现了一种只靶向和切割细菌内特异 RNA 序列的新型蛋白—C2c2(Abudayyeh et al., 2016) 。C2c2作为一种新发现的针对 RNA 的分子生物学工具,将被用于 RNA 的功能、运动和定位研究中 。此外,美国哈佛大学 David Liu实验室2016年首次发现了基于胞嘧啶脱氨酶与 CRISPR/Cas9 融合形成的单碱基编辑技术 (base editor, BE),该技术实现了胞嘧啶(cytosine, C) 到胸腺嘧啶(thymine, T)的单碱基转换(Komor et al., 2016) 。2017年,该实验室再次取得重要进展,建立了新的单碱基编辑系统,实现了腺嘌呤(ade- nine, A)到鸟嘌呤(guanine, G)的精确转换(Gaudelli et al., 2017) 。这两套系统在不引入 DNA 双链断裂也不需要重组修复模板的情况下可以实现对基因组更加安全、高效、精准的单碱基编辑,而且其效率远远高于 DSBs 引起的 HDR 修复方式(Gaudelli et al., 2017; Komor et al., 2016) 。近日,伊利诺伊大学的一个研究团队提出了一种称为 CRISPR-SKIP 的通用方法,该方法利用胞嘧啶碱基编辑器(cytosine base editor, CBE)控制基因剪接,实现了靶基因处的 外显子跳跃 。这意味着,CRISPR-SKIP 可以在不引入 DSBs 情况下来消除突变的基因序列,还能影响 基因的表达和调控方式,有望治疗多种遗传性疾病 (Gapinske et al., 2018) 。