Science :用“人工进化”驯服基因搬运工——CASTs效率狂飙420倍,实现人类细胞高效基因插入!
时间:2025-05-19
自然界的 搬运工 :CRISPR辅助转座酶(CASTs)初探
什么是CASTs?它们是一类发现于细菌中的天然系统。顾名思义,它们结合了CRISPR的靶向能力和转座酶(transposase)的 搬运 能力。简单来说,CAST系统利用无核酸酶活性的CRISPR-Cas组件(通过引导RNA, guide RNA定位),将一段DNA片段(称为转座子, transposon或payload)精准地插入到基因组的特定位置。
CASTs有很多吸引人的特性:
RNA引导编程性(RNA-guided programmability):只需要设计特定的引导RNA,就能靶向不同的基因组位点,非常灵活。
无需DSBs(Avoidance of genomic double-strand DNA breaks):这是CASTs最显著的优势之一,理论上可以避免DSB带来的诸多副作用。
大片段DNA兼容性(Compatibility with multi-kilobase-scale DNA cargo):它们天然就能插入较大的DNA片段。
听起来很完美?但自然界的设计往往有其自身的考量。研究发现,目前已知的天然CAST系统在人类细胞中的整合效率极低,通常低于0.1%。这可能是因为在细菌宿主中,过度的转座活动会带来适应性成本(fitness cost),所以天然进化可能倾向于抑制转座酶的活性,使其 够用就好 ,而不是追求最高效率。
让分子 加速进化 :噬菌体辅助连续进化(PACE)登场!
既然天然CASTs在人类细胞中 水土不服 ,那我们能否像培育农作物或更高效的酶一样,在实验室里对其进行 定向进化 呢?答案是肯定的!
这项研究引入了噬菌体辅助连续进化(Phage-assisted continuous evolution, PACE)技术。PACE是一种强大的体外(in vitro)进化平台,它将传统的、耗时的蛋白质定向进化步骤(突变、选择、扩增) 嫁接 到M13噬菌体的生命周期上。在PACE系统中,编码待进化蛋白质的基因被整合到噬菌体基因组中,并取代一个对噬菌体复制至关重要的基因(如基因III, gIII)。噬菌体在宿主细菌中生长,宿主细菌内含有一个特殊的 选择回路 (selection circuit),该回路的设计使得只有当噬菌体基因组上编码的蛋白质执行了我们期望的功能时,才能激活gIII的表达。gIII蛋白是噬菌体组装和释放所必需的,因此,只有成功执行功能的噬菌体才能有效复制、传播。同时,噬菌体种群通过持续稀释(continuous dilution)被施加生存压力,只有复制速度足够快的噬菌体才能在系统中存活下来。结合诱导性的突变质粒(mutagenesis plasmid),噬菌体种群在高速复制的同时积累突变,那些编码功能更强的蛋白质的噬菌体因为复制更快而被富集,从而实现蛋白质的快速定向进化。
PACE的优势在于其速度快、通量高、能够探索巨大的序列空间,而且对蛋白质的先验知识要求低。研究人员正是利用PACE来改造PseCAST系统,希望能获得在人类细胞中具有高整合活性的变体。
千锤百炼,铸就 进化 引擎:CASTs核心组件的演进之路
CAST系统包含多个组件,其中TnsA、TnsB和TnsC(统称为TnsABC)构成了执行DNA转座的核心转座酶模块。研究人员最初尝试进化整个TnsABC模块。他们设计了PACE选择回路,将TnsABC的转座活性与噬菌体复制关联起来:只有当TnsABC将编码gIII启动子的转座子插入宿主细菌基因组的特定靶点上游时,gIII才会表达,噬菌体才能复制。
然而,最初的进化尝试遇到了挑战。天然PseCAST在宿主大肠杆菌(E. coli)中虽然具有较高的整合活性( 99%),但在他们的PACE体系中,野生型TnsABC驱动的噬菌体复制速度慢到不足以维持种群。通过非连续的噬菌体辅助进化(PANCE,一种更宽松的模式),第一轮进化(N1)后,噬菌体在过夜培养中表现出约10 倍的繁殖提升,并在靶点上的整合率提高了320倍,表明进化成功地将噬菌体繁殖与整合活性关联了起来。
但随后,他们发现快速复制的噬菌体中出现了 作弊者 (cheating SPs),它们通过其他方式获得了gIII基因,绕过了选择压力。为了应对这个问题,他们改进了选择回路,使用了分裂的gIII基因(split-intein gIII)以及更大的宿主质粒(accessory plasmid, AP),使得 作弊 更难。
在后续的进化中,他们发现进化TnsABC(N2轮)虽然在人类细胞中的整合活性提高到约3.6%,但随后进一步进化的P2轮噬菌体虽然在细菌中复制得更快,其编码的TnsABC变体在人类细胞中的活性反而下降了。通过分析,他们发现P2轮TnsC蛋白上的一些突变(如D44G, D44N, N316D)虽然提升了噬菌体在细菌中的适应度,却降低了其在人类细胞中的整合效率。这有力地证明了针对细菌宿主进行的进化,其结果并不一定能直接转化为在人类细胞中的最优性能,因为细菌和人类细胞环境差异巨大(如染色质结构、DNA超螺旋、靶点搜索空间等)。
基于这些发现,研究人员将进化焦点进一步缩小,转移到TnsABC中最关键的催化亚基 TnsB上。他们设计了新的PACE回路(3.0),将TnsA和TnsC放在宿主质粒上,只进化噬菌体编码的TnsB。同时,为了避免进化出依赖于细菌内源ClpX蛋白的变体(因为人类细胞中ClpX可能引起细胞毒性),他们使用了敲除了ClpX基因的大肠杆菌宿主( clpX E. coli)。
经过又一轮的PANCE(N4)和PACE(P4)进化,他们获得了活性显著提升的TnsB变体。其中表现最好的P4-15 TnsB变体,在人类HEK293T细胞中测试的三个基因组位点上,平均整合效率达到约12%。这个P4-15 TnsB变体总共积累了10个氨基酸突变,这些突变分散在蛋白的不同区域,并且通过回补实验证明,这10个突变都能提高TnsB在人类细胞中的活性。结构分析显示,这些突变位于TnsB与转座子DNA、TnsB自身以及TnsC的多个关键界面上,这表明进化改进了TnsB的多种功能,包括转座子末端结合(transposon end binding)和转酯催化(transesterification catalysis),这些正是之前鉴定出的限制PseCAST在人类细胞中活性的关键瓶颈。
更重要的是,与野生型PseCAST不同,进化的P4-15 TnsB对ClpX蛋白的依赖性大大降低。这意味着在人类细胞中,无需额外提供细胞毒性的ClpX蛋白,也能实现较高的整合效率。这对于未来的治疗应用至关重要。
进化与工程的结晶:高活性的evoCAST系统诞生
获得高效的进化TnsB只是第一步。CAST系统的DNA靶向性由CRISPR-Cas组件(QCascade)决定。先前的研究发现,天然PseCAST的QCascade靶向DNA的能力较弱。因此,研究人员并没有止步于进化,而是将进化的TnsB变体(P4-15 TnsB)与经过合理设计的、提高了性能的QCascade组件相结合。他们改造了Cas7和Cas8蛋白,引入了增强靶向能力和在人类细胞中核定位的突变和信号序列。
这种 进化 与 理性工程 相结合的策略,最终诞生了evoCAST系统 一个为人类细胞基因整合而优化的CAST工具。
evoCAST的 超能力 :高效、精准、多能
那么,这个通过人工进化和工程改造而来的evoCAST系统表现如何呢?简直是质的飞跃!
超高效率(High-Efficiency):在HEK293T细胞中,使用1-kb的DNA片段进行整合测试,evoCAST在测试的4个基因组位点上平均效率高达19%,比野生型PseCAST高出540倍!在测试的全部14个基因组位点上,evoCAST的平均整合效率为14%,最高可达30%!
惊人精准度(High Precision):
无脱靶插入缺失(No detected indels):在未整合的基因组位点进行高通量测序(HTS)分析,没有检测到由evoCAST引起的插入缺失(indels),与未处理细胞背景水平一致。DSB引起的方法常常伴随大量indel。
单碱基精度(Single-base pair precision):整合位点非常精确,倾向于插入到引导RNA靶向位点下游约49个碱基对的位置。
方向性(Predominantly unidirectional):大部分整合事件是单向的,这对于需要正确表达方向的基因插入非常重要。
高纯度产物(High product purity):长读长测序分析表明,evoCAST主要产生简单的、只含一个拷贝的DNA片段插入,而不是包含载体骨架或多个拷贝的 共整合体 (cointegrates),这大大简化了下游的应用和分析。
大片段兼容性(Large Cargo Compatibility):EvoCAST能够成功整合高达15 kb的DNA片段,这是他们测试的最大片段大小,表明其具备插入完整基因甚至多个基因的能力。
广泛细胞类型适用性(Versatility across cell types):除了HEK293T细胞,evoCAST在其他人类细胞系(如HeLa细胞,平均效率4.7%;K562细胞,平均效率1.6%)以及来自患者的原代人皮肤成纤维细胞(primary human fibroblasts,来自一种罕见遗传病RDEB患者)中也表现出高效的整合能力。在这些原代细胞中,evoCAST使用1-kb片段的平均效率达到19%,比野生型PseCAST高出200倍!虽然在某些细胞类型中,额外提供ClpX蛋白能进一步提高效率(如原代成纤维细胞可达37%),但evoCAST对ClpX的依赖性已远低于野生型系统,降低了潜在的细胞毒性风险。
脱靶情况(Off-target profile):使用一种名为UDiTaS的基因组广度整合检测方法进行评估,evoCAST确实存在一定程度的脱靶整合,但脱靶水平较低(占总测序读数的 3%),且脱靶事件主要表现为单次整合,不具有重复性。分析表明,这些脱靶整合位点与主要靶点没有序列同源性,且主要发生在开放染色质区域,并且需要TnsC但不需要QCascade,提示其可能由TnsABC复合体的异常结合引起。研究人员推测,像mRNA或蛋白质复合体(RNP)这样更瞬时的递送方式可能会进一步降低脱靶率。与其他基因编辑工具(如Cas9核酸酶,其脱靶率根据公开数据平均约为47%)的脱靶率相比,evoCAST的脱靶水平是可接受的,甚至更优。
从实验室到临床:evoCAST的广阔前景
evoCAST的这些 超能力 为基因治疗和生命科学研究打开了新的大门。研究人员已经初步展示了其在治疗相关领域的应用潜力:
遗传病治疗:将编码超活性的凝血因子IX(factor IX, F9)的cDNA插入到人类肝细胞系HuH7细胞的白蛋白(ALB)基因内含子1中,实现了约5.7%的整合效率,并检测到F9蛋白的表达。这是一种治疗乙型(hemophilia B)的策略。更重要的是,evoCAST还能将编码其他多种治疗性蛋白(如与Fanconi相关的FANCA、X连锁重症联合免疫缺陷IL2RG、Rett综合征MECP2、苯丙酮尿症PAH)的健康cDNA插入到这些基因自身的内含子中,效率达到12%-15%!这种将健康基因插入其天然基因位点的策略,有望在保留部分天然调控环境的同时,实现对因各种突变导致的功能丧失的疾病进行突变类型无关(mutation-agnostic)的治疗,无需为每种具体突变设计不同的编辑方案。
细胞疗法:将用于癌症免疫治疗的CD19嵌合抗原受体(CD19-CAR)编码序列插入到人类HEK293T细胞的T细胞受体 恒定区(TRAC)基因位点,实现了约13%的整合。这对于标准化CAR-T细胞的生产流程具有重要意义。
与最近报道的另一类无DSB基因插入方法eePASSIGE(基于Prime Editing和重组酶)相比,evoCAST也有独特的优势。虽然eePASSIGE在某些细胞类型中效率更高(1.5-2.9倍),但它需要两步完成(先进行Prime Editing安装att位点,再利用重组酶插入片段),过程更复杂,且可能产生更复杂的产物(如indel、载体骨架整合)。而evoCAST是一步完成,产物纯度高,且兼容线性DNA供体(如AAV递送),这为不同的应用场景提供了灵活的选择。
未来可期,CASTs的下一步
尽管取得了这些突破,但evoCAST仍有进一步优化的空间。未来的研究或将聚焦于:
优化引导RNA的设计,进一步提高效率和特异性。
评估整合基因片段的长期稳定表达情况。
提高evoCAST在更多细胞类型(特别是慢分裂或不分裂的原代细胞)中的整合效率。
开发更高效、低毒性的递送方法,尤其是针对不同组织或细胞类型的体内递送。
进一步理解脱靶机制,并通过工程改造或递送策略降低脱靶率。
将PACE平台应用于进化其他类型的天然或工程化的CAST系统,以开发出具有不同特性、适用于更广泛应用的基因插入工具集。
总而言之,这项研究通过巧妙地将噬菌体辅助连续进化(PACE)应用于CRISPR辅助转座酶(CASTs),并结合理性工程改造,成功开发了evoCAST 一个能在人类细胞中实现高效、精准、DSB-free基因插入的强大平台。这不仅为基因治疗领域提供了新的利器,也为探索基因功能和构建复杂的细胞模型提供了强大的技术支撑。我们有理由相信,随着evoCAST及类似技术的不断发展和完善,精准编程基因组、治疗遗传疾病的未来正加速到来!
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->