Nature Biotechnology:为AI“挤水分”!新框架Systema诞生,揭示基因扰动预测的真实难度
时间:2025-08-29
生命科学的疆域正在以前所未有的速度扩张,而在这场探索的浪潮之巅, 基因编辑 无疑是最耀眼的灯塔之一。CRISPR技术的出现,让我们如同拥有了一支能够精确改写生命密码的 笔 ,可以关闭、开启甚至修复特定的基因。这项能力为我们揭示基因功能、理解疾病机理、开发新疗法打开了无限可能。然而,一个巨大的挑战横亘在我们面前:细胞内有数万个基因,它们交织成一张复杂得令人难以想象的调控网络。如果我们扰动(perturbation)其中一个或几个基因,细胞的 内心世界 ,也就是它的基因表达谱(transcriptional responses),会发生怎样的连锁反应?
这是一个组合爆炸的难题。穷尽所有可能的基因组合扰动并进行实验,无异于想在地球上数清每一粒沙子。于是,研究人员将希望寄托于人工智能(Artificial Intelligence, AI),特别是深度学习模型。我们能否训练一个 AI神算子 ,让它学习已有实验数据中的规律,然后预测那些我们从未做过的基因扰动会带来什么样的后果?近年来,诸如GEARS、scGPT等一系列复杂的模型应运而生,它们在各项评估指标上取得了令人瞩目的高分,似乎预示着一个 计算预测取代繁琐实验 的新时代即将来临。
但事实果真如此吗?这些看似强大的AI模型,是真的洞悉了基因扰动背后的生物学逻辑,还是仅仅学会了某种应试技巧,穿上了一件名为 高分 的皇帝新衣?8月25日,《Nature Biotechnology》的研究报道 Systema: a framework for evaluating genetic perturbation response prediction beyond systematic variation ,为我们揭示了这光鲜成绩背后的惊人真相,并锻造了一面名为 Systema 的 照妖镜 。这项工作不仅深刻地指出了当前领域内评估体系的 系统性 缺陷,更提供了一套全新的、更为严苛也更为公正的评判标准,引导我们走向真正有意义的生物学预测。