清华大学开发AI大模型，准确预测人类衰老，登上医学顶刊Nature Medicine-100医药网

清华大学开发AI大模型，准确预测人类衰老，登上医学顶刊Nature Medicine

时间：2025-07-28

来源：生物世界 2025-07-27 17:02

该研究提出了一种基于大语言模型（LLM）的生物学年龄预测方法，仅通过体检报告来估算一个人的整体衰老程度以及器官特异性衰老程度。这项研究不仅开创了衰老检测新范式，更有望帮助精准健康管理走进寻常百姓家。

准确且便捷地评估一个人的衰老程度，对于识别健康风险以及预防衰老相关疾病至关重要。然而，目前的衰老替代指标，常常面临诸如方法学局限、与不良后果关联较弱以及普遍适用性有限等挑战。

2025 年 7 月 23 日，清华大学万科公共卫生与健康学院底骞副教授、新疆维吾尔自治区人民医院杨毅宁教授、清华大学智能产业研究院马为之助理教授等在国际顶尖医学期刊Nature Medicine上发表了题为：Large language model-based biological age prediction in large-scale populations的研究论文。

该研究提出了一种基于大语言模型（LLM）的生物学年龄预测方法，仅通过体检报告来估算一个人的整体衰老程度以及器官特异性衰老程度。这项研究不仅开创了衰老检测新范式，更有望帮助健康走进寻常百姓家。

总的来说，该研究开发的基于大语言模型（LLM）的衰老评估框架为整体衰老和器官特异性衰老的评估提供了一种精确、可靠且经济高效的方法。它在大规模普通人群中具有个性化衰老评估和健康管理的潜力。

衰老是导致死亡和慢性疾病的一个主要风险因素，给社会带来了巨大的健康负担。之前的研究表明，衰老是一个复杂且多维度的过程，在身体、器官、分子等层面表现出显著的异质性，受到环境和遗传等多种因素的影响。对于临床实践而言，整体衰老指标能更好地评估综合健康状况，而器官特异性衰老指标则有助于了解特定器官的健康情况。

然而，我们的实际年龄通常不能充分代表我们的衰老情况。因此，开发全面的和针对特定器官的衰老指标以更精确地反映多维度衰老进展，从而为健康风险和潜在干预措施提供信息，这一点至关重要。尽管存在这种需求，但开发出能够准确且便捷地评估大规模普通人群衰老程度的实用方法，仍是一项关键挑战。

突破性方案：让 AI 成为衰老侦探

在这项研究中，研究团队开发了全新框架：将体检数据（例如血压、肝功能、生活习惯等）转化为文字报告，输入大语言模型（例如 Llama3）。大语言模型会像资深医生一样，综合分析上百项指标，并输出两个关键结果：

1、全身衰老程度（整体生物学年龄）；

2. 六大器官专属年龄（心脏、肝脏、肺、肾脏、代谢系统、骨骼肌肉）。

大语言模型并不依赖预设公式，而是通过预训练的医学知识库（类似通读海量医学文献），结合个人健康细节进行智能推演。

利用大型语言模型预测整体年龄和器官特异性年龄的框架

效果碾压：1000 万人验证的精准预测

该研究横跨全球六大数据库（英国生物样本库、中国慢性病队列等），超 1000 万人数据验证，结果令人惊叹：预测全因死亡风险的准确率为 75.7%，比基于端粒长度、表观遗传时钟的准确率高 15%；预测风险大的准确率为 70.9%，比其他机器学习模型高 8%；预测风险准确率为 81.2%，比基于临床指标高 22%。

此外，LLM 预测的年龄差（预测年龄-实际年龄）每增加 1 岁，全因死亡风险上升 5.5%，冠心病风险增加 7.2%。

在六个大规模多样化人群中对 LLM 预测的整体年龄、器官特异性年龄及年龄差的验证

临床价值：从预警到干预的全链条应用

1、疾病雷达预警系统，通过对 46 万人追踪发现，心年龄差增大，冠心病风险增加 45%，肝脏年龄差增大，肝硬化风险增加 63%。

2、发现新型衰老加速器，通过对比衰老加速人群的蛋白质组，该研究锁定了 322 个关键蛋白（例如瘦素、成纤维生长因子），56.7% 为新发现靶点，其中 55% 与死亡率显著相关。例如，携带特定蛋白组合（例如 IGFBP4）的人群，死亡风险比普通人高 68%！

3、定制化健康管理，输入连续 3 年体检数据，LLM 可生成个人衰老速率曲线，预警疾病爆发期，比单次体检准确率提升 3 倍。

基于 LLM 预测的年龄差的进一步探索、应用及可解释性分析

总的来说，研究团队在涵盖超过 1000 万参与者的六个基于人群的队列中验证了这种预测方法，并证明了其有效性和可靠性。研究结果表明，LLM 预测的总体年龄在全因死亡率方面达到了 0.757 的一致性指数，显著优于其他衰老指标，例如端粒长度、衰弱指数、八个表观遗传年龄以及四个机器学习模型的预测结果。总体年龄差与多种与衰老相关的表型和健康结果密切相关，全因死亡率的风险比为 1.055。对于器官特异性衰老，LLM 预测的年龄和年龄差在预测相应器官特异性疾病方面也表现出优于机器学习模型的性能。此外，该研究还探索了 LLM 的动态衰老评估能力，并利用年龄差来识别与加速衰老相关的蛋白质组学生物标志物，进而开发了 270 种疾病的患病风险预测模型。研究团队还进行了可解释性分析，以探究 LLM 的决策过程。

LLM 通过对话分析体检报告，做出生物学年龄的预测

该研究开发的基于大语言模型（LLM）的衰老评估框架为整体衰老和器官特异性衰老的评估提供了一种精确、可靠且经济高效的方法，它在大规模普通人群中具有个性化衰老评估和健康管理的潜力。

87%用户都在用100医药网APP 随时阅读、评论、分享交流请扫描二维码下载->