专家之声

医学预测

ERIC J. TOPOL<https://orcid.org/0000-0002-1478-4729>作者信息与隶属关系

科学

May 23, 2024

第 384 卷，第 6698 期

《科学》杂志近期封面文章介绍了“AI 驱动的预测”，重点介绍了一种新的深度学习模型，可以实现更快、更准确的天气预报。这种名为 GraphCast 的新模型在最重要的预报区域——对流层（最接近地球表面的区域）的预测准确率达到了 99.7％，超过了黄金标准系统。对于极端天气事件如飓风和气旋的预警更加精准，有助于挽救生命。医学中的类比是预测特定、可操作的高风险个体以预防疾病或严重急性事件。但我们没有预测健康结果的金标准。这有望很快改变。

为了说明我们现在所处的位置，以癌症筛查为例。几乎 90％的女性永远不会患上乳腺癌，但美国癌症协会目前的指南是所有 45 岁及以上的女性每年或每两年进行一次乳房 X 光检查。使用年龄作为多种类型癌症大规模定期筛查的基础，只会导致在美国诊断出所有癌症中的 14％。一项多癌早期检测试验的最大临床研究的主要入组标准是年龄在 50 岁或以上，但在 6621 名参与者中仅发现 92 个癌症信号（占 1.4%），其中只有 35 个（占 0.5%）为真阳性。现在，阿尔茨海默病协会建议无症状的健康人士应该接受血液测试以检查生物标志物，如 p-tau-181 或 p-tau-217，这些标志物表明大脑中有β-淀粉样蛋白积累，并被归类为“阿尔茨海默病第一阶段”。“在拥有大规模、深度和纵向数据的时代，依靠简单、单一的指标，如一个人的年龄或血液检测结果来定义风险是过于简单的。这是产生假阳性结果、引起人们恐慌的配方，并且可能极其浪费资源。”

通过多模态人工智能，我们有机会在医学领域取得像 GraphCast 在天气预报方面所取得的非凡成就。以阿尔茨海默病风险为例，血液生物标志物已经取得了进展，但这只是数据的一个层面。通过包括约 20％人群中存在的载脂蛋白ε4（APOε4）等位基因的正交基因组数据，可以更准确地评估个体的风险，并且该等位基因提供了补充和独立的预测价值。视网膜成像也可以做到这一点。此外，电子健康记录中的结构化和非结构化文本、影像和实验室检测结果也可以提供帮助。理想情况下，睡眠史和身体活动细节也会被包含在内，但可以通过个人的可穿戴生物传感器获得这些信息。最近一项使用机器学习的研究通过整合电子健康记录数据，包括胆固醇、血压、维生素 D 以及性别特异性特征，如女性骨质疏松或男性勃起功能障碍和前列腺肥大，能够预测阿尔茨海默病长达 7 年之久。还有大脑器官钟簇群中的血浆蛋白，可以指示一个人的生物学脑年龄与他们的日历年龄之间的差异（称为认知脑老化模型），并且对于预测阿尔茨海默病的诊断是 p-tau-181 的附加因素。肠道微生物组多样性的减少和某些促炎性菌株的存在已被确定为阿尔茨海默病的一个风险因素。别忘了还有与环境相关的暴露因素，比如空气污染或高摄入超加工食品。如果所有这些数据维度都被整合起来，想象一下我们能够提前多少年识别出高危人群，特别是在治疗β-淀粉样蛋白积累和减少脑部炎症正在开发的时代，人们也意识到与降低风险相关的某些生活方式特征。

预防癌症是另一个例子。最近，国家人类基因组研究所资助的电子病历和基因组学（eMERGE）网络发表了多祖先、经过验证的多基因风险评分，为临床实施做好了准备。在此之前，已经报道了所有主要类型的癌症（包括乳腺癌、结肠癌、肺癌和前列腺癌）的多祖先、经过验证的多基因风险评分。在最新的关于十种常见慢性疾病的报告中，评估了两种癌症类型——乳腺癌和前列腺癌——使用两个大型多祖先队列中的前 5％得分阈值来评估乳腺癌的两倍或更大的风险，以及使用前 10％得分阈值来评估前列腺癌的两倍或更大的风险。麻省总医院健康系统开始为其患者群体实施多基因风险评分，包括乳腺癌、结肠癌和前列腺癌的多基因风险评分，通过前瞻性评估发现 13％的患者具有高乳腺癌风险（白人和黑人人群中的风险超过两倍，亚洲人群未增加），6％的患者具有高风险结肠癌（黑人人群中的风险超过四倍），以及 15％的患者具有大约两倍的前列腺癌风险增加。多基因风险评分只是分层特定癌症高风险的一个数据层。它们可以从基因芯片或低通量全基因组测序中获得，价格相对便宜，并且可以补充丰富的有关癌症易感基因的基因组数据，如乳腺癌 1(BRCA1)和 BRCA2，这些数据也可以确定高风险人群。它是常见基因组变异的组合，构成了多基因风险评分的基础，而来自全基因组测序的罕见突变则将为揭示遗传风险提供最深入的见解。

电子健康记录中包含着大量有关风险的信息，而这些信息尚未被充分利用。其中一个例子是预测胰腺癌的能力，这种癌症在早期阶段诊断非常困难，因此也是最致命的癌症之一。丹麦国家登记处和美国退伍军人事务部的电子健康记录数据能够区分出在未来 12 个月内患胰腺癌风险增加 30 到 60 倍的人群。不仅新发 2 型糖尿病是提示之一，而且一种整合了电子健康记录中的 80 多个特征（包括实验室检查、症状、药物和共病情况）的人工智能模型也被证明有助于识别胰腺癌的风险。这些模式通常对临床医生是不可辨别的。除此之外，还有其他医学扫描，如胸部计算机断层扫描(CT)，通常用于其他目的，可以揭示胰腺异常，这些异常经常被放射科医生忽略，但可以被 AI 更敏感地检测到（在一项研究中，放射科医生的灵敏度为 34％，而 AI 的灵敏度为 93％）。就像阿尔茨海默病的例子一样，对于风险评估，还有许多其他数据层次需要整合，包括肠道微生物组、营养和环境暴露。

与仅能识别年龄在 50 岁或以上人群中每千分之五未被怀疑患有癌症的人、且只有每千人中两人处于早期（I 或 II 期）的癌症早检多癌种血液检测（也称为“液体活检”）不同，对其他数据进行富集以指示高危癌症风险应该使这些测试更加有用。正是那些高风险人群才需要每年或每半年接受一次 MCED 监测，以便最早发现显微镜下的癌症。这预计会显著改善患者的预后，与目前癌症筛查相比，但必须通过随机临床试验来证明其有效性。

重要的是强调我们整合所有这些数据层到多模态人工智能模型的能力仍处于早期阶段，到目前为止仅限于电子健康记录和基因组学，或电子健康记录和医学影像。来自可穿戴传感器的高频或连续数据尚未被纳入，还有许多其他层次的数据需要整合。这是一个正在解决的分析挑战，如果成功，可以广泛应用于其他有前途的预测技术，比如使用数字孪生和最近邻分析来处理大规模人群医学数据集。

从影响我们日常生活的 AI 驱动天气预报的重大进展中汲取经验，现在有机会大幅提高个体层面的医学预测能力，以改善长期健康结果。所有那些庞大、丰富的数据对于每个人来说都被留在桌子上，没有整合，没有被分析。利用密集计算资源并进行大规模的前瞻性验证研究，可以让我们达到应该达到的目标，即识别出患有重大疾病的高风险人群，并为他们提供预防或减轻这些疾病发生的方法。

(0) 电子信件

eLetters 是一个持续同行评审论坛。eLetters 不会经过编辑、校对或索引，但会经过筛选。eLetters 应该提供实质性和学术性的评论文章。嵌入式图表不能提交，我们一般不建议在 eLetters 中使用图表。如果图表是必要的，请在 eLetter 文本中包含指向该图表的链接。在提交 eLetter 之前，请阅读我们的服务条款。

目前还没有为本文发表电子信件。

Information & Authors

Information

Published In

Science

Volume 384 | Issue 6698
24 May 2024

Copyright

Article versions

Submission history

Published in print: 24 May 2024

Authors

Affiliations

Eric J. Topol https://orcid.org/0000-0002-1478-4729

Metrics & Citations

Metrics

Article Usage

Altmetrics

See more details

Citations

Cite as

Eric J. Topol

Medical forecasting.Science384,eadp7977(2024).DOI:10.1126/science.adp7977

Export citation

Select the format you want to export the citation of this publication.

医学预测

注册科学顾问新闻简报

(0) 电子信件