清华大学药学院胡泽平团队与合作者揭示代谢组学结合人工智能在准确诊断胃癌及预测患者预后中的临床应用潜能-清华大学药学院

最新研究成果 | 清华大学药学院胡泽平团队与合作者揭示代谢组学结合人工智能在准确诊断胃癌及预测患者预后中的临床应用潜能

最新科研速递

2024年2月23日，清华大学药学院胡泽平团队与合作者在《Nature Communications》发表题为“Metabolomic machine learning predictor for diagnosis and prognosis of gastric cancer”的研究论文，揭示了胃癌患者血浆的代谢重编程图谱，并发现基于代谢组学构建的机器学习模型能准确诊断胃癌患者，并预测患者预后风险。

研究背景

胃癌是东亚地区高发的致死性肿瘤【1】。胃癌的早期确诊和及时干预对改善临床结果至关重要【2】。然而，作为胃癌诊断金标准的内镜活检因其侵入性高且费用昂贵而限制了临床应用【3, 4】。因此，迫切需要开发具有高灵敏度和特异性的新型非侵入性胃癌检测方法。此外，对病人进行预后监测并及时进行干预有助于更好的临床结果【5】。因此，开发一种更精确的患者预后预测方法至关重要。

胃作为具有高度异质性的消化器官，其癌变和进展受到基因突变和环境扰动的双重影响，伴随显著的代谢重塑。然而，代谢重编程及其在胃癌诊疗中的潜在应用并未被系统性深入地研究过，未能满足临床对胃癌早诊和患者分层治疗的需求。目前的胃癌生物标志物研究很大程度上受限于队列规模小、缺乏独立的验证队列、样本类型和检测方法的差异导致的结果再现性低，以及受分析技术限制的检测灵敏度有待提高等问题。因此，使用多中心、大队列、特征明确的胃癌和对照人群进行代谢组学分析对于识别和验证具有转化潜力的生物标志物，从而开发和完善适合临床应用的代谢生物标志物的仍然势在必行。

研究过程

研究人员收集了702例胃癌患者和非胃癌对照的血浆样本，进行了靶向代谢组学数据分析。结果显示，胃癌患者血浆发生了明显的代谢重编程，其中最显著改变的代谢通路为谷胱甘肽代谢。通路中的两种关键代谢物还原型谷胱甘肽GSH 和氧化型谷胱甘肽 GSSG 在胃癌血浆中显着降低。此外，作为氧化应激紊乱指示物的GSH/GSSG 比率在胃癌患者中显着上调，并随着疾病进展而逐渐增加。表明胃癌患者血浆中氧化应激严重失调。此外，胃癌患者的半胱氨酸和蛋氨酸代谢通路也发生显著失调。与非胃癌对照相比，胃癌患者的 S-腺苷-L-同型半胱氨酸 (SAH) 下调，S-腺苷甲硫氨酸 (SAM) 上调，并且 SAM/SAH 比值随疾病进展而增加。作为通用甲基供体，SAM 丰度和SAM/SAH 比值的失调可能反映了胃癌患者甲基池的扰动。这些胃癌血浆中的代谢重编程特征为开发胃癌检测和患者预后预测生物标志物奠定了基础。

图1. 本研究设计及流程图

尽管代谢组学在全面分析胃癌整体代谢特征方面具有独特的优势，能够大规模识别用于 GC 诊断和预后的有希望的生物标志物，但复杂的组学数据的解释始终是一个挑战。在过去的几年中，机器学习算法已被用于发现组学数据和疾病状态之间的潜在关联并创建预测模型【5-7】。因此，研究人员分别使用随机森林和随机生存森林算法建立了基于10个代谢物的胃癌诊断模型（10-DM）和基于28个代谢物的胃癌患者预后预测模型（28-PM）并在测试集中验证了模型的优越性能。对模型效果评估时发现，10-DM诊断模型即使对早期胃癌患者（stage IA）也能准确诊断，表现出比临床正在使用的癌症蛋白标志物CEA,CA19-9,CA72-4等更优越的诊断效果（灵敏度0.925：0.428）。10-DM模型的准确性和重现性在覆盖521人的多中心队列中得到证实，表明该模型具有较高的稳健性和临床应用潜力。此外，28-PM预后模型比利用临床参数的传统模型的预测效果更好（C-index值0.816：0.591），并能有效地将患者分为高低两个风险组。在中位数为40个月的随访期间，28-PM 模型区分的高风险患者的预后与低风险患者相比更差，证明了模型的预测能力。被分层为高危险组的患者更有可能受益于强化监测、及时干预和新型治疗药物的试验。

研究结果

综上，该研究描述了胃癌患者血浆的整体代谢重编程，并结合机器学习算法构建了两个模型，分别识别胃癌患者并预测其预后。该工作有助于进一步理解胃癌的分子病理学特征，促进了胃癌早期检测的发展，并为实现胃癌的精准治疗提供理论基础。

迄今为止报道的胃癌组学研究主要集中在探究以 DNA、RNA 和蛋白质作为胃癌生物标志物的潜力，而该工作强调了胃癌中循环代谢物的预测价值。通过使用高灵敏代谢组学技术分析覆盖共计702例胃癌和非胃癌对照的多中心样本已经独立测试集的设定，该研究成功应对了生物标志物探究工作普遍面临的结果再现性低，无法进行临床推广应用的挑战。未来可以通过建立靶向两个模型中代谢物的特定子集的靶向定量代谢组学检测方法以提高效率并降低成本，并在来自更多中心的更大规模临床样本中进行验证和优化。此外，基于这两种预测模型有望促进胃癌无创早期检测，并根据患者的风险分层为临床决策提供信息，从而实现辅助胃癌精准诊疗策略的临床转化。

致谢

清华大学药学院博士生陈洋子、赵宜滋，博士后王博弘、王铭铄、中国医学科学院肿瘤医院邵欣欣博士，马福海博士为该论文的共同第一作者。清华大学药学院胡泽平研究员、哈尔滨医科大学附属肿瘤医院韩鹏主任、中国医学科学院肿瘤医院田艳涛主任为该论文的共同通讯作者。药学院博士生姚珂，博士后聂萌博士（现任首都医科大学副教授）也为该工作做出了重要贡献。上海期智研究院的杨天舒研究员和李蓬院士对该研究提供了大力支持和帮助。

参考文献

1. Sung, H., et al., Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA: a Cancer Journal For Clinicians, 2021. 71(3): p. 209-249.
2. Koo, M.M., et al., Presenting symptoms of cancer and stage at diagnosis: evidence from a cross-sectional, population-based study. Lancet Oncol, 2020. 21(1): p. 73-79.
3. Smyth, E.C., et al., Gastric cancer. Lancet, 2020. 396(10251): p. 635-648.
4. Thrift, A.P. and H.B. El-Serag, Burden of Gastric Cancer. Clinical Gastroenterology and Hepatology : the Official Clinical Practice Journal of the American Gastroenterological Association, 2020. 18(3): p. 534-542.
5. Skrede, O.J., et al., Deep learning for prediction of colorectal cancer outcome: a discovery and validation study. Lancet, 2020. 395(10221): p. 350-360.
6. Greener, J.G., et al., A guide to machine learning for biologists. Nat Rev Mol Cell Biol, 2022. 23(1): p. 40-55.
7. Vamathevan, J., et al., Applications of machine learning in drug discovery and development. Nat Rev Drug Discov, 2019. 18(6): p. 463-477.

原文链接：http://doi.org/10.1038/S41467-024-46043-Y

关于我们

师资队伍

科学研究

人才培养

国际交流

支撑平台

党建专栏

战略合作

联系我们