学术报告 | 活动回顾 | 清华大学药学院药学前沿学术论坛第三期成功举办

2023年5月31日,由药学院组织的药学前沿学术论坛在医学科学楼B323成功举办。论坛邀请到了临港实验室副主任,华东师范大学人工智能新药创智中心主任,华东理工大学上海市新药设计重点实验室主任——李洪林教授。李洪林教授在论坛中就AI助力新药研发进行了学术报告。本次论坛由刘刚教授主持。

论坛伊始,刘刚老师隆重介绍了李洪林教授,并对李洪林教授的到来表示热烈欢迎。刘刚老师和肖百龙老师共同为李洪林教授赠送论坛纪念证书。

一、 主讲嘉宾介绍

李洪林,临港实验室副主任,华东师范大学人工智能新药创智中心主任,华东理工大学上海市新药设计重点实验室主任,国家杰出青年,万人计划科技领军人才。长期从事药物靶标识别和药物发现的计算方法及其应用的研究。已在PNAS、Adv Sci.、Nucl. Acids Res.和J. Med. Chem.等期刊上发表SCI论文200余篇,SCI论文他引4000余次,已申请发明专利105项(获授权专利54项),PCT专利32项,软件版权15项,转让临床前药物6个(5个一类新药,1个二类新药),3个进入临床研究。曾获教育部自然科学一等奖,第十三届中国青年科技奖等。

二、嘉宾分享

1.AIDD的研究现

AI在游戏、生活和科研领域都有重要应用,例如围棋程序AlphaGo、运动模式识别、脑机接口、AlphaFold2、chatGPT等。机器人及自动化实验技术的发展,如“Chemputer”等,也给未来提供了更多可能性。

新药从发现到上市需要经历漫长的过程(12-15年),且失败率高,常被比作是“登月工程”。许多制药公司开始布局AI辅助新药研发(AIDD)工作,虽然使得效率有所提高,但却并未明显提升获得审批的药物数量。2020年,AIDD进入爆发阶段。据统计, AIDD公司开发的新药有42个处于临床前阶段,13个处于临床一期,11个处于临床二期,1个处于临床三期。其中以治疗肿瘤的药物为主。40%主要是针对旧的靶标,30%主要是基于新的靶点,剩下的则是基于表型的药物设计(药物设计的方法主要包括基于靶点和基于表型)。虽然AIDD前景广阔,但也面临挑战,如IBM的Watson宣布折戟,一些AIDD公司也正在裁员。

2.李洪林团队的AIDD技术开发

2.1 构建疾病-靶标-药物关联的知识图谱

药物靶点是新药发现的源泉,每一个新的靶点的出现都会伴随着多个“重磅炸弹”级别的药物出现,它们大部分销售额能达到数十亿甚至上百亿美元,并为该疾病治疗领域带来井喷式的发展。靶标枯竭已成为全世界新药研发的难题,发展预测新药靶标的方法,对于新药项目至关重要。为解决这一难题,李洪林团队花费近4年时间,开发了e-TSN平台,构建了大规模的包含疾病-靶点-药物关系的知识图谱。这个知识图谱涉及了280万篇文献、3亿对疾病-靶点关系。对于任意疾病,用户可以通过评估靶点的新颖性(通过比对相关文献的数量和发布日期)和重要性(即文献中对其生物学功能的评价),发掘新靶标,并进行科学研究的立项。此外,还可实现“老药新用”等工作。

2.2 构建“近药空间”

在选择合适的靶点之后,如何将药物的化学信息和靶点的生物信息进行关联仍然是药物设计需要解决的科学问题。目前已知化合物数量已达到106~1010,而科学家们估计的化学空间为1060,因此大部分的科研工作者认为已有的化学空间并无法满足现在的药物研发需求。李洪林团队则认为应该在“近药空间”探索药物,而不是所有空间。近药分子通常具有很高的研究和商业价值,并主要分布在大量的专利文件中。李洪林团队开发了CIRS(化学信息重构系统),从专利中获得近药空间的化学信息。CIRS能够处理专利中的图像、文本等多模态数据,重建专利数据库中的化学信息,结构的识别率高达97%。例如在某美国专利的11个分子式中,CIRS能够构建包含208万个分子的化学空间。这个结果表明,通过结合已有的药物及在研药物的专利信息,CIRS能够得到近乎无限大的近药空间。科研工作者能够利用这些化学空间得到高可合成性以及高活性的近药分子,并结合专利中的图谱及动物实验信息,对近药分子进行进一步的筛选。

3.李洪林团队应用AIDD技术发现药物候选物

3.1 利用骨架跃迁等方法设计肺癌药物

肺癌是目前死亡率最高的癌症。而表皮生长因子受体(EGFR)是靶向治疗非小细胞肺癌的重要靶点。已有的第一代EGFR药物在化学结构上具有较大的创新,但60%的病人在服药一年内出现了获得性突变问题,导致病人出现了耐药性。而二代药物的由于较大的毒副作用,并没有获得上市的机会。三代药物中主要是CO-1686和AZD-9291的类似物。CO-1686在体内被代谢后会抑制胰岛素合成及血糖调节相关的两种蛋白,使患者出现高血糖症等副作用,因而未能成功上市。

李洪林团队准确预测了AZD-9291的两个代谢位点,通过骨架跃迁的方式重新设计了高活性(比原始的化合物活性提高了3万倍)的先导化合物并通过测定体内代谢产物实验,验证了服用新的化合物并不会出现高血糖症等毒副作用。最后,通过PDS模型验证,该化合物有较好的药效并于2021年获得CDE的临床许可。后期的其他研究证实了AZD-9291在体内的两种主要的代谢产物(AZD-5104 和AZD-7550)具有更高的活性,而李洪林老师基于AI预测AZD-9291的代谢位点的策略,准确地保护了该药物代谢为这两种代谢产物的相关的基团,进而得到了比其他AZD-9291类似药物更好的治疗效果。

3.2 溃疡性结肠炎大环类药物的设计

与线性的化合物分子相比,大环类药物具有更高的结合亲和力及选择性,且能够突破现有的专利限制的优势。李洪林团队通过知识图谱发现,溃疡性结肠炎目前缺少较好的药物,且相关的靶点JAK2的研究相对JAK1。目前治疗该疾病的上市药物在临床过程中存在脑炎,但其致病的机理仍不清楚。李洪林团队使用相似的策略针对JAK2靶点进行了药物设计。他们从已有的药物出发,使用基于生成式的Transformer模型快速生成大环化合物,并对该化合物进行局部优化,得到新的药物分子。由于大环化合物合成困难,李洪林团队仅合成了8个分子,其中部分化合物与初始药物相比,活性并没有降低。同时,通过激酶谱分析,设计的大环化合物有更强的靶向性且主要靶向JAK2随后,通过体内实验验证,新的药物能够靶向治疗溃疡性结肠炎。

这两个案例都证明了基于知识图谱寻找靶点并根据已有药物进行局部优化获得新的药物的方法的可行性。李洪林老师也通过这两个案例,与大家分享了药物研发过程中需要关注的问题。比如在肺癌药物设计过程中,药物的ADMET性质对于药物设计至关重要。此外,在使用生成式的AI技术时,如何化学合成这些化合物往往是一个更大的挑战。

4. 李洪林老师对AIDD未来的展望

最后,李洪林教授介绍了AI未来应用的场景。基于AI的药物研发技术从分子生成开始,逐步经历自动合成、自动分析、自动分离提纯、自动筛选等步骤,形成高度自动化、集成化的发展趋势,为高通量筛选、体内评价提供更好的支持。未来自动化、集成化技术将成为药物研发的关键技术,有望加速药物发现的过程,提高药物研发的效率和准确性。

三、交流与讨论

讲座结束后,药学院的老师及同学们积极提出了许多问题,以下是问题精选:

Q:使用人工智能进行靶点预测的准确性如何,是否有进行回顾性研究,譬如在免疫治疗方法出现之前,AI是否能够预测PD1是一个重要的靶点?

A:回顾性的研究正在进行,例如目前有一个免疫方面的研究,能够将相应的靶点预测相关的文献进行排序。

Q:环状化合物是否使用口服给药,是否有口服利用度等研究?

A:大部分是通过口服给药,虽然大环类药物的水溶性较差,但与一般药物相比,能够更好地透过血脑屏障,治疗肿瘤的脑转移。而口服利用度可以使用一些化学修饰或者制剂的方法进行优化。

Q:在构建知识图谱的过程中,如何避免被已有的数据网站使用更多的数据进行快速跟进?

A:数据的标注是数据变成可用知识的必经之路,这个过程不仅需要科学人员具有大量的专业知识储备,更需要耗费非常大的人力资源及时间成本,因此是构建知识图谱的核心竞争力。

Q:骨架跃迁成功率比较高的原因是什么?

A:团队在2012年开发了eSHAFTS,是国内首个基于分子三维相似性的药物设计软件,主要是考虑到了分子的形状和药效特征,目前可在团队网站上进行下载和使用。

Q:目前是否有相关工作取代人来选择靶点?

A:Insilico Medicine基于组学数据预测靶点,但是选择靶点还应考虑到临床和市场的需求。