English

新闻快递

6776永利集团硕士生在Nature Computational Science发表抗体药物设计大模型

2026年05月09日 谢东娜 

近日,6776永利集团科学智能(AI for Science)交叉研究中心研究成果 “DualGPT-AB: a dual-stage generative optimization framework for therapeutic antibody design”发表于Nature Computational Science期刊。yl6776永利集团硕士生谢东娜为该论文第一作者,yl6776永利集团彭佳杰教授、北京大学戴慧副教授、天津大学郝建业教授为共同通讯作者。

文章链接:https://www.nature.com/articles/s43588-026-00976-0

图1. 总体框架图

单克隆抗体能够特异性靶向抗原并激活机体免疫反应,是当前生物医药领域应用最广泛的药物类型之一,在癌症、自身免疫疾病等重大疾病治疗中发挥着不可替代的作用。抗体重链互补决定区CDRH3是决定抗原结合特异性与亲和力的关键区域,想要获得可临床转化的优质抗体药物,不仅需要实现精准的抗原靶向,还必须同时兼顾黏度、清除率、免疫原性等多种可开发性属性。传统设计方法难以实现多属性协同优化,且高度依赖专家经验与大量实验筛选,研发周期长、成本高。

现有人工智能方法在抗体序列设计中取得一定进展,但大多仅关注抗原结合能力,忽略可开发性等关键成药属性;部分多属性优化方法未能有效建模序列与属性间的依赖关系,且高质量标注数据稀缺,难以支撑模型训练。针对上述难题,研究团队提出DualGPT-AB双阶段条件生成式优化框架,将条件生成式语言模型与强化学习策略相结合,实现治疗性抗体CDRH3序列的高效设计。

该框架采用双阶段生成与优化策略,在第一阶段利用现有资源构建一个标注部分属性的CDRH3数据集,并训练一个先验GPT模型。在第二阶段采用了强化学习 (RL)策略来探索CDRH3序列空间,并构建一个标注扩展属性的数据集,用于训练增强型GPT模型。先验GPT提供了良好起点,缓解了早期强化学习训练中的冷启动问题。同时,强化学习阶段通过奖励函数持续优化生成模型,引导序列分布向更符合扩展属性的区域移动。大规模的强化迭代生成的带扩展属性标注的CDRH3序列,被用以构建高质量数据集训练增强型GPT。这种双阶段训练方法能够高效生成满足多个目标属性的CDRH3序列。

计算实验表明,DualGPT-AB在靶向HER2且兼具多个目标属性的CDRH3序列设计任务上,性能优于数种当前主流方法。研究团队基于DualGPT-AB构建了满足多个目标属性的候选抗体库,并鉴定出序列中高度保守的残基。为了验证其治疗潜力,研究团队对候选抗体进行了结合亲和力预测与系统筛选,最终选取9个候选抗体进行体外实验验证。经表面等离子体共振(SPR)和酶联免疫吸附试验(ELISA) 验证,其中两个抗体对HER2表现出良好的亲和力;通过抗体依赖性细胞介导的细胞毒性(ADCC)和补体依赖性细胞毒性(CDC)实验验证,这两个抗体也表现出强大的肿瘤杀伤活性。值得注意的是,团队发现其中一个抗体的肿瘤杀伤效力优于赫赛汀(Herceptin)——目前临床上广泛用于治疗HER2阳性癌症的经典抗体药物。

论文中我校主要作者也是6776永利集团大数据管理与分析团队成员。该团队近年来面向国家重大需求,围绕大数据存储、管理,及领域化大数据分析等开展科学研究和技术研发,承担了多项国家和行业重大重点科研项目,近年来获陕西省科学技术一等奖1项、教育部科技进步奖一等奖2项等,先后研制了大型对象—关系数据库管理系统、金融分布式数据库、生物网络分析平台等,为推动大数据管理和分析的技术进步和产业发展提供了重要支撑。

近年来,6776永利集团积极贯彻落实学校加强学科交叉融合与突破创新的要求,充分发挥学科优势,积极开展学科交叉融合研究和机制创新探索,成立了计算与艺术、仿生芯片、脑科学与类脑计算、科学智能(AI for Science)等四个交叉研究中心,旨在加强交叉科学研究,催生新的学科增长点,产生重大科研成果。目前,学院已经产生一系列交叉研究成果,并在Nature Genetics,Nature Reviews Electrical Engineering,Nature Communications,PNAS等非计算机领域传统期刊上发表,四个交叉中心共培育了多名国家级人才,并成功获批多项国家自然科学基金博士项目,取得了显著的成效。

(审稿:史豪斌)

下一条:人机物融合群智计算教育部重点实验室建设项目验收会成功召开

关闭

Baidu
sogou