AI辅助生物医药改造技术迎来突破,我公司创始人兼CTO,来自上海交通大学生命科学技术学院的杨广宇教授团队,与上海交通大学自然科学研究院的洪亮教授团队联合利用Pro-PRIME蛋白语言大模型,通过高效模型的定向微调,实现了药物靶点的明显改善。经过仅两轮设计,成功提升了蛋白质稳定性,并在复合突变方面达成100%的成功率。
杨广宇教授的团队基于这一先进技术,利用有限的目标药物蛋白的(突变-活性-稳定性)标注数据集进行模型微调,精确预测复合突变对蛋白质稳定性的影响,为生物药物的稳定性改造提供了新的设计思路。与传统的高通量筛选方法相比,此方法展现出高效、低成本、工作量少和筛选便利的优势,为基于AI的生物医药改造开辟了崭新方向。
优化蛋白质的热稳定性对于生物医学研究与产业应用至关重要。目前,通过(半)理性设计和随机诱变策略已能成功设计出多种增强蛋白质热稳定性的单点突变。然而,在组合多个突变时,常会遇到复杂的上位效应,导致组合突变体失效。因此,优化生物药物往往需要多轮设计,逐步加入单个突变位点,整个过程极为耗时。
最近,杨广宇教授和洪亮教授的研究团队在《mLife》期刊上发表的文章“Optimizingenzymethermostabilitybycombiningmultiplemutationsusingproteinlanguagemodel”提出了一种AI辅助的生物药物热稳定性工程新策略,可高效结合多个有益单点突变。在肌酸酶的研究案例中,仅用两轮设计便成功获得50个热稳定性显著的组合突变体,且设计成功率为100%。
在该研究中,作者运用AI辅助的生物药物热稳定性工程策略,通过少量实验数据对Pro-PRIME模型进行微调,从而预测组合突变体的稳定性和活性。Pro-PRIME模型是在9600万个宿主细菌菌株的最佳生长温度数据上进行训练的,表现出色,尤其在设计和优化高温蛋白方面。初步数据集涵盖了73个低阶突变体的序列-热稳定性和活性数据,微调后的模型则依据来自18个单点突变体的所有可能突变体进行热稳定性和活性的预测,主要目标是在保持至少60%相对活性的同时提升热稳定性。
整个过程包含四个步骤:(1) 收集数据,(2) 进行蛋白质语言模型的微调,(3) 在组合序列空间内预测所有突变体,以及(4) 验证所选突变体。为进一步提高预测精度,研究人员将第一轮的实验结果整合至数据集,并进行了第二轮微调与选择。如此,仅经过两周的时间,就完成了50个组合突变体的设计,并实现了100%的热稳定性设计成功率。
其中,最佳突变体13M4包含13个突变位点,活性几乎不变,Tm值提升了1019°C,而在58°C下的半衰期增加了约655倍。通过数据分析发现,即便某些突变在空间上距较远,但依然存在复杂的高阶上位效应,这进一步证明了高质量实验数据微调模型的重要性,以便提高对高阶组合突变体的预测能力。
PART01 本研究提出的AI辅助生物药物热稳定性工程策略,能够高效整合多种有益单点突变。仅通过两轮设计,即可表征50个组合突变体,成功率达到100%。最佳突变体13M4在Tm值上提升了1019℃,同时58℃下半衰期增加655倍,而催化活性保持不变。
PART02 通过少量但高质量的实验数据微调蛋白质语言模型,模型能够准确捕获数据集中的上位效应,包括符号和协同上位效应,显示实验数据对提升模型预测性能至关重要。
PART03 利用动态相关矩阵分析,研究揭示了影响稳定性的突变不仅对局部环境的动力学产生影响,甚至在某些情况下,也会对远端结构区域造成影响。
PART04 采用这一策略,研究团队迅速探索超过26万种可能的组合突变体,从而显著缩短了传统方法所需的演化周期,提高了生物药物工程效率。
PART05 研究强调将生物药物工程数据与前沿AI模型结合,能够极大提升模型的预测性能,进一步推动生物医药工程的效率提升,建议将该策略推广应用至多个关键酶分子的进化任务中。
为了取得更大的成就,选择利来国际作为您的合作伙伴,共同探索生物医药的无限可能。