传统药物发现过程存在诸多痛点,AIDD 相较传统药物发现在成本和效率上均有显著优势,发展前景乐观。小分子药物发现从靶点确定开始,通过各类筛选技术找出一组能够和靶点相互作用的活性分子,然后对其结构修改使其 PK/PD、毒理等性质能满足临床开发需求,最后经过临床前、临床试验验证。整个过程耗时长、花费高、失败率高,这使得在药物发现领域能不断涌现新的技术,如高通量筛选、虚拟筛选等。
AI 可以在药物发现的靶标识别、化合物-蛋白质相互作用预测、候选药物理化性质预测、ADMET(药物吸收、分布、代谢、排泄和毒性)预测、化学合成预测等方面均有其发展的空间,可以在药物研发过程中降低成本、缩短时间和提高成功率,具有非常好的应用前景。
AI 制药不断扩展边界,助力新药研发全过程。除了 AIDD 的应用,AI 在新药研发其他环节也都有相应应用场景,包括临床前阶段的药物生产工艺开发、制剂配方优化、有效性和安全性预测等,也包括在临床研究阶段对于方案设计优化等,AI 逐步应用到新药研发各个环节。
数据、算力和算法是 AIDD 的三大要素。AI 在新药研发过程中通常的路径为:
1)获取目标训练数据集;
2)建立 AI 自主学习算法模型;
3)多轮训练以优化模型;
4)测试、评估模型;
5)基于模型实现分子优化、筛选、预测、分析等。
在这过程中,数据决定了训练模型的深度,算法决定了效率和产出,算力决定了 AI 可实现的维度,因此,AIDD 主要有三要素:数据、算力和算法。数据上,原始数据通常来自三各方面,已发表论文等形成的公开数据集、与药企合作获得的研发数据集和企业自身研发积累的数据集.
算力上,GPU(图形处理器)云计算资源可以为 AI 制药企业提供运算支持,但由于本身成本较高,企业也可以通过自身平台能力搭建扩大算力;算法上,核心创新点在于建模的精度和产生新信息的能力,而随着 ChatGPT、OpenAI 等的出现,早期算法开源使得各家企业在算法基本构架上不会有太大差异,主要体现在细节上。