■ AI制药概览。AI制药即人工智能驱动药物研发,包括靶点和药物发现、临床前实验设计、临床开发及老药新用等多个方向。其中,靶点和药物发现与临床研发需求强烈&市场空间大,是AI制药的主要方向。纵观AI制药的发展历程,随着计算能力和数据量的大幅增长,AI制药已经进入应用拓展阶段,传统的计算机辅助药物设计(CADD)也升级为人工智能驱动药物研发(AIDD)。
■ 需求和政策推动下,AI制药投资持续增长。随着低垂果实的摘取,新药研发难度不断增大。为了提升研发效率,降低研发成本,AI制药的需求不断凸显。政策方面,AI制药已经成为国家重点支持方向,欧美也在完善政策支持和指引。2015-2022年,AI制药投融资年复合增速达49.7%。即使在全球医药投融资市场较弱的2022-2024年,AI制药投融资仍相对活跃。行业规模来看,预计2028年全球AI制药市场规模达56.2亿美元。据麦肯锡预测,长期来看市场规模有望达到280-530亿美元。
■ 靶点与药物发现:应用范围不断扩大,但仍需湿实验共同验证。该部分是AI制药最早探索的领域,技术更多是传统的知识图谱、深度学习等。整体来看, AI技术可以通过快速深度挖掘与“硅基试错”大幅减少前期药物靶点发现和分子筛选过程,加快药物研发进度并降低成本。但由于本身实验科学的原因,仍需湿实验配合验证。AI技术在该部分多个步骤都有应用模型,其中比较重要的是靶点识别、蛋白质结构预测和药物发现与优化。
■ 临床开发:大语言模型逐步探索。AI技术在临床开发阶段虽然还不成熟,但市场空间大,适合大语言模型探索。具体来看,大语言模型可以在ICD编码、精准匹配患者、试验精准规划、结果预测、文件撰写和试验辅助等多个方面提供帮助。目前落地最好的是文件撰写和试验辅助,其他部分仍在探索中。包括赛诺菲、IQVIA在内的多家药企/CRO已经开始在该环节尝试落地AI技术。
■ 研发进展和市场格局。研发方面,管线多处于早期阶段,完全由AI驱动发现的创新药物最快的处于临床II期,等待数据读出。国内企业积极布局AI制药,研发进度靠前。随着AI技术逐步成熟,MNC积极涌入,AI驱动药物研发逐步成为重点。商业模式主要分为三类,始于AI+SaaS,但AI+Biotech空间更大。参与者来看,AI制药初创企业仍在该行业的主要玩家,美国企业占比最高。大型药企/CRO企业是该技术的最终使用方和核心受益方。IT/科技企业医药专业度较为缺乏,临床垂域大模型开发更适合切入。
■ 风险提示。技术落地不及预期;AI幻觉导致模型效果不及预期;高质量数据不足;临床开发不及预期;商业化级定价风险;数据安全。
正文
随着ChatGPT等大语言模型的推出,AI技术在医药行业中尤其是新药研发中的应用受到越来越多的关注。2024年诺贝尔化学奖授予AlphaFold 2研究团队以表彰他们在蛋白质结构预测方面的贡献,AI技术在药物发现方面的研究进展再一次被推向风口。本文我们将围绕这一主题展开论述。
概览
AIGC浪潮下,AI制药已经成为AI应用的主要方向之一。根据Bloomberg的预测,2022-2023年AIGC的市场应用规模增速来看,AI技术在药物研发应用的市场规模的年复合增长率高达113%,增速仅次于AI技术在广告方面的应用。
资料来源:Bloomberg Intelligence,招商银行研究院
(一)AI制药概念
AI制药,即人工智能驱动药物研发(AIDD),是指利用人工智能技术来加速和优化药物发现和开发的过程,旨在提高药物研发的效率、降低成本、提高成功率,并最终为患者带来更有效的治疗方案。
AIDD主要包括靶点和药物发现、临床前实验设计、临床开发及老药新用等多个方向。
靶点和药物发现:利用AI算法分析大量的生物医学数据,识别并预测潜在的药物靶点,筛选并优化候选药物,从而加速新药研发和靶点鉴别效率。
临床前实验设计:利用AI算法优化实验和数据处理、并对候选药物的吸收、分布、代谢、排泄和毒性等特性进行评估,选择合适的制剂方案。
临床开发:利用AI算法分析大量医疗记录,优选适应症和目标人群,优化临床试验设计,确定合适的临床方案等。
老药新用:利用大数据和算法大规模搜索识别现有药物新的应用或适应症,达到老药新用的目的。
图2:AI制药主要环节市场空间及技术成熟度资料来源:招商银行研究院
靶点和药物发现与临床研发是AI技术应用的重点环节。整体来说,靶点和药物发现与临床研发一个是新药研发的起步和核心部分,一个是药物研发最耗时耗财的部分,这两部分数据量丰富多样,是AIDD的核心方向,市场空间大。
临床前实验主要是各种体外和动物实验,AI只能在某些特定领域进行辅助预测,市场空间相对较小。而且受制于数据量相对较少,AI模型技术也不算成熟。
老药新用是AI技术最早在药物研发中的应用方向,技术已经非常成熟,也有药物成功上市。但药物销售情况不佳,随着AI技术在药物研发中的不断应用,未来专利会形成全面保护,也使得老药新用能挖掘出的分子越来越少,市场空间持续缩小。
因此,本报告主要将主要针对靶点和药物发现以及临床开发部分进行研究。
(二)AI制药发展历史
AI制药的发展历史可以追溯到20世纪末,21世纪初随着计算能力和数据量的大幅增长而加速发展:
起步阶段(20世纪末-2012):在20世纪末,随着计算机科学和生物信息学的发展,研究人员开始尝试使用计算机辅助药物设计(CADD)技术来进行药物发现。这些早期的尝试主要集中在分子对接、定量构效关系(QSAR)建模等基础的计算方法上,Schrodinger推出各类计算软件。随着基因组学、蛋白质组学等生物技术的发展,大量的生物医学数据开始积累,为后续AI在药物研发中的应用奠定了基础。技术方面,DL(深度学习)、NLP(自然语言)等AI理论的突破也为AI制药的长期发展提供了技术支撑。
初步应用阶段(2013-2016):深度学习技术快速发展,AI技术逐步被用于药物研发。包括Exscientia、Atomwise、Recursion,英矽智能、晶泰科技等一大批公司成立,探索早期商业模式。
快速发展阶段(2017-2019):AI制药企业基本完成技术积累,开始推出一系列更具深度和广度的AI技术服务,如谷歌的DeepMind团队发布用于预测蛋白质三维结构的人工智能算法AlphaFold,英矽智能推出人工智能药物研发平台Pharma.AI等。
应用拓展阶段(2020年至今):2020年世界上首个AI设计药物DSP-1181进入临床,2021年AlphaFold 2实现超高置信度预测蛋白结构。而随着技术的逐步成熟,传统制药公司开始与AI制药公司展开合作,共同探索AI在药物研发中的应用,2023年随着大语言模型(LLM)的推出,又提升了AIDD的实用性和使用便捷度。
图3:AI制药发展历史
资料来源:Deep Pharma Intelligence,公开资料搜集,招商银行研究院
(三)算力提升后,CADD升级成为AIDD
CADD早已成新药研发中的常规工具。20世纪末,随着计算机科学和生物信息学的发展,计算机辅助药物设计(CADD)已经持续参与到新药发现的过程中,已经成为常规工具。但整体来说,CADD仍是基于药物化学家的知识和设计为主,模拟现有的结构、性质,通过计算进行合理性设计辅助。
AIDD是CADD的加强版,加速推动医药研发创新。人工智能驱动药物研发(AIDD)则是在大数据的基础上,通过将机器学习、深度学习等AI技术嵌入到新药研发中,通过机器的自我学习和推理来预测,降低了对于差异化极大的个体经验的需求。而且,相比于CADD而言,AIDD的大数据处理能力、效率和准确度、以及对复杂生物系统模拟的能力均有较大提升,更难得的是可以基于对大量已知药物和疾病表型数据的学习,提出全新的药物作用机制假设,为创新药物研发提供更多可能性。可以说,AIDD既是CADD的加强版,也是融合了“专家”知识体系后快速的自我迭代,推动医药研发进入新的篇章。
表1:CADD和AIDD的差异资料来源:公开资料搜集,招商银行研究院
需求和政策推动下,AI制药投资持续增长
(一)新药研发难度加大,AI辅助需求提升
低垂果实摘取,新药研发难度不断加大。新药研发领域一直存在“双十定律”,即研发一种新药需要10-15年左右的时间和10亿美元的成本。然而随着研发的不断深入,现有的靶点、药物已不足以满足日益增长的需求,海量异质数据难分析,疾病机理难以发现等导致新药研发难度不断加大。根据2014年塔夫茨药物开发研究中心(CSDD)的数据,开发一种获得市场批准的新处方药的成本约为26亿美元,与2003年相比,经过通货膨胀调整后仍有145%增长。根据2024年Drug Discovery Today的最新论文来看,2023年新药研发的成本已经高达37亿美元(3年滚动均值)。而对比2012-2019年的临床研究情况,临床各阶段的成功率均随年度逐步降低。
为了提升研发效率,AI制药需求不断凸显。相比于传统新药研发模式多依靠专家“知识”与不断的实验探索,AI制药则是以海量医药大数据为基础,通过机器学习、深度学习等多种AI技术,对疾病机理、药物结构等进行快速分析,以优化药物研发。理论上可以有效优化从药物发现到临床试验的全流程,提升研发效率,降低研发成本和时间。
图4:新药研发流程、痛点和AI助力方向资料来源:OMAHA,招商银行研究院
(二)政策助力AI制药产业发展
AI制药已经成为国家重点支持行业。近年来,AI制药已经成为国家重点支持和鼓励发展的行业,国务院、发改委、工信部等多个部门均出台了一系列相关政策,规范和促进AI制药产业的发展。地方层面,以上海市、江苏省为代表的生物医药创新研发核心区域,均发布了相关政策。
海外出台政策为AI制药产业发展提供政策支持和指引。海外方面,2023年10月,拜登政府签署行政命令,要求联邦政府应对AI的需求而进行变化,特别要求医疗保健领域安全地使用人工智能,为AI制药产业的发展提供了政策支持和引导,同时美国食品药品监督管理局(FDA)也发布AI药物开发指南草案。欧盟也出台了一系列行政命令,为AI制药产业的发展提供政策支持和指引。
表2:AI制药支持政策资料来源:公开资料搜集,招商银行研究院
(三)AIGC浪潮下,AI制药投资活跃
AI制药投融资市场活跃。根据Deep Pharma Intelligence的数据,2015年开始,AI制药融资市场迅速活跃,从8.4亿美元的融资规模快速扩张至2022年的141.8亿美元,年复合增速达49.7%。2023年融资总额虽然有所降低,但仍高于生物医药行业总体投融资增速。随着ChatGPT引发的AIGC浪潮,AI制药投融资市场持续活跃。根据智药局的数据,2024年AI制药投融资额规模基本与2022年持平,同比增长61.1%。而同期全球医疗健康投融资额基本持平。
从行业规模来看,根据The Business Research Company的数据,预计全球AI制药市场规模将从2023年的15.8亿美元增长至2028年的56.2亿美元,年复合增速为28.5%。而根据麦肯锡的预测,长期愿景下AI制药的市场规模将达到280-530亿美元的规模。
图5:AI制药投融资情况资料来源:Deep Pharma Intelligence,招商银行研究院
图6:全球AI制药市场规模资料来源:The Business Research Company,招商银行研究院
而作为AIGC浪潮下最核心的公司,英伟达投资的AI+产业也成为未来行业发展的风向标。2023年英伟达共投资了8家AI制药公司,占全球投资的22.8%,也是英伟达出手最多的细分领域,2024年又投资了3家。在英伟达的不断加持下,AI制药也成了AI+产业未来的核心赛道。
图7:2023年英伟达投资情况资料来源:Deep Pharma Intelligence,公开资料搜集,招商银行研究院
靶点与药物发现:应用范围不断扩大,但仍需湿实验共同验证
靶点与药物发现部分是AI制药最初探索的领域之一,大部分的AI制药企业也均在该领域不断拓展新方法,开发新模型,提供解决方案。方法上来看,在靶点与药物研发阶段,AI技术仍更多的使用传统的知识图谱、深度学习、自然语言处理等方法。近两年,随着大语言模型技术的不断快速发展,部分模型中也逐步加入该方法。
(一)AI技术可助力药物早期研发降本增效
图8:药物发现各流程的主要痛点及AIDD相关环节资料来源:波士顿咨询,招商银行研究院
靶点与药物发现的难点与重要性:药物研发可通过研究疾病的发生机制、信号传导途径等过程,识别出疾病相关的靶点,进而通过干预靶点调控疾病的进程。在药物研发的过程中,主要通过靶点识别确认、苗头化合物发现、先导化合物发现与优化,最终选定目标化合物,经过各种临床前实验与优化结构后,才能提交申请开始临床试验。靶点与药物发现是新药研发的起始和核心步骤,一般可能会花费4-6年时间,根据不同阶段和开发药物类型的差异,传统实验方法痛点各异。但都需要不断试错与实验条件优化,耗时耗力且依赖专家的个人经验。
AI技术可以有效助力药物研发进度并显著降低成本。AI技术可以通过快速深度挖掘与“硅基试错”大幅减少前期药物靶点发现和分子筛选过程,减少实验所需的分子范围,从而加快药物研发进度并降低成本。
Schrodinger公司自主开发的MALT1抑制剂从靶点验证到先导化合物确定仅用10个月(传统手段需要2-3年)。类似的,英矽智能研发的特发性肺纤维化的创新药仅花费18个月就完成了从靶点发现到临床候选化合物的确定,而传统研发手段需要4-6年时间,同时研发成本仅为传统方法的10%。
湿实验(Wet Lab)仍不可或缺。虽然理论上AIDD可以帮助解决药物发现流程上的一些痛点,但由于药物研发仍是实验科学,体内数据差异较大,每一个AIDD步骤仍需要湿实验予以验证,并将实验的结果持续输入算法模型,不断优化。因此,目前AIDD在药物发现的各环节中虽然已经得到全面应用,但仍以辅助角色为主,渗透率较低。
(二)靶点识别:逐步应用,对专有数据库需求强烈
AI靶点预测可跳出传统认知,预测更加高效。AI基于多组学(涵盖基因组学、转录组学、蛋白质组学、表观基因组学、代谢组学和宏基因组学等)和文本(基金、专利、出版物、临床试验等)多种数据,利用卷积神经网络(CNN)、生成对抗网络(GAN)等各类深度学习算法分析药物和靶点之间相互作用的历史数据,学习已有药物与靶点的规律,使得新药物与靶点的相互作用预测更加准确。
英矽智能推出的PandaOmics的靶点识别模块由23种专用疾病模型驱动,通过生物信息学方法、前沿机器学习算法、图像识别技术为基础集成算法最终为特定适应症对靶点进行优先排序。诸如蛋白质家族类别、开发状态、成药性、毒性和新颖性等多种靶点选择标准,以用于优化由人工智能驱动的靶点列表,以符合特定的研究目标。通过该模型,公司与Answer ALS项目合作开展的肌萎缩侧索硬化症(ALS),成功发现28个经过验证的潜在靶点,其中18个(64%)在果蝇实验中被验证有效,涵盖8个未经报告过的基因。
图9:AI助力靶点发现流程资料来源:Trends in Pharmacological Sciences,招商银行研究院
图10:大语言模型助力疾病和靶点发现资料来源:《Large Language Models in Drug Discovery and Development》,招商银行研究院
大语言模型(LLM)潜力巨大,助力药物靶点发现。与早期自然语言处理(NLP)中基于本体论的解决方案不同,大语言模型将可以将“疾病”编码为异常通路或患者群体的自由文本描述,通过分析非结构化的数据,从大量文本数据中学习疾病复杂特征和关系,应对疾病的异质性有较大优势。此外,在分析组学数据时,大语言模型也可以通过基因组、蛋白组数据提取、通路分析等数据挖掘和自主推理,寻找疾病的相关关系,理论上可以扩大靶点发现范围。
2023年开始,各大AI药企就逐步将LLM嵌入进自身的靶点发现平台中,如英矽智能的PandaOmics融合了ChatPandaGPT功能,提供与分子生物学、治疗靶点发现和药物开发相关的信息聚合和问题解答。海外AI药企Exscientia的靶点发现算法模型,也加入利用LLM对大数据进行解读分析,从而挖掘新的药物靶点。
靶点挖掘需求下,专有数据库的丰富性及数据的质量要求不断提升。在模型算法不断提升的情况下,优质数据成为企业AI药物挖掘平台的最大差异。药物靶点发现需要基于文献、专利、基金和各类组学数据库。对于企业来说,公开的数据库均可通过合作或者爬虫等方式获取,但该类获取方式下,AI企业之间差异不大,而且文献、专利等文本数据参差不齐,企业仍需要生物医药行业专家进行标注识别。而对于组学数据来说,专有数据集的大小和质量决定了AI挖掘的结果,医院、高校甚至CRO企业积累的数据也成为核心差异所在。
(三)蛋白质结构预测:AlphaFold带动行业突破
蛋白质结构预测一般基于药物靶点的结构信息,分析匹配蛋白质的结构、激活位点、预测与其他分子的相互作用,是指导设计药物结构和性质的一个重要环节。传统的蛋白质结构预测方式,一般是通过物理化学实验解析蛋白质晶体获得。但受制于一些蛋白结构复杂、单晶样本难以制备,且冷冻电镜等实验方法成本高昂且耗时长,一直都需要更好的预测方法出现。
AlphaFold引领蛋白质结构预测突破。2018年谷歌旗下DeepMind公司推出AlphaFold 1,采用了结合卷积神经网络(CNN)与注意力机制的框架,通过对蛋白质序列两两残基距离的概率分布进行预测,进而推断三维结构,准确预测了43种蛋白质中的25种,标志着传统蛋白质折叠算法向深度学习范式的重大转变,但准确度仍不高。
2020年AlphaFold 2引入了全新的“注意力同源网络”与迭代优化模块,在神经网络中引入了自然语言处理中常用的注意力机制,极大提升了对蛋白质主链及侧链折叠状态的预测准确度,预测准确度与实验解析近乎一致,极大提升了效率。AlphaFold 2的成果解决了“蛋白质折叠问题”,使科学家能从氨基酸序列精准预测蛋白质三维结构,为理解蛋白质功能、作用机制等提供了基础,加速了生命科学基础研究进程。
在AlphaFold 2结果发布仅几周后,安进科学家就使用该模型解决了以前在湿实验室中无法解决的E3连接酶的合成问题。在两个月内,安进科学家设计了一种新的工具蛋白,用于开发创新疗法。这也表明在AI的助力下,抗体发现时间可缩短50%。
AlphaFold 3:革新模型架构,提升预测准确度。2024年AlphaFold 3推出,不同于AlphaFold 2中输入的氨基酸序列,新的版本输入更为复杂,除了蛋白质的相关标记外,还将DNA和RNA等也进行标记输入,这也使得AlphaFold 3在蛋白质数据资源有限的情况下,将AlphaFold 2的百万级数据级增长至近亿级别。计算方法采用了基于扩散模型的架构,通过“pairformer”模块处理成对表示和单个表示,还引入了“扩散模块”,并采用交叉蒸馏方法提高模型泛化能力。不仅能更精确地预测蛋白质结构,还能联合预测包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物的结构,在蛋白质-配体、蛋白质-核酸、抗体-抗原等相互作用的预测准确性上显著提升,还可以预测大分子基团上的共价修饰。
图11:AlphaFold 3数据架构资料来源:Nature,招商银行研究院
预测精度仍较为粗糙,需要实验验证。蛋白质结构预测精度仍然较为粗糙,可以作为早期筛选的辅助工具,减少目标范围,最终仍需通过实验方法进行蛋白表达与结构表征,进行后续研发步骤。
(四)药物发现与优化:AI技术已经充分应用
AI技术已经充分应用,但仍需专家经验和湿实验验证。相比于靶点发现阶段,AI技术在药物发现和优化阶段应用已经非常广泛,基本上所有AI制药公司都在该领域布局,精进自身算法。但由于AI技术本身的data-driven模式,该过程仍然需要专家经验和湿实验验证优化。
1、虚拟筛选已经成为药物分子设计与筛选的有力补充
虚拟筛选已经成为药物分子设计与筛选的有力补充。小分子药物研发中,AI算法可以基于结构或者配体对大量的化合物数据库进行虚拟筛选,无需实物库,通过模拟化合物与靶点的相互作用,预测化合物是否具有潜在的生物活性,从而快速从海量化合物(1012-1015)中找出可能与特定疾病靶点结合的分子,再辅以实验验证,可大大减少需要实验验证的分子量,显著降低成本、提高效率。
虚拟筛选可能会产生明显的偏向性。不同于实物化合物库的筛选,由于虚拟筛选是基于结构或者配体建库,因此,本身可能具有一定的偏向性,不够全面。因此,如何提升筛选的全面性也是目前的研发方向的方向之一。
此外,AI也可以利用深度学习分析药物的生成规律,根据研发目标和需求,有针对性地设计药物分子结构、对化合物进行优化或重新合成,最终设计出可能与靶点具有良好结合活性的分子结构。
国内企业中,包括英矽智能的Chemistry42、晶泰科技的ID4IdeaTM、维亚生物、泓博医药等都在小分子药物筛选和设计中有很多探索。海外企业中,包括Schrodinger、Excscientia、Recursion等也有自己的特有技术平台。
图12:虚拟筛选流程资料来源:维亚生物官网,招商银行研究院
图13:抗体药物亲和力模拟资料来源:维亚生物官网,招商银行研究院
2、AI技术助力生物药结构设计
AI算法助力抗体、核酸、多肽药物设计。以抗体为例,蛋白质结构预测不仅可以提供靶点情况,还能为靶点抗原与抗体药物的相互作用提供参考,最终可以利用专家经验选择几个蛋白-蛋白复杂模型进行表达与表征,研究蛋白-蛋白相互作用,然后通过分子动力学模拟、残基扫描找出稳定性/亲和力符合要求的突变,最终进行测试。AI技术还可以服务于抗体人源化性质预测等,大大降低传统实验室中抗体设计的成本并缩短研发时间 。
图14:Moderna个性化疫苗开发流程资料来源:Moderna官网,招商银行研究院
图15:个性化疫苗序列研发流程资料来源:Moderna官网,招商银行研究院
AI算法助力个性化疫苗设计研发。Moderna已经将AI技术用于个性化疫苗的研发流程中,通过获取患者的肿瘤和正常组织样本,通过测序和人白细胞抗原(HLA)分型获取患者数据,然后筛选新抗原,最后进行mRNA序列数据计算设计,最终形成包含34种新抗原的个性化疫苗,在通过生产注射回患者体内,整体流程在6周之内完成。
临床开发:大语言模型(LLM)逐步探索
AI技术在临床开发阶段虽然还不成熟,但市场空间大,适合大语言模型探索。临床开发是药物研发的核心环节,研究周期长,花费巨大。而临床开发的高失败率又使其成为新药研发中最困难的一步。虽然近年来,一些研究机构和企业已经开始利用机器学习、自然语言处理(NLP)等方法辅助临床试验设计、患者招募和数据处理等,但仍不成熟,实际应用仍较少。而且相比于靶点和药物发现环节,临床开发阶段有很多文本和辅助需求,适合大语言模型的探索使用。因此在大语言模型算法逐步成熟,临床开发也被认为是未来空间巨大的应用环节。
图16:大语言模型(LLM)在临床试验中的应用前景资料来源:《Large Language Models in Drug Discovery and Development》,招商银行研究院
(一)LLM可多个环节助力临床试验,但仍在技术探索阶段
大语言模型助力ICD编码。ICD编码是临床实践中的一项重要工作,旨在为患者记录分配ICD代码。这通常是一个耗时费力的过程。通过分析大量的电子健康记录数据,大语言模型可以预测最适合电子健康记录的代码,从而帮助临床从业者做出更明智的决策,并简化流程。
精准匹配患者。通过对电子病历、医疗记录等大量数据的分析,AI可以快速筛选出符合临床试验入组条件的患者。特别是LLM的快速兴起,融合文本、图像、基因数据等多模态信息,更全面地了解患者情况,同时利用推理能力来快速匹配,节省人工筛选成本。此外,以Tempus AI为代表的AI医疗企业可以通过自有的肿瘤标志物筛查服务得到患者的专有信息,同时通过患者自趋提供的医疗信息,帮助患者和创新药试验企业得到精准匹配。但由于通用大模型的医学知识的局限性和大模型的AI幻觉,目前仍需医疗专业人员持续监督,以确保可靠性。
临床试验精准规化。规划一项临床试验涉及多项繁重的工作,包括检索历史试验资料、设计试验标准以及选择合适的试验地点。为了加快这一进程,通用大语言模型已被引入该领域。这些模型利用关于试验的历史数据、患者治疗结果以及人口统计趋势,提供有参考价值的建议。包括ChatGPT和DeepSeek等通用模型均可以提供临床试验设计规化。
临床试验结果预测。通过分析试验结果的变量,如疾病信息、药物信息、试验标准和方案等,大语言模型可以提供有见地的预测,帮助试验设计者完善试验计划,从而降低因试验配置欠佳而导致不良结果的风险。
文件撰写。即生成各类临床文件,如出院小结、临床记录和放射学报告,是临床医生耗时费力的工作。LLM凭借其强大的文本生成能力,正越来越多地被用于实现这一过程的自动化,也是应用最充分的方向。
临床试验辅助。LLM可以帮助患者理解试验相关信息、协助临床医生检索和理解相关文献及患者数据,加快患者入组的效率。而在药物警戒方面,通过识别和报告不良事件来支持药物警戒工作,提高数据解读的效率和速度。
目前来看,除文件撰写和临床试验辅助部分,AI技术已经有了一些初步应用,其他临床环节中,AI技术仍在使用探索中。
(二)应用:MNC积极拥抱AI技术
赛诺菲与Yseop合作,实现文件撰写自动化流程。2022年6月16日,赛诺菲选择与Yseop扩大合作,利用其技术自动撰写临床研究报告(CSR),加速临床研究的提交过程。该合作实现了赛诺菲临床试验安全报告撰写流程的部分自动化,有助于将报告撰写时间平均减少40%。
IQVIA与英伟达合作,开发AI智能体,加快研究流程。IQVIA是全球临床CRO和医疗健康咨询服务商,拥有深厚的医疗健康领域专业积累与经验,以及庞大的信息资产,其Connected Intelligence能为AI应用提供丰富的数据和专业知识支持。2025年JP Morgan大会期间,IQVIA宣布与英伟达共同合作,利用英伟达的AI Foundry平台和服务,结合自身的IQVIA Connected Intelligence,构建语言和多模态基础模型,为定制化的IQVIA AI智能体提供支持。预计首批AI解决方案将在2025年推向市场,将有助于临床研发流程加速。
DeepSeek风潮下,国内多家药企接入。开年以来,随着国内DeepSeek的风潮持续,包括恒瑞医药、君实医药、泰格医药等国内头部药企和临床CRO企业接入DeepSeek,助力临床研究过程。
研发进展和市场格局
(一)研发:管线多处于早期阶段,国内企业进展较快
1、管线多处于早期阶段,AI驱动发现的创新药物仍等待数据读出
AI医药研发管线主要仍处于临床前阶段。根据Insight数据库显示,全球目前共有571个使用AI技术研发的药物管线,其中443个仍在积极推进中。其中,90个药物进入临床,80%的药物仍处于临床前的阶段。共有17个药物进入临床II期以后的阶段。
临床进展较快的产品多为老药新用,AI驱动发现的创新药物仍需等待临床验证。目前已经上市的仅有右美托咪定舌下膜剂,该药物是AI技术在老药新用方面的成功案例。进入临床III期的3个药物中,均为老药新用或者AI技术应用于研发的某一步骤。其中,剂泰医药的MTS004是“老药新用”产品,武田和Nimbus的Zasocitinib在早期药物筛选和优化环节使用了AI计算策略,而博瑞的BGM0504则通过分子动力学模拟发现了最佳多肽序列。
全球首款进入临床的完全由AI技术驱动发现的新药DSP-1181临床I期效果不及预期,目前该类产品中临床进展最快药物已进入临床II期,仍在等待最新临床结果读出。如果该产品的临床数据较为出色,也就更好的验证了AI技术驱动创新药靶点发现,助力创新研发的底层逻辑,有望带动行业的持续快速投资和发展。
图17:全球AI研发管线情况(积极)
资料来源:Insight数据库,招商银行研究院
备注:截至2025年2月14日
资料来源:Insight数据库,招商银行研究院 备注:截至2025年2月14日;选择仍在积极推进的管线
2、国内企业积极布局AI制药行业,研发进度较快
国内企业积极布局,研发进度靠前。全球来看,利用AI技术研发的药物进入临床最多的是英矽智能,已经有10个管线处于临床试验中,其次是英伟达投资的Recursion,共有6个管线处于临床试验中。全球共有14个药企的AI管线中有两个以上正在临床中积极推进,其中5家都是中国的AI biotech企业,考虑到临床前管线的情况,国内biotech也是在该赛道中技术布局较早,临床推进较快的。
3、小规模数据显示,AIDD确实可以提升临床成功率
AI驱动创新药物研发可以提升临床成功率。虽然目前AI技术用于创新药物进入临床的仍是少数,但小规模的研究数据显示AI技术用于药物早期研发中缺失可以提升临床成功率。根据波士顿咨询对AI biotech企业管线的研究,截至2023年12月,已有24个AI发现的分子完成了I期试验,成功率为80~90%,远远超出40%~65%的行业历史平均水平。已有10个AI发现的分子完成了Ⅱ期试验,其中成功的有四个,成功率为40%,与30%~40%的行业历史水平一致。从使用AI技术的类型看,I期临床中,失败的分子主要集中在AI技术用于靶点挖掘和分子优化方面。
图19:AIDD提升临床研究成功率资料来源:Drug Discovery Today,招商银行研究院
(二)MNC积极涌入,AI驱动的药物研发逐步成为重点
根据Insight数据,2021年开始跨国药企(MNC)就开始积极投入AI技术平台/管线,2022-2024年交易持续在高位。2021-2024年的4年中,MNC药企与AI赋能生物技术公司在管线合作和平台使用中共进行了69笔交易,披露的首付款达59.84亿元,总交易价值达311.13亿元。
此外,全球TOP10药企也在与AI/科技公司合作。
罗氏、阿斯利康、安进等都与英伟达的BioNeMo(端到端云服务平台)合作,以加速药物开发
诺华通过和微软及亚马逊的AWS合作,提高公司数字化能力
渤健与谷歌结盟,探索在神经退行性疾病中监测认知能力下降的方法
罗氏推出“数字化日”,向投资者展示其在医药产业中对AI的应用。
礼来和OpenAI达成合作,开发新型抗菌药物
图20:MNC关于AI技术平台/管线交易资料来源:Insight数据库,招商银行研究院
随着AI技术的火热,MNC对于AI技术的重视逐步提升,未来AI驱动药物研发也会逐步成为重点领域,占比继续提升。
(三)商业模式与市场格局
AI技术中,算法、算力和数据三者需要互相配合,缺一不可。而医药行业由于本身的实验属性,在AI平台计算(干实验)后,仍需传统实验操作(湿实验)进行互相验证。
1、商业模式:起于AI+SaaS,AI+Biotech市场空间更大
AI制药行业中主要的商业模式包括AI+SaaS、AI+CRO和AI+Biotech。
AI+SaaS:为客户提供AI辅助药物开发软件服务,帮助企业加速研发流程,节省成本与时间。
AI+CRO:通过人工智能的辅助为客户提供CRO服务,再由药企进行后续开发或合作推进管线。
AI+Biotech:利用自身AI平台和技术挖掘创新药物,推动药物上市或者license out给大型药企共同推进管线。
Schrodinger成长史代表了AI制药商业模式的转变。Schrodinger作为成立时间最早的AI药物研发企业之一,2020年作为首家AI制药企业在纳斯达克上市,他的发展历程也说明了AI制药的商业模式的变迁。Schrodinger起于AI+SaaS,早期以售卖AI制药应用软件为主.但由于软件服务的市场空间较小,2010年公司开始从事AI辅助药物发现业务,增加AI+CRO。2018年开始,公司开始独立研发自有管线,进入AI+Biotech业务中。因此,可以看出,在这三类商业模式中,AI+SaaS和AI+CRO的确定性更强,但AI+biotech未来市场空间更大。实际案例中,很多AI制药企业既提供AI+SaaS服务,也涉足其他两种模式。
图21:Schrodinger发展历程资料来源:Schrodinger公司官网,招商银行研究院
AI制药行业主体参与者,包括AI制药初创公司、大型药企/CRO和科技/IT企业。
图22:AI制药行业中的核心参与者
资料来源:招商银行研究院
2、初创企业:AI制药领域的主要玩家
AI领域的主要玩家,数量众多,美国企业占比最高。根据Deep pharma intelligence数据,截至2023年Q1,全球共有800家AI制药初创公司,这类企业也是AI制药领域的最初和主要玩家们。从地域上来看,800家AI制药企业中,53.31%的企业都集中在美国,27.09%企业位于欧洲(包括英国),中国企业占比仅为3.62%
这类公司主要在AI医药领域深耕,高管团队多为复合型团队。其中既有对医药行业算法精通的高管,也有药物化学家,可以通过专家经验不断精进算法,形成专家级垂域专业模型。
AI+SaaS模型切入,最终形态与biotech类似。如上文所说,AI初创公司多在初始阶段通过AI+SaaS模型切入,通过软件/技术合作方式与药企或者CRO服务,利用其丰富的数据不断提升模型能力。但由于AI+SaaS天花板较低,后续大部分企业都开始探索AI+Biotech模式,研发自身管线,通过管线的授权模式收费,类似于Biotech企业。部分企业也会慢慢进入AI+CRO模式,但相比于传统CRO而言,湿实验配置较少仍会产生困扰。竞争力相比配有AI平台的传统CRO企业相对较低。
3、大型药企/CRO:核心受益者,AI技术逐步成为有效工具为药企提质增效
大型药企是使用方和实际受益方。大型药企主要通过自建团队、投资并引入技术平台等方式进入AI制药赛道。无论是早期药物发现还是临床推进过程中,AI技术都将为大型药企研发提质增效,也使得大型药企成为AI制造产业链中的下游使用方和实际受益方。
相较其他参与者而言,理论上大型药企在具体研发领域中数据丰富、专家经验丰富,可以通过与AI软件商的合作建立垂域专业模型,实际在运营中提升效率。但由于大型企业各部门之间竖井较深,数据并不容易互通。因此,大概率大型药企仍是AI制药技术的最终使用方。
早期研发方面,海外药企并购为主,国内药企自建平台。药物早期发现中,海外大型药企虽然也会在内部部署AI研发平台进行早期研究,但更多仍以并购管线为主。国内的大型药企,主要模式都是通过和AI制药服务商进行软件/技术战略合作,在内部自建AI研发平台推进新药研发。譬如,石药集团通过AI驱动的小分子药物设计平台获得的SYH2039在2024年12月以1.5亿美元首付款的价格将全球权益授权给百济神州,也验证了其AI平台的能力。
高质量及丰富数据助力CRO企业成为AI技术浪潮中的核心受益方。CRO企业作为新药研发的服务商,对市场趋势变化极为敏感。无论是从加快交付成果还是减少人工支出的角度出发,AI在药物研发领域的应用都对CRO企业吸引力巨大。因此,多个龙头企业均早早通过自建、合作或者投资方式丰富自身的AI+CRO服务平台。
在干湿实验结合的需求下,AI可以提升效率,但无法取代CRO服务。而在早期研发的服务中,AI平台的加入可以给下游客户提供更多选择,增加差异化、提升客户粘性。目前来看,高质量和丰富的数据集仍是AI制药行业的核心制约因素。头部CRO企业通过长期服务,积攒了各环节中丰富且高质量的数据和经验(既有成功的,也有失败的),在这些高质量数据下,可以持续输入AI模型,提升模型的准确性。
而在临床开发阶段,匿名化的丰富数据也可以用来与IT/科技企业合作,训练垂域模型,提升服务效率。
4、IT/科技企业:适合从临床垂域大模型开发角度切入
IT/科技企业算法能力强,但行业专业度仍较为缺乏。这类企业算法能力较为出众,但由于新药研发的专业度高,尤其是靶点和药物开发环节中需要专业的药物化学家、结构生物学家等专家型人才和专有高质量数据,而这些是IT/科技公司最为缺乏的,因此最终的模型在实际使用中仍差强人意。虽然目前为止,IBM、腾讯、百度、字节跳动等IT/科技企业均进入AI制药领域,但短期合作案例并不多,市场反响平平。其次,IBM Watson实验室在AI医疗领域并不成功的探索也证明了专业度缺失对于IT/科技企业在该领域仍有较大短板。
临床垂域大模型开发更适合IT/科技企业进入。相较于早期研发中环节多样,对于专家需求更高,且每一步都需要湿实验验证。临床开发环节中一些文件撰写、临床试验辅助等环节已经可以逐步使用AI agent进行处理。整体来看,大语言模型在临床开发环节未来可能会有巨大的发展空间,而IT/科技企业在这方面的技术储备丰富,迭代快。虽然也面临专业度和高质量数据缺乏的问题,但可以通过与临床CRO/药企和医院合作进行推进,从而建立临床领域的垂域大模型。
上游受益最为确定。IT/科技企业进入AI制药市场,除了业务扩展外,很多是由于企业本身提供GPU或者云服务,通过下游合作,提升自身业绩增长。譬如,英伟达将AI模型和算法加入端到端平台,主要是通过扩展下游应用,提升GPU的需求能力,确定性最强。据英伟达预测,未来医疗行业将有1000亿美元的算力需求。
业务建议与风险提示
(一)业务建议:AI制药行业趋势逐步开启,需要持续关注
(本段有删节,招商银行各部请登录“招银智库”中搜索完整行内版报告)
(二)风险提示
技术落地不及预期。虽然AI制药在医疗领域需求较强,市场愿景较高,但应用仍属于相对早期拓展。AI技术在虚拟筛选、药物合成等方面仍有较大偏向性,或者路线设计难以实现等问题,实际应用落地可能不及预期。
AI幻觉造成的模型效果不及预期。临床试验环节,LLM被寄予厚望。但本身模型AI幻觉问题仍然较为严重,而药物研发对准确性要求较高。在临床设计、患者精准匹配中如果由于幻觉影响导致实际效果较差,仍会影响AI使用。
高质量数据不足。高质量的模型需要依靠高质量的数据,目前公开数据较为繁杂,论文质量不一,动物模型数据缺乏等都可能导致算法准确度受到影响,从而影响落地应用。
临床开发不及预期。创新药研发虽然在AI助力下可以提升效率,节省成本。但整体药物研发仍需湿实验及较长的临床周期验证,产品进展会有一定的不确定性。
商业化及定价风险。AI制药在整个医药制造产业中占比仍较小,因此技术推出后是否能匹配市场需求仍存在不确定性。而对于AI软件企业来说,收费模式和盈利方式仍需要不断探索。
数据安全问题。在人工智能快速发展的背景下,数据成为重要的生产要素。AI在医药健康领域快速应用的同时,存在因数据不合理使用或者泄露导致的安全性风险和监管风险。
■ AI制药概览。AI制药即人工智能驱动药物研发,包括靶点和药物发现、临床前实验设计、临床开发及老药新用等多个方向。其中,靶点和药物发现与临床研发需求强烈&市场空间大,是AI制药的主要方向。纵观AI制药的发展历程,随着计算能力和数据量的大幅增长,AI制药已经进入应用拓展阶段,传统的计算机辅助药物设计(CADD)也升级为人工智能驱动药物研发(AIDD)。
■ 需求和政策推动下,AI制药投资持续增长。随着低垂果实的摘取,新药研发难度不断增大。为了提升研发效率,降低研发成本,AI制药的需求不断凸显。政策方面,AI制药已经成为国家重点支持方向,欧美也在完善政策支持和指引。2015-2022年,AI制药投融资年复合增速达49.7%。即使在全球医药投融资市场较弱的2022-2024年,AI制药投融资仍相对活跃。行业规模来看,预计2028年全球AI制药市场规模达56.2亿美元。据麦肯锡预测,长期来看市场规模有望达到280-530亿美元。
■ 靶点与药物发现:应用范围不断扩大,但仍需湿实验共同验证。该部分是AI制药最早探索的领域,技术更多是传统的知识图谱、深度学习等。整体来看, AI技术可以通过快速深度挖掘与“硅基试错”大幅减少前期药物靶点发现和分子筛选过程,加快药物研发进度并降低成本。但由于本身实验科学的原因,仍需湿实验配合验证。AI技术在该部分多个步骤都有应用模型,其中比较重要的是靶点识别、蛋白质结构预测和药物发现与优化。
■ 临床开发:大语言模型逐步探索。AI技术在临床开发阶段虽然还不成熟,但市场空间大,适合大语言模型探索。具体来看,大语言模型可以在ICD编码、精准匹配患者、试验精准规划、结果预测、文件撰写和试验辅助等多个方面提供帮助。目前落地最好的是文件撰写和试验辅助,其他部分仍在探索中。包括赛诺菲、IQVIA在内的多家药企/CRO已经开始在该环节尝试落地AI技术。
■ 研发进展和市场格局。研发方面,管线多处于早期阶段,完全由AI驱动发现的创新药物最快的处于临床II期,等待数据读出。国内企业积极布局AI制药,研发进度靠前。随着AI技术逐步成熟,MNC积极涌入,AI驱动药物研发逐步成为重点。商业模式主要分为三类,始于AI+SaaS,但AI+Biotech空间更大。参与者来看,AI制药初创企业仍在该行业的主要玩家,美国企业占比最高。大型药企/CRO企业是该技术的最终使用方和核心受益方。IT/科技企业医药专业度较为缺乏,临床垂域大模型开发更适合切入。
■ 风险提示。技术落地不及预期;AI幻觉导致模型效果不及预期;高质量数据不足;临床开发不及预期;商业化级定价风险;数据安全。
正文
随着ChatGPT等大语言模型的推出,AI技术在医药行业中尤其是新药研发中的应用受到越来越多的关注。2024年诺贝尔化学奖授予AlphaFold 2研究团队以表彰他们在蛋白质结构预测方面的贡献,AI技术在药物发现方面的研究进展再一次被推向风口。本文我们将围绕这一主题展开论述。
概览
AIGC浪潮下,AI制药已经成为AI应用的主要方向之一。根据Bloomberg的预测,2022-2023年AIGC的市场应用规模增速来看,AI技术在药物研发应用的市场规模的年复合增长率高达113%,增速仅次于AI技术在广告方面的应用。
资料来源:Bloomberg Intelligence,招商银行研究院
(一)AI制药概念
AI制药,即人工智能驱动药物研发(AIDD),是指利用人工智能技术来加速和优化药物发现和开发的过程,旨在提高药物研发的效率、降低成本、提高成功率,并最终为患者带来更有效的治疗方案。
AIDD主要包括靶点和药物发现、临床前实验设计、临床开发及老药新用等多个方向。
靶点和药物发现:利用AI算法分析大量的生物医学数据,识别并预测潜在的药物靶点,筛选并优化候选药物,从而加速新药研发和靶点鉴别效率。
临床前实验设计:利用AI算法优化实验和数据处理、并对候选药物的吸收、分布、代谢、排泄和毒性等特性进行评估,选择合适的制剂方案。
临床开发:利用AI算法分析大量医疗记录,优选适应症和目标人群,优化临床试验设计,确定合适的临床方案等。
老药新用:利用大数据和算法大规模搜索识别现有药物新的应用或适应症,达到老药新用的目的。
图2:AI制药主要环节市场空间及技术成熟度资料来源:招商银行研究院
靶点和药物发现与临床研发是AI技术应用的重点环节。整体来说,靶点和药物发现与临床研发一个是新药研发的起步和核心部分,一个是药物研发最耗时耗财的部分,这两部分数据量丰富多样,是AIDD的核心方向,市场空间大。
临床前实验主要是各种体外和动物实验,AI只能在某些特定领域进行辅助预测,市场空间相对较小。而且受制于数据量相对较少,AI模型技术也不算成熟。
老药新用是AI技术最早在药物研发中的应用方向,技术已经非常成熟,也有药物成功上市。但药物销售情况不佳,随着AI技术在药物研发中的不断应用,未来专利会形成全面保护,也使得老药新用能挖掘出的分子越来越少,市场空间持续缩小。
因此,本报告主要将主要针对靶点和药物发现以及临床开发部分进行研究。
(二)AI制药发展历史
AI制药的发展历史可以追溯到20世纪末,21世纪初随着计算能力和数据量的大幅增长而加速发展:
起步阶段(20世纪末-2012):在20世纪末,随着计算机科学和生物信息学的发展,研究人员开始尝试使用计算机辅助药物设计(CADD)技术来进行药物发现。这些早期的尝试主要集中在分子对接、定量构效关系(QSAR)建模等基础的计算方法上,Schrodinger推出各类计算软件。随着基因组学、蛋白质组学等生物技术的发展,大量的生物医学数据开始积累,为后续AI在药物研发中的应用奠定了基础。技术方面,DL(深度学习)、NLP(自然语言)等AI理论的突破也为AI制药的长期发展提供了技术支撑。
初步应用阶段(2013-2016):深度学习技术快速发展,AI技术逐步被用于药物研发。包括Exscientia、Atomwise、Recursion,英矽智能、晶泰科技等一大批公司成立,探索早期商业模式。
快速发展阶段(2017-2019):AI制药企业基本完成技术积累,开始推出一系列更具深度和广度的AI技术服务,如谷歌的DeepMind团队发布用于预测蛋白质三维结构的人工智能算法AlphaFold,英矽智能推出人工智能药物研发平台Pharma.AI等。
应用拓展阶段(2020年至今):2020年世界上首个AI设计药物DSP-1181进入临床,2021年AlphaFold 2实现超高置信度预测蛋白结构。而随着技术的逐步成熟,传统制药公司开始与AI制药公司展开合作,共同探索AI在药物研发中的应用,2023年随着大语言模型(LLM)的推出,又提升了AIDD的实用性和使用便捷度。
图3:AI制药发展历史
资料来源:Deep Pharma Intelligence,公开资料搜集,招商银行研究院
(三)算力提升后,CADD升级成为AIDD
CADD早已成新药研发中的常规工具。20世纪末,随着计算机科学和生物信息学的发展,计算机辅助药物设计(CADD)已经持续参与到新药发现的过程中,已经成为常规工具。但整体来说,CADD仍是基于药物化学家的知识和设计为主,模拟现有的结构、性质,通过计算进行合理性设计辅助。
AIDD是CADD的加强版,加速推动医药研发创新。人工智能驱动药物研发(AIDD)则是在大数据的基础上,通过将机器学习、深度学习等AI技术嵌入到新药研发中,通过机器的自我学习和推理来预测,降低了对于差异化极大的个体经验的需求。而且,相比于CADD而言,AIDD的大数据处理能力、效率和准确度、以及对复杂生物系统模拟的能力均有较大提升,更难得的是可以基于对大量已知药物和疾病表型数据的学习,提出全新的药物作用机制假设,为创新药物研发提供更多可能性。可以说,AIDD既是CADD的加强版,也是融合了“专家”知识体系后快速的自我迭代,推动医药研发进入新的篇章。
表1:CADD和AIDD的差异资料来源:公开资料搜集,招商银行研究院
需求和政策推动下,AI制药投资持续增长
(一)新药研发难度加大,AI辅助需求提升
低垂果实摘取,新药研发难度不断加大。新药研发领域一直存在“双十定律”,即研发一种新药需要10-15年左右的时间和10亿美元的成本。然而随着研发的不断深入,现有的靶点、药物已不足以满足日益增长的需求,海量异质数据难分析,疾病机理难以发现等导致新药研发难度不断加大。根据2014年塔夫茨药物开发研究中心(CSDD)的数据,开发一种获得市场批准的新处方药的成本约为26亿美元,与2003年相比,经过通货膨胀调整后仍有145%增长。根据2024年Drug Discovery Today的最新论文来看,2023年新药研发的成本已经高达37亿美元(3年滚动均值)。而对比2012-2019年的临床研究情况,临床各阶段的成功率均随年度逐步降低。
为了提升研发效率,AI制药需求不断凸显。相比于传统新药研发模式多依靠专家“知识”与不断的实验探索,AI制药则是以海量医药大数据为基础,通过机器学习、深度学习等多种AI技术,对疾病机理、药物结构等进行快速分析,以优化药物研发。理论上可以有效优化从药物发现到临床试验的全流程,提升研发效率,降低研发成本和时间。
图4:新药研发流程、痛点和AI助力方向资料来源:OMAHA,招商银行研究院
(二)政策助力AI制药产业发展
AI制药已经成为国家重点支持行业。近年来,AI制药已经成为国家重点支持和鼓励发展的行业,国务院、发改委、工信部等多个部门均出台了一系列相关政策,规范和促进AI制药产业的发展。地方层面,以上海市、江苏省为代表的生物医药创新研发核心区域,均发布了相关政策。
海外出台政策为AI制药产业发展提供政策支持和指引。海外方面,2023年10月,拜登政府签署行政命令,要求联邦政府应对AI的需求而进行变化,特别要求医疗保健领域安全地使用人工智能,为AI制药产业的发展提供了政策支持和引导,同时美国食品药品监督管理局(FDA)也发布AI药物开发指南草案。欧盟也出台了一系列行政命令,为AI制药产业的发展提供政策支持和指引。
表2:AI制药支持政策资料来源:公开资料搜集,招商银行研究院
(三)AIGC浪潮下,AI制药投资活跃
AI制药投融资市场活跃。根据Deep Pharma Intelligence的数据,2015年开始,AI制药融资市场迅速活跃,从8.4亿美元的融资规模快速扩张至2022年的141.8亿美元,年复合增速达49.7%。2023年融资总额虽然有所降低,但仍高于生物医药行业总体投融资增速。随着ChatGPT引发的AIGC浪潮,AI制药投融资市场持续活跃。根据智药局的数据,2024年AI制药投融资额规模基本与2022年持平,同比增长61.1%。而同期全球医疗健康投融资额基本持平。
从行业规模来看,根据The Business Research Company的数据,预计全球AI制药市场规模将从2023年的15.8亿美元增长至2028年的56.2亿美元,年复合增速为28.5%。而根据麦肯锡的预测,长期愿景下AI制药的市场规模将达到280-530亿美元的规模。
图5:AI制药投融资情况资料来源:Deep Pharma Intelligence,招商银行研究院
图6:全球AI制药市场规模资料来源:The Business Research Company,招商银行研究院
而作为AIGC浪潮下最核心的公司,英伟达投资的AI+产业也成为未来行业发展的风向标。2023年英伟达共投资了8家AI制药公司,占全球投资的22.8%,也是英伟达出手最多的细分领域,2024年又投资了3家。在英伟达的不断加持下,AI制药也成了AI+产业未来的核心赛道。
图7:2023年英伟达投资情况资料来源:Deep Pharma Intelligence,公开资料搜集,招商银行研究院
靶点与药物发现:应用范围不断扩大,但仍需湿实验共同验证
靶点与药物发现部分是AI制药最初探索的领域之一,大部分的AI制药企业也均在该领域不断拓展新方法,开发新模型,提供解决方案。方法上来看,在靶点与药物研发阶段,AI技术仍更多的使用传统的知识图谱、深度学习、自然语言处理等方法。近两年,随着大语言模型技术的不断快速发展,部分模型中也逐步加入该方法。
(一)AI技术可助力药物早期研发降本增效
图8:药物发现各流程的主要痛点及AIDD相关环节资料来源:波士顿咨询,招商银行研究院
靶点与药物发现的难点与重要性:药物研发可通过研究疾病的发生机制、信号传导途径等过程,识别出疾病相关的靶点,进而通过干预靶点调控疾病的进程。在药物研发的过程中,主要通过靶点识别确认、苗头化合物发现、先导化合物发现与优化,最终选定目标化合物,经过各种临床前实验与优化结构后,才能提交申请开始临床试验。靶点与药物发现是新药研发的起始和核心步骤,一般可能会花费4-6年时间,根据不同阶段和开发药物类型的差异,传统实验方法痛点各异。但都需要不断试错与实验条件优化,耗时耗力且依赖专家的个人经验。
AI技术可以有效助力药物研发进度并显著降低成本。AI技术可以通过快速深度挖掘与“硅基试错”大幅减少前期药物靶点发现和分子筛选过程,减少实验所需的分子范围,从而加快药物研发进度并降低成本。
Schrodinger公司自主开发的MALT1抑制剂从靶点验证到先导化合物确定仅用10个月(传统手段需要2-3年)。类似的,英矽智能研发的特发性肺纤维化的创新药仅花费18个月就完成了从靶点发现到临床候选化合物的确定,而传统研发手段需要4-6年时间,同时研发成本仅为传统方法的10%。
湿实验(Wet Lab)仍不可或缺。虽然理论上AIDD可以帮助解决药物发现流程上的一些痛点,但由于药物研发仍是实验科学,体内数据差异较大,每一个AIDD步骤仍需要湿实验予以验证,并将实验的结果持续输入算法模型,不断优化。因此,目前AIDD在药物发现的各环节中虽然已经得到全面应用,但仍以辅助角色为主,渗透率较低。
(二)靶点识别:逐步应用,对专有数据库需求强烈
AI靶点预测可跳出传统认知,预测更加高效。AI基于多组学(涵盖基因组学、转录组学、蛋白质组学、表观基因组学、代谢组学和宏基因组学等)和文本(基金、专利、出版物、临床试验等)多种数据,利用卷积神经网络(CNN)、生成对抗网络(GAN)等各类深度学习算法分析药物和靶点之间相互作用的历史数据,学习已有药物与靶点的规律,使得新药物与靶点的相互作用预测更加准确。
英矽智能推出的PandaOmics的靶点识别模块由23种专用疾病模型驱动,通过生物信息学方法、前沿机器学习算法、图像识别技术为基础集成算法最终为特定适应症对靶点进行优先排序。诸如蛋白质家族类别、开发状态、成药性、毒性和新颖性等多种靶点选择标准,以用于优化由人工智能驱动的靶点列表,以符合特定的研究目标。通过该模型,公司与Answer ALS项目合作开展的肌萎缩侧索硬化症(ALS),成功发现28个经过验证的潜在靶点,其中18个(64%)在果蝇实验中被验证有效,涵盖8个未经报告过的基因。
图9:AI助力靶点发现流程资料来源:Trends in Pharmacological Sciences,招商银行研究院
图10:大语言模型助力疾病和靶点发现资料来源:《Large Language Models in Drug Discovery and Development》,招商银行研究院
大语言模型(LLM)潜力巨大,助力药物靶点发现。与早期自然语言处理(NLP)中基于本体论的解决方案不同,大语言模型将可以将“疾病”编码为异常通路或患者群体的自由文本描述,通过分析非结构化的数据,从大量文本数据中学习疾病复杂特征和关系,应对疾病的异质性有较大优势。此外,在分析组学数据时,大语言模型也可以通过基因组、蛋白组数据提取、通路分析等数据挖掘和自主推理,寻找疾病的相关关系,理论上可以扩大靶点发现范围。
2023年开始,各大AI药企就逐步将LLM嵌入进自身的靶点发现平台中,如英矽智能的PandaOmics融合了ChatPandaGPT功能,提供与分子生物学、治疗靶点发现和药物开发相关的信息聚合和问题解答。海外AI药企Exscientia的靶点发现算法模型,也加入利用LLM对大数据进行解读分析,从而挖掘新的药物靶点。
靶点挖掘需求下,专有数据库的丰富性及数据的质量要求不断提升。在模型算法不断提升的情况下,优质数据成为企业AI药物挖掘平台的最大差异。药物靶点发现需要基于文献、专利、基金和各类组学数据库。对于企业来说,公开的数据库均可通过合作或者爬虫等方式获取,但该类获取方式下,AI企业之间差异不大,而且文献、专利等文本数据参差不齐,企业仍需要生物医药行业专家进行标注识别。而对于组学数据来说,专有数据集的大小和质量决定了AI挖掘的结果,医院、高校甚至CRO企业积累的数据也成为核心差异所在。
(三)蛋白质结构预测:AlphaFold带动行业突破
蛋白质结构预测一般基于药物靶点的结构信息,分析匹配蛋白质的结构、激活位点、预测与其他分子的相互作用,是指导设计药物结构和性质的一个重要环节。传统的蛋白质结构预测方式,一般是通过物理化学实验解析蛋白质晶体获得。但受制于一些蛋白结构复杂、单晶样本难以制备,且冷冻电镜等实验方法成本高昂且耗时长,一直都需要更好的预测方法出现。
AlphaFold引领蛋白质结构预测突破。2018年谷歌旗下DeepMind公司推出AlphaFold 1,采用了结合卷积神经网络(CNN)与注意力机制的框架,通过对蛋白质序列两两残基距离的概率分布进行预测,进而推断三维结构,准确预测了43种蛋白质中的25种,标志着传统蛋白质折叠算法向深度学习范式的重大转变,但准确度仍不高。
2020年AlphaFold 2引入了全新的“注意力同源网络”与迭代优化模块,在神经网络中引入了自然语言处理中常用的注意力机制,极大提升了对蛋白质主链及侧链折叠状态的预测准确度,预测准确度与实验解析近乎一致,极大提升了效率。AlphaFold 2的成果解决了“蛋白质折叠问题”,使科学家能从氨基酸序列精准预测蛋白质三维结构,为理解蛋白质功能、作用机制等提供了基础,加速了生命科学基础研究进程。
在AlphaFold 2结果发布仅几周后,安进科学家就使用该模型解决了以前在湿实验室中无法解决的E3连接酶的合成问题。在两个月内,安进科学家设计了一种新的工具蛋白,用于开发创新疗法。这也表明在AI的助力下,抗体发现时间可缩短50%。
AlphaFold 3:革新模型架构,提升预测准确度。2024年AlphaFold 3推出,不同于AlphaFold 2中输入的氨基酸序列,新的版本输入更为复杂,除了蛋白质的相关标记外,还将DNA和RNA等也进行标记输入,这也使得AlphaFold 3在蛋白质数据资源有限的情况下,将AlphaFold 2的百万级数据级增长至近亿级别。计算方法采用了基于扩散模型的架构,通过“pairformer”模块处理成对表示和单个表示,还引入了“扩散模块”,并采用交叉蒸馏方法提高模型泛化能力。不仅能更精确地预测蛋白质结构,还能联合预测包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物的结构,在蛋白质-配体、蛋白质-核酸、抗体-抗原等相互作用的预测准确性上显著提升,还可以预测大分子基团上的共价修饰。
图11:AlphaFold 3数据架构资料来源:Nature,招商银行研究院
预测精度仍较为粗糙,需要实验验证。蛋白质结构预测精度仍然较为粗糙,可以作为早期筛选的辅助工具,减少目标范围,最终仍需通过实验方法进行蛋白表达与结构表征,进行后续研发步骤。
(四)药物发现与优化:AI技术已经充分应用
AI技术已经充分应用,但仍需专家经验和湿实验验证。相比于靶点发现阶段,AI技术在药物发现和优化阶段应用已经非常广泛,基本上所有AI制药公司都在该领域布局,精进自身算法。但由于AI技术本身的data-driven模式,该过程仍然需要专家经验和湿实验验证优化。
1、虚拟筛选已经成为药物分子设计与筛选的有力补充
虚拟筛选已经成为药物分子设计与筛选的有力补充。小分子药物研发中,AI算法可以基于结构或者配体对大量的化合物数据库进行虚拟筛选,无需实物库,通过模拟化合物与靶点的相互作用,预测化合物是否具有潜在的生物活性,从而快速从海量化合物(1012-1015)中找出可能与特定疾病靶点结合的分子,再辅以实验验证,可大大减少需要实验验证的分子量,显著降低成本、提高效率。
虚拟筛选可能会产生明显的偏向性。不同于实物化合物库的筛选,由于虚拟筛选是基于结构或者配体建库,因此,本身可能具有一定的偏向性,不够全面。因此,如何提升筛选的全面性也是目前的研发方向的方向之一。
此外,AI也可以利用深度学习分析药物的生成规律,根据研发目标和需求,有针对性地设计药物分子结构、对化合物进行优化或重新合成,最终设计出可能与靶点具有良好结合活性的分子结构。
国内企业中,包括英矽智能的Chemistry42、晶泰科技的ID4IdeaTM、维亚生物、泓博医药等都在小分子药物筛选和设计中有很多探索。海外企业中,包括Schrodinger、Excscientia、Recursion等也有自己的特有技术平台。
图12:虚拟筛选流程资料来源:维亚生物官网,招商银行研究院
图13:抗体药物亲和力模拟资料来源:维亚生物官网,招商银行研究院
2、AI技术助力生物药结构设计
AI算法助力抗体、核酸、多肽药物设计。以抗体为例,蛋白质结构预测不仅可以提供靶点情况,还能为靶点抗原与抗体药物的相互作用提供参考,最终可以利用专家经验选择几个蛋白-蛋白复杂模型进行表达与表征,研究蛋白-蛋白相互作用,然后通过分子动力学模拟、残基扫描找出稳定性/亲和力符合要求的突变,最终进行测试。AI技术还可以服务于抗体人源化性质预测等,大大降低传统实验室中抗体设计的成本并缩短研发时间 。
图14:Moderna个性化疫苗开发流程资料来源:Moderna官网,招商银行研究院
图15:个性化疫苗序列研发流程资料来源:Moderna官网,招商银行研究院
AI算法助力个性化疫苗设计研发。Moderna已经将AI技术用于个性化疫苗的研发流程中,通过获取患者的肿瘤和正常组织样本,通过测序和人白细胞抗原(HLA)分型获取患者数据,然后筛选新抗原,最后进行mRNA序列数据计算设计,最终形成包含34种新抗原的个性化疫苗,在通过生产注射回患者体内,整体流程在6周之内完成。
临床开发:大语言模型(LLM)逐步探索
AI技术在临床开发阶段虽然还不成熟,但市场空间大,适合大语言模型探索。临床开发是药物研发的核心环节,研究周期长,花费巨大。而临床开发的高失败率又使其成为新药研发中最困难的一步。虽然近年来,一些研究机构和企业已经开始利用机器学习、自然语言处理(NLP)等方法辅助临床试验设计、患者招募和数据处理等,但仍不成熟,实际应用仍较少。而且相比于靶点和药物发现环节,临床开发阶段有很多文本和辅助需求,适合大语言模型的探索使用。因此在大语言模型算法逐步成熟,临床开发也被认为是未来空间巨大的应用环节。
图16:大语言模型(LLM)在临床试验中的应用前景资料来源:《Large Language Models in Drug Discovery and Development》,招商银行研究院
(一)LLM可多个环节助力临床试验,但仍在技术探索阶段
大语言模型助力ICD编码。ICD编码是临床实践中的一项重要工作,旨在为患者记录分配ICD代码。这通常是一个耗时费力的过程。通过分析大量的电子健康记录数据,大语言模型可以预测最适合电子健康记录的代码,从而帮助临床从业者做出更明智的决策,并简化流程。
精准匹配患者。通过对电子病历、医疗记录等大量数据的分析,AI可以快速筛选出符合临床试验入组条件的患者。特别是LLM的快速兴起,融合文本、图像、基因数据等多模态信息,更全面地了解患者情况,同时利用推理能力来快速匹配,节省人工筛选成本。此外,以Tempus AI为代表的AI医疗企业可以通过自有的肿瘤标志物筛查服务得到患者的专有信息,同时通过患者自趋提供的医疗信息,帮助患者和创新药试验企业得到精准匹配。但由于通用大模型的医学知识的局限性和大模型的AI幻觉,目前仍需医疗专业人员持续监督,以确保可靠性。
临床试验精准规化。规划一项临床试验涉及多项繁重的工作,包括检索历史试验资料、设计试验标准以及选择合适的试验地点。为了加快这一进程,通用大语言模型已被引入该领域。这些模型利用关于试验的历史数据、患者治疗结果以及人口统计趋势,提供有参考价值的建议。包括ChatGPT和DeepSeek等通用模型均可以提供临床试验设计规化。
临床试验结果预测。通过分析试验结果的变量,如疾病信息、药物信息、试验标准和方案等,大语言模型可以提供有见地的预测,帮助试验设计者完善试验计划,从而降低因试验配置欠佳而导致不良结果的风险。
文件撰写。即生成各类临床文件,如出院小结、临床记录和放射学报告,是临床医生耗时费力的工作。LLM凭借其强大的文本生成能力,正越来越多地被用于实现这一过程的自动化,也是应用最充分的方向。
临床试验辅助。LLM可以帮助患者理解试验相关信息、协助临床医生检索和理解相关文献及患者数据,加快患者入组的效率。而在药物警戒方面,通过识别和报告不良事件来支持药物警戒工作,提高数据解读的效率和速度。
目前来看,除文件撰写和临床试验辅助部分,AI技术已经有了一些初步应用,其他临床环节中,AI技术仍在使用探索中。
(二)应用:MNC积极拥抱AI技术
赛诺菲与Yseop合作,实现文件撰写自动化流程。2022年6月16日,赛诺菲选择与Yseop扩大合作,利用其技术自动撰写临床研究报告(CSR),加速临床研究的提交过程。该合作实现了赛诺菲临床试验安全报告撰写流程的部分自动化,有助于将报告撰写时间平均减少40%。
IQVIA与英伟达合作,开发AI智能体,加快研究流程。IQVIA是全球临床CRO和医疗健康咨询服务商,拥有深厚的医疗健康领域专业积累与经验,以及庞大的信息资产,其Connected Intelligence能为AI应用提供丰富的数据和专业知识支持。2025年JP Morgan大会期间,IQVIA宣布与英伟达共同合作,利用英伟达的AI Foundry平台和服务,结合自身的IQVIA Connected Intelligence,构建语言和多模态基础模型,为定制化的IQVIA AI智能体提供支持。预计首批AI解决方案将在2025年推向市场,将有助于临床研发流程加速。
DeepSeek风潮下,国内多家药企接入。开年以来,随着国内DeepSeek的风潮持续,包括恒瑞医药、君实医药、泰格医药等国内头部药企和临床CRO企业接入DeepSeek,助力临床研究过程。
研发进展和市场格局
(一)研发:管线多处于早期阶段,国内企业进展较快
1、管线多处于早期阶段,AI驱动发现的创新药物仍等待数据读出
AI医药研发管线主要仍处于临床前阶段。根据Insight数据库显示,全球目前共有571个使用AI技术研发的药物管线,其中443个仍在积极推进中。其中,90个药物进入临床,80%的药物仍处于临床前的阶段。共有17个药物进入临床II期以后的阶段。
临床进展较快的产品多为老药新用,AI驱动发现的创新药物仍需等待临床验证。目前已经上市的仅有右美托咪定舌下膜剂,该药物是AI技术在老药新用方面的成功案例。进入临床III期的3个药物中,均为老药新用或者AI技术应用于研发的某一步骤。其中,剂泰医药的MTS004是“老药新用”产品,武田和Nimbus的Zasocitinib在早期药物筛选和优化环节使用了AI计算策略,而博瑞的BGM0504则通过分子动力学模拟发现了最佳多肽序列。
全球首款进入临床的完全由AI技术驱动发现的新药DSP-1181临床I期效果不及预期,目前该类产品中临床进展最快药物已进入临床II期,仍在等待最新临床结果读出。如果该产品的临床数据较为出色,也就更好的验证了AI技术驱动创新药靶点发现,助力创新研发的底层逻辑,有望带动行业的持续快速投资和发展。
图17:全球AI研发管线情况(积极)
资料来源:Insight数据库,招商银行研究院
备注:截至2025年2月14日
资料来源:Insight数据库,招商银行研究院 备注:截至2025年2月14日;选择仍在积极推进的管线
2、国内企业积极布局AI制药行业,研发进度较快
国内企业积极布局,研发进度靠前。全球来看,利用AI技术研发的药物进入临床最多的是英矽智能,已经有10个管线处于临床试验中,其次是英伟达投资的Recursion,共有6个管线处于临床试验中。全球共有14个药企的AI管线中有两个以上正在临床中积极推进,其中5家都是中国的AI biotech企业,考虑到临床前管线的情况,国内biotech也是在该赛道中技术布局较早,临床推进较快的。
3、小规模数据显示,AIDD确实可以提升临床成功率
AI驱动创新药物研发可以提升临床成功率。虽然目前AI技术用于创新药物进入临床的仍是少数,但小规模的研究数据显示AI技术用于药物早期研发中缺失可以提升临床成功率。根据波士顿咨询对AI biotech企业管线的研究,截至2023年12月,已有24个AI发现的分子完成了I期试验,成功率为80~90%,远远超出40%~65%的行业历史平均水平。已有10个AI发现的分子完成了Ⅱ期试验,其中成功的有四个,成功率为40%,与30%~40%的行业历史水平一致。从使用AI技术的类型看,I期临床中,失败的分子主要集中在AI技术用于靶点挖掘和分子优化方面。
图19:AIDD提升临床研究成功率资料来源:Drug Discovery Today,招商银行研究院
(二)MNC积极涌入,AI驱动的药物研发逐步成为重点
根据Insight数据,2021年开始跨国药企(MNC)就开始积极投入AI技术平台/管线,2022-2024年交易持续在高位。2021-2024年的4年中,MNC药企与AI赋能生物技术公司在管线合作和平台使用中共进行了69笔交易,披露的首付款达59.84亿元,总交易价值达311.13亿元。
此外,全球TOP10药企也在与AI/科技公司合作。
罗氏、阿斯利康、安进等都与英伟达的BioNeMo(端到端云服务平台)合作,以加速药物开发
诺华通过和微软及亚马逊的AWS合作,提高公司数字化能力
渤健与谷歌结盟,探索在神经退行性疾病中监测认知能力下降的方法
罗氏推出“数字化日”,向投资者展示其在医药产业中对AI的应用。
礼来和OpenAI达成合作,开发新型抗菌药物
图20:MNC关于AI技术平台/管线交易资料来源:Insight数据库,招商银行研究院
随着AI技术的火热,MNC对于AI技术的重视逐步提升,未来AI驱动药物研发也会逐步成为重点领域,占比继续提升。
(三)商业模式与市场格局
AI技术中,算法、算力和数据三者需要互相配合,缺一不可。而医药行业由于本身的实验属性,在AI平台计算(干实验)后,仍需传统实验操作(湿实验)进行互相验证。
1、商业模式:起于AI+SaaS,AI+Biotech市场空间更大
AI制药行业中主要的商业模式包括AI+SaaS、AI+CRO和AI+Biotech。
AI+SaaS:为客户提供AI辅助药物开发软件服务,帮助企业加速研发流程,节省成本与时间。
AI+CRO:通过人工智能的辅助为客户提供CRO服务,再由药企进行后续开发或合作推进管线。
AI+Biotech:利用自身AI平台和技术挖掘创新药物,推动药物上市或者license out给大型药企共同推进管线。
Schrodinger成长史代表了AI制药商业模式的转变。Schrodinger作为成立时间最早的AI药物研发企业之一,2020年作为首家AI制药企业在纳斯达克上市,他的发展历程也说明了AI制药的商业模式的变迁。Schrodinger起于AI+SaaS,早期以售卖AI制药应用软件为主.但由于软件服务的市场空间较小,2010年公司开始从事AI辅助药物发现业务,增加AI+CRO。2018年开始,公司开始独立研发自有管线,进入AI+Biotech业务中。因此,可以看出,在这三类商业模式中,AI+SaaS和AI+CRO的确定性更强,但AI+biotech未来市场空间更大。实际案例中,很多AI制药企业既提供AI+SaaS服务,也涉足其他两种模式。
图21:Schrodinger发展历程资料来源:Schrodinger公司官网,招商银行研究院
AI制药行业主体参与者,包括AI制药初创公司、大型药企/CRO和科技/IT企业。
图22:AI制药行业中的核心参与者
资料来源:招商银行研究院
2、初创企业:AI制药领域的主要玩家
AI领域的主要玩家,数量众多,美国企业占比最高。根据Deep pharma intelligence数据,截至2023年Q1,全球共有800家AI制药初创公司,这类企业也是AI制药领域的最初和主要玩家们。从地域上来看,800家AI制药企业中,53.31%的企业都集中在美国,27.09%企业位于欧洲(包括英国),中国企业占比仅为3.62%
这类公司主要在AI医药领域深耕,高管团队多为复合型团队。其中既有对医药行业算法精通的高管,也有药物化学家,可以通过专家经验不断精进算法,形成专家级垂域专业模型。
AI+SaaS模型切入,最终形态与biotech类似。如上文所说,AI初创公司多在初始阶段通过AI+SaaS模型切入,通过软件/技术合作方式与药企或者CRO服务,利用其丰富的数据不断提升模型能力。但由于AI+SaaS天花板较低,后续大部分企业都开始探索AI+Biotech模式,研发自身管线,通过管线的授权模式收费,类似于Biotech企业。部分企业也会慢慢进入AI+CRO模式,但相比于传统CRO而言,湿实验配置较少仍会产生困扰。竞争力相比配有AI平台的传统CRO企业相对较低。
3、大型药企/CRO:核心受益者,AI技术逐步成为有效工具为药企提质增效
大型药企是使用方和实际受益方。大型药企主要通过自建团队、投资并引入技术平台等方式进入AI制药赛道。无论是早期药物发现还是临床推进过程中,AI技术都将为大型药企研发提质增效,也使得大型药企成为AI制造产业链中的下游使用方和实际受益方。
相较其他参与者而言,理论上大型药企在具体研发领域中数据丰富、专家经验丰富,可以通过与AI软件商的合作建立垂域专业模型,实际在运营中提升效率。但由于大型企业各部门之间竖井较深,数据并不容易互通。因此,大概率大型药企仍是AI制药技术的最终使用方。
早期研发方面,海外药企并购为主,国内药企自建平台。药物早期发现中,海外大型药企虽然也会在内部部署AI研发平台进行早期研究,但更多仍以并购管线为主。国内的大型药企,主要模式都是通过和AI制药服务商进行软件/技术战略合作,在内部自建AI研发平台推进新药研发。譬如,石药集团通过AI驱动的小分子药物设计平台获得的SYH2039在2024年12月以1.5亿美元首付款的价格将全球权益授权给百济神州,也验证了其AI平台的能力。
高质量及丰富数据助力CRO企业成为AI技术浪潮中的核心受益方。CRO企业作为新药研发的服务商,对市场趋势变化极为敏感。无论是从加快交付成果还是减少人工支出的角度出发,AI在药物研发领域的应用都对CRO企业吸引力巨大。因此,多个龙头企业均早早通过自建、合作或者投资方式丰富自身的AI+CRO服务平台。
在干湿实验结合的需求下,AI可以提升效率,但无法取代CRO服务。而在早期研发的服务中,AI平台的加入可以给下游客户提供更多选择,增加差异化、提升客户粘性。目前来看,高质量和丰富的数据集仍是AI制药行业的核心制约因素。头部CRO企业通过长期服务,积攒了各环节中丰富且高质量的数据和经验(既有成功的,也有失败的),在这些高质量数据下,可以持续输入AI模型,提升模型的准确性。
而在临床开发阶段,匿名化的丰富数据也可以用来与IT/科技企业合作,训练垂域模型,提升服务效率。
4、IT/科技企业:适合从临床垂域大模型开发角度切入
IT/科技企业算法能力强,但行业专业度仍较为缺乏。这类企业算法能力较为出众,但由于新药研发的专业度高,尤其是靶点和药物开发环节中需要专业的药物化学家、结构生物学家等专家型人才和专有高质量数据,而这些是IT/科技公司最为缺乏的,因此最终的模型在实际使用中仍差强人意。虽然目前为止,IBM、腾讯、百度、字节跳动等IT/科技企业均进入AI制药领域,但短期合作案例并不多,市场反响平平。其次,IBM Watson实验室在AI医疗领域并不成功的探索也证明了专业度缺失对于IT/科技企业在该领域仍有较大短板。
临床垂域大模型开发更适合IT/科技企业进入。相较于早期研发中环节多样,对于专家需求更高,且每一步都需要湿实验验证。临床开发环节中一些文件撰写、临床试验辅助等环节已经可以逐步使用AI agent进行处理。整体来看,大语言模型在临床开发环节未来可能会有巨大的发展空间,而IT/科技企业在这方面的技术储备丰富,迭代快。虽然也面临专业度和高质量数据缺乏的问题,但可以通过与临床CRO/药企和医院合作进行推进,从而建立临床领域的垂域大模型。
上游受益最为确定。IT/科技企业进入AI制药市场,除了业务扩展外,很多是由于企业本身提供GPU或者云服务,通过下游合作,提升自身业绩增长。譬如,英伟达将AI模型和算法加入端到端平台,主要是通过扩展下游应用,提升GPU的需求能力,确定性最强。据英伟达预测,未来医疗行业将有1000亿美元的算力需求。
业务建议与风险提示
(一)业务建议:AI制药行业趋势逐步开启,需要持续关注
(本段有删节,招商银行各部请登录“招银智库”中搜索完整行内版报告)
(二)风险提示
技术落地不及预期。虽然AI制药在医疗领域需求较强,市场愿景较高,但应用仍属于相对早期拓展。AI技术在虚拟筛选、药物合成等方面仍有较大偏向性,或者路线设计难以实现等问题,实际应用落地可能不及预期。
AI幻觉造成的模型效果不及预期。临床试验环节,LLM被寄予厚望。但本身模型AI幻觉问题仍然较为严重,而药物研发对准确性要求较高。在临床设计、患者精准匹配中如果由于幻觉影响导致实际效果较差,仍会影响AI使用。
高质量数据不足。高质量的模型需要依靠高质量的数据,目前公开数据较为繁杂,论文质量不一,动物模型数据缺乏等都可能导致算法准确度受到影响,从而影响落地应用。
临床开发不及预期。创新药研发虽然在AI助力下可以提升效率,节省成本。但整体药物研发仍需湿实验及较长的临床周期验证,产品进展会有一定的不确定性。
商业化及定价风险。AI制药在整个医药制造产业中占比仍较小,因此技术推出后是否能匹配市场需求仍存在不确定性。而对于AI软件企业来说,收费模式和盈利方式仍需要不断探索。
数据安全问题。在人工智能快速发展的背景下,数据成为重要的生产要素。AI在医药健康领域快速应用的同时,存在因数据不合理使用或者泄露导致的安全性风险和监管风险。