NIFDC | 人工智能在药品检验中的应用与思考

来源:细胞质量检测技术研发平台

建设单位:深圳科诺医学检验实验室

时间:2026-02-27

来源《中国药事》 2026年1月 第40卷第1期


作者安抚东,仲宣惟,付志浩,耿兴超,许明哲,孙磊中国食品药品检定研究院


摘要


目的随着人工智能(AI)的高速发展,其强大的数据处理、分析识别与内容生成能力正引发药品检验范式变革。通过对AI赋能药品检验情况进行梳理,以期为践行国家“人工智能+”行动、推动药品检验现代化和助力医药产业高质量发展提供启示与参考。


方法:采用文献综述与综合分析的研究方法,系统阐述AI在药品检验中的应用现状,分析其面临的挑战,并探讨未来发展路径。


结果AI在药品智能检验与数据分析、数字标准与数字标准物质3个方面均有广泛应用,它也是构建智慧实验室的关键驱动力与技术基础。然而,其深度应用仍面临数据、算法、人才、法规和标准等的挑战。基于上述分析,提出了AI应用于“智慧药检”的具体建议。


结论AI正在革新药品检验范式并推动其现代化进程,未来需落实“十五五”规划与“人工智能+”行动,对标“智慧药检”蓝图构建全链条支撑体系,通过夯实数据基础、深耕算法模型、布局智能体技术、推进智慧实验室建设,加速科研成果向应用场景转化,为保障药品高水平安全与实现医药产业高质量发展赋能。


关键词


人工智能+;药品检验;智慧药检;大语言模型;具身智能


1

引言


人工智能(Artificial Intelligence,AI)作为引领新一轮科技革命的关键技术,已从传统的基于规则和算法的判别式AI,演进至以大语言模型(Large Language Model,LLM)和具备理解物理规律、预测空间动态的世界模型(World Model,WM)为代表的生成式AI,并在内容生成、推理预测以及与现实世界交互方面展现出卓越能力。随着这一演进,AI正逐步渗透至科研、生产与生活各领域。当前,全球政府及监管机构正积极构建AI应用支持政策框架。例如2025年联合国发布了“2025年技术和创新报告:包容性AI促进发展”,呼吁各国加强基础设施、数据和技能建设,并制定包容性政策,确保AI惠及全人类。我国发布了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》(简称国家“十五五”规划)和《国务院关于深入实施“人工智能+”行动的意见》,将深入推进数字中国建设与全面实施“人工智能+”行动作为国家战略。欧盟也发布了“应用AI战略”和“科学AI战略”,旨在推动公共部门与关键行业使用AI,并确保欧洲处于AI科学研究的前沿。


随着科技的发展,传统药品检验模式已较难满足现代医药产业对检测高效率、高精度、高通量和高智能的需求,局限性主要体现在5个方面:一是部分项目依赖主观经验判断,例如中药鉴定中感官评价缺乏统一客观的量化标准;二是复杂多源数据处理能力不足,难以深度挖掘光谱、色谱等技术产生的海量高维数据价值;三是检测分析自动化水平偏低,无法高效适配大批量样本检测、海量数据处理以及全流程可追溯的要求;四是数字化、智能化水平有限,数据与知识孤岛制约信息的有效利用;五是专业人才培养周期长,难以适应行业技术快速迭代的发展形势。


AI技术的广泛应用为药品监管和药品检验带来转型升级的新契机。美国FDA部署了AI工具Elsa;还提出基于“模型影响力”与“决策后果”的二维风险评估矩阵和7步骤框架,来评估AI模型用于药品和生物制品全生命周期监管决策的可信度。国家药品监督管理局在印发的《药品监管人工智能典型场景应用清单》中梳理了包括辅助抽检工作和数据分析与预测等15个典型场景。中国食品药品检定研究院制定了“智慧药检”行动计划,推动以信息化引领药品检验现代化。


当前,AI在药品检验中的应用研究多聚焦于特定技术或单一应用场景,缺少系统性。本文通过分析相关文献,梳理AI的应用现状,探讨智慧实验室的未来发展,分析其在药品检验方面的挑战和需求,并从数据生态、算法模型、人才培养等维度提出建议,以期为推进“人工智能+药品检验”提供参考与指导。


2

AI在药品检验中的应用与探索


近年来,AI在药品检验领域的应用成效显著,针对传统检验模式在经验依赖、数据处理、检测效率、信息互联及人才培养等方面存在的挑战,AI正从多层面提供系统性解决方案,助力构建药品检验新范式,包括AI在智能检测与数据分析、数字标准、数字标准物质方面的应用,探索智慧实验室的发展方向,见图1。


2.1 智能检测与数据分析


AI算法正与光谱、色谱、质谱等高端分析仪器深度融合,在自动化数据解析等方面取得一定进展。针对药品检验中最为核心的光谱与色谱质谱两大类数据来源,AI算法分别发展出特定的适配模型。


图片


在提升单一分析技术数据解析能力的同时,AI技术正进一步向实验室整体质控流程的智能化延伸。其中,生成式AI(GenAI)以LLM为代表,能够基于前述检测数据自动撰写标准化分析报告,并辅助解析各国法规文本,尽管需注意防范“模型幻觉”风险,但是初步应用显示出其在提高合规工作效率方面的潜力。多模态AI则打破了单一技术的数据壁垒,通过整合检测数据(成分)与批次记录(工艺),实现了对药品质量的综合研判。


2.1.1 光谱技术


AI在复杂谱图数据处理中展现出高效解析优势,不同类型的算法模型赋予光谱技术更强的定性与定量能力:


1)监督学习的应用:支持向量机(SVM)通过在高维空间寻找最优超平面,擅长处理光谱指纹图谱,被越来越多地用于药品真伪鉴别与产地溯源的研究中。人工神经网络(ANN),特别是反向传播神经网络(BPNN),因具备学习复杂非线性关系的能力,常与光谱等技术结合,用于评价药品等级或预测成分含量。


2)深度学习的应用:相关研究探讨了将近红外光谱(NIR)与长短期记忆网络(LSTM)等深度学习模型相结合,在当归等中药材真伪鉴别及掺假程度评价方面具有应用潜力,并尝试用于预测铁皮石斛等药材的物质含量。此外,有研究指出生成对抗网络(GAN)有望通过生成合成数据(例如稀缺药材的光谱数据)扩充训练集,在一定程度上缓解光谱分析中样本稀缺的问题。


2.1.2 色谱与质谱技术


面对液相/气相色谱-质谱联用(LC/GC-MS)技术产生的海量复杂数据,AI算法特别是机器学习(ML)提供了从成分鉴别、性质预测到批次分析的技术手段:


1)小分子化合物鉴定与结构预测:针对缺乏标准物质的难题,AI应用聚焦3个方向:一是通过图神经网络(例如MPNN)和三维构象(例如3DMolMS)预测串联质谱及保留时间,大规模扩展参考数据库;二是借助自监督学习(例如CLERMS)优化光谱匹配算法;三是直接从串联质谱图中通过“自上而下”(SIRIUS)或“自下而上”(BUDDY)策略推断化学结构。


2)理化性质与活性预测:在明确化学结构的基础上,监督学习模型进一步被用于性质预测。随机森林(RF)常用于预测化合物溶解度等关键质量属性或抗生素耐药性(AMR)。更重要的是,基于SVM和RF等算法的定量构效关系(Quantitative Structure-Activity Relationship,QSAR)模型,能够基于分子结构数据预测化合物的功效、毒性及优化合成条件。需要注意的是,QSAR模型需符合OECD验证标准及ICH M7法规要求方可投入合规应用。


3)批次一致性与异常检测:无监督学习算法例如主成分分析(PCA)和K-均值聚类(K-Means Clustering)被广泛用于色谱数据的趋势分析。通过对大量批次色谱数据进行聚类或降维可视化,这些算法能辅助识别出与正常批次行为模式存在显著差异的异常批次,在无需标准品的情况下帮助发现隐藏的质量波动。


为了更直观地展示不同技术路径的特点,表1总结了支持向量机、神经网络等各类AI算法在药品智能检测与数据分析中的具体应用。


图片


2.2 数字标准


药品标准是药品检验必须遵循的法定技术规范。在全球数字化转型的浪潮下,标准化工作正经历深刻变革。国际标准化组织(ISO)、国际电工委员会(IEC)等国际组织已将标准数字化提升至战略高度,旨在推动标准由传统的静态文本向机器可读、可执行的动态知识形态演进。AI技术不仅重塑了标准的制定与应用方式,也推动了各国对标准体系的现代化改造。


在此背景下,国内外药品监管机构均在积极推进药品标准(药典)的电子化和数字化转型。最初级的方式是离线的各国药典电子版。此后出现了整合性状、显微照片和薄层、液相图谱的多维信息数字化版本,例如我国发布的《数字化中药材标准》和《各国药用辅料标准对比手册》(数字版)等。2023年11月,《中华人民共和国药典》(2020年版)官方电子版(网络版)正式上线,标志着中国药典进入移动互联网时代。这一电子版药典包含四部药典全部内容,具备目录导航、阅读热度排名、关键词检索等功能。


下一步,以LLM为核心的生成式AI,正借助检索增强生成(Retrieval-Augmented Generation,RAG)等技术搭建智能标准知识体系。该体系不仅能够深度解读并执行药典、标准操作规程(Standard Operating Procedure,SOP),还能把结构复杂的监管文档变化为可互动、可查询的知识库,旨在将仅能静态阅读的标准文本升级为可动态运行的智能知识系统。在LLM等技术支撑下,这套系统不仅能精准理解标准内容,还能实现智能问答、逻辑推理与合规性辅助检查,最终推动标准从“仅供人阅读”的传统形态,转变为“机器可理解、可执行”的智能应用形态,大幅提升标准在实际应用中的效率与准确性。


2.3 数字标准物质


数字标准物质(Digital Reference Standard,DRS)是实体标准物质的数字化、数据化及智能化形态,它通过计算模拟和数据模型创建“原位”(in silico)标准物质,无需物理实体,即可生成可计算的数字化参考标准,从而作为实体标准物质的补充,以减少对难提纯、不稳定或高毒性类实体标准物质的依赖。其具体实现方式主要包括三类:


①替代标准物质法:作为数字化初级阶段的核心技术,通过少量实体标准物质(化学单体或对照提取物)实现多个待测成分的定性(主要采用相对保留时间法或对照提取物法)与定量(主要采用相对校正因子法或对照提取物量值传递法)分析,例如“一测多评法”和“对照提取物法”已被纳入药典并得到广泛应用。


②多维特征数据库:通过整合色谱、光谱、质谱等多维数据,结合软件算法的综合系统。已有初步探索研究通过搭建包含仪器型号、色谱柱参数等多维信息的数据库,结合双标线性校正法和光电二极管阵列(Photodiode Array,PDA)光谱相似度算法,使DRS工作站能够实现对中药材和中成药等复杂体系中色谱峰的准确定性。


③AI模型预测法:借助AI模型直接预测化合物的关键理化参数,例如基于QSAR模型可精准预测未知杂质的毒性与仪器响应因子,在缺乏实体标准物质时完成风险评估;更可预测化合物在色谱、质谱中的行为(例如保留时间、裂解规律),检验人员通过比对这些“电子参数”即可实现未知物的快速鉴定。


2.4 智慧实验室的探索与落地


针对传统检测流程中信息化水平不足、操作效率偏低等痛点,以构建自驱动实验室(Self Driving Laboratory)为终极目标的智慧实验室建设,正在重塑药品检验的管理与执行模式。它通过深度整合AI、具身智能(Embodied Intelligence)、物联网(Internet of Things,IoT)及信息管理系统,打造覆盖样品全生命周期的自动化、智能化、合规化的高效生态系统。实现了从样品流转、前处理、数据采集、智能分析到报告生成的全链条自动化模式,让数据在物理世界与数字空间高效流转,见图2。


图片


2.4.1 自动化样品接收与任务分配


智慧实验室利用条形码或射频识别(RFID)技术,实现样品的自动接收与信息登记。实验室信息管理系统(Laboratory Information Management System,LIMS)依据预设规则,自动解析样品基本信息、精准指派检验任务、匹配适宜的分析方法与仪器,并调度机器人完成样品在各工位间的流转。该模式可取代繁琐的人工录入与任务分配流程,从源头避免信息转录错误,同时实现检测资源的动态优化调度,提升实验室整体运转效率。


2.4.2 标准化与自动化样品前处理


样品前处理作为传统检验中耗时最长、易引入人为误差的环节,正朝着标准化与自动化方向加速发展。以“化学智能体”为代表的具身智能机器人从2个维度推动这一变革:一是在化学合成领域,通过模块自动化设计保障化学过程的高度重现性;二是在分析测试领域,采用自动化液体处理工作站、机器人臂以及集成智能算法的自动进样器,可以精准执行称量、溶解、稀释、固相萃取、离心、氮吹、过膜乃至仪器进样等一系列复杂操作,尤其适配样品的批量检测需求。其操作的重复性与准确性远超人工,显著提升检验结果的可靠性


2.4.3 实时化与完整性数据采集


智慧实验室通过物联网技术,将所有分析仪器与LIMS系统、电子实验记录本(Electronic Laboratory Notebook,ELN)实现无缝对接。实验启动指令、仪器运行状态、原始检测数据流、色谱/光谱图谱等关键信息,均被系统实时、自动捕获和记录,并附带完整的元数据(例如操作人、时间戳、仪器ID、环境温湿度参数)。该模式从技术层面确保数据的原始性、真实性、完整性及可溯性,有效降低数据丢失或选择性记录的风险。


2.4.4 智能化数据分析与报告生成


AI算法作为智慧实验室的核心智力,在数据处理阶段能够自动完成色谱峰智能积分、杂质谱图比对、成分含量计算等任务,并根据药典标准或实验室内部标准自动进行合规性判定。当检测数据出现超标或趋势异常时,系统即时触发预警,并辅助检验人员开展实验室调查与原因追溯。最终,系统可自动整合所有检测数据、元数据及判定结果,一键生成结构化、合规的检验报告,极大缩短报告出具周期,同时提升报告的准确性与规范性。


2.4.5 创新替代方法验证中心


安全性评价是药品非临床研究的核心环节,与检验检测共同保障药品全生命周期的质量安全。目前,尚有较多安全性评价研究使用实验动物,但是随着“3R”理念逐渐深入人心和动物替代技术的高速发展,全球范围都在呼吁和拥抱新替代方法(New Approach Methodologies,NAMs)


美国FDA药品审评与研究中心于2025年发布《替代和减少动物试验》及实施清单;欧盟委员会也于同年发布“欧洲化学工业行动计划”,并要求自2026年起逐渐在化学品安全性评价中淘汰动物试验,强制采用新替代方法。


新替代方法包括以器官芯片、类器官和3D细胞模型为代表的硬件技术,以及毒理学数据库和AI技术为代表的软件平台。通过建立创新替代方法验证中心可有效评估与规范化发展上述技术。未来或将发展出更为复杂的多器官芯片和类器官,更多的垂直或综合性药物毒理学数据库,可解释性更高、整合多模态数据的AI模型与算法。创新替代方法验证中心有望为药品(包括医疗器械和化妆品)非临床研究提供更高效精准的毒性评估工具,推动药品研发与监管迈向更加国际化和智能化新阶段。


3

局限与挑战


尽管AI在药品检验领域展现出巨大的应用潜力,但是在深度融合与规模化落地方面仍面临挑战。一是基础资源瓶颈,突出表现为数据供给与复合型人才的短缺;二是核心技术障碍,集中于模型算法局限与智慧实验室建设的难题;三是生态与治理滞后,具体体现为应用转化壁垒、监管法规不完善及数据安全伦理风险


3.1 数据供给不足、质量不高


药品检验领域普遍存在“数据孤岛”现象突出、高质量专业数据集稀缺、数据质量参差不齐及多模态数据融合困难等挑战。这些问题导致模型预测失准,直接影响其泛化能力与最终应用的可靠性。


3.2 模型算法局限


AI模型与算法自身的缺陷不容忽视:一是深度学习等先进模型的“黑箱”特性导致决策过程可解释性不足,难以获得监管机构的信任与认可;二是模型泛化能力不足,在单一场景下表现优异的模型,面对样品批次变更、仪器设备更新等情况时,性能易出现显著衰减;三是AI系统的动态学习特性对传统计算机化系统验证方法提出了根本性挑战,增加了合规验证的难度。


3.3 实验室智慧水平偏低


智慧实验室仍处于初级阶段,尤其在样品前处理等关键环节,自动化、智能化程度依然不高。要实现从“自动化操作”到“自主化决策”的跨越式发展,不仅需要云端AI的数据分析能力,更需大力发展与物理世界精准交互的机器人系统——“具身智能”,这方面技术短板,已成为制约智慧实验室迈向更高阶段的关键瓶颈。


3.4 应用转化与落地困难


AI在药品检验领域面临“从论文到产品”的转化困境与实施成本高昂的双重壁垒。大量研究成果停留在实验室验证阶段,与产业实际需求脱节。同时,企业和监管机构在算力设施搭建、数据体系建设和复合型人才引进方面需投入巨额成本,形成了较高的行业准入门槛,对中小型企业的制约尤为显著。


3.5 复合型人才短缺


当前,既精通药品检验专业知识,又熟悉AI的复合型人才供给严重紧缺。该问题直接导致技术研发与产业实践脱节。具体表现:算法模型因缺乏药学知识引导而偏离实际质量属性,造成预测结果可信度低;同时,传统质控流程因缺少技术理解而难以优化,阻碍智能化解决方案的落地与迭代。


3.6 法规与标准待完善


AI的创新应用带来新的监管挑战。当前,全球药品监管机构虽已开始关注AI在检验领域的应用,但是针对AI驱动药品检验的法规政策、技术指导原则及评估标准尚未健全,导致其在产业界的合规应用与规模化推广缺乏清晰指引。此外,人机协同模式下的角色定位、风险评估程序和配套管理制度等,也需进一步明确与完善。


3.7 数据安全与伦理风险


数据安全与AI伦理是AI在药品检验领域应用必须直面的挑战:一方面,药品检验数据涉及大量商业秘密、技术秘密和监管工作秘密等敏感信息,其存储、传输和处理过程存在泄露或被恶意利用的风险;另一方面,训练数据若存在偏见,可能导致AI模型在质量评估中产生不公平或不准确的结果,引发伦理争议。


4

对策与展望


为系统应对上述挑战,推进AI在药品检验领域健康可持续发展,需从数据生态、算法模型、智慧基建、协同生态、人才培养、监管标准、安全伦理等维度综合施策。


4.1 构建高质量数据生态


针对数据供给与质量瓶颈,可由国家药品检验机构牵头,推动建设专业化、高质量的药品检验数据标准以及多模态且互联互通的药品数据库。严格遵循可发现、可访问、可互操作和可重用(Findable,Accessible,Interoperable,Reusable,FAIR)原则,建立覆盖药品全生命周期的标准化数据采集与共享机制,实现“数据慧治”。例如,中药数字化标本馆、中药组分多维色谱和质谱数据库、外源性污染物检测数据库、化学药品基因毒性杂质谱数据库、病原微生物资源库、生物医学实验细胞资源库、药物毒理学数据库和标准物质数据库等;再如,整合历年检验中的样品、图谱、结果等全链条数据,建设检验检测大数据风险分析及处置平台。


4.2 提升模型可解释性与可靠性


针对算法模型固有局限,需加大可解释性AI(Explainable,XAI)研发力度,重点攻关鲁棒性强、泛化能力优的模型算法,增强AI决策的可信度与可追溯性。同时,需将物理化学机制、药典标准、ICH指导原则等先验知识嵌入模型架构,保证其输出符合科学规律。建立覆盖模型全生命周期的验证与监控体系,通过对抗测试、性能漂移检测等手段保障其长期稳健性,从而为监管决策提供透明、可信的技术支撑。


4.3 加速实验室智慧升级


智慧实验室是实现智能检测的核心载体,其升级关键在于突破以“具身智能”为代表的核心技术瓶颈,打破物理实体与数字信息的界限。应加速推进“具身智能”与数字孪生技术的深度融合,开发依托世界模型的可与现实世界精准交互的自动化样品、试剂耗材和标准物质管理、智能前处理机器人和自动化检测分析机器人等。同时大力加强数字标准和数字标准物质的研发,为智能化质量评价提供核心基准,筑牢智慧检验的基础。


4.4 构建智慧协同应用生态


为克服应用转化困难与实施成本高昂的双重挑战,核心在于构建开放共享的协同创新生态。推动构建以国家级药检机构为龙头,联动省级药检机构、重点高校、科研院所、产业协会和信息化企业的协同平台。通过强化产、学、研、用深度融合,打通数据壁垒与技术鸿沟,将前沿AI研究成果与产业实际需求精准对接,联合开发适应业务发展的实用型解决方案,加速AI技术在全行业的普及与落地。鉴于药企数据具有高度保密性,传统的集中式数据共享模式实施难度较大,因此“联邦学习架构”是实现行业协作的关键技术。该机制允许各级药检机构及企业在本地服务器上利用自有数据训练模型,仅交互加密的模型梯度参数而非原始数据;这种分布式协作训练模式既能严格保护商业秘密,又能联合多方数据共同提升通用缺陷识别模型的泛化能力。此外,还要鼓励信息化企业、仪器生产企业积极参与,加大人力和资源投入,提供专业的算法、算力和算据支持,加快药品检验领域的智慧生态落地应用。


4.5 加强复合型人才培养


为破解复合型人才短缺难题,需创新人才培养模式,一方面鼓励高校开设“AI+药学”“AI+检验检测”等交叉学科或课程,培养兼具专业背景与AI技术能力的复合型人才;另一方面需重点培养检验人员掌握化学计量学、量子化学计算、算法验证等交叉技能,使其具备评估AI模型适用性及解释模型输出逻辑的综合能力。此举旨在确保AI模型的设计、验证与应用能精准契合药品全生命周期质量管理的严谨需求,最终为智能化质控体系的可靠运行与持续创新提供智力支撑。


4.6 健全法规与标准


健全法规与标准是引导AI在药品检验领域规范发展的制度保障。当前亟需填补针对AI模型作为检验和质量评价工具的合法性空白,制定覆盖数据质量、算法验证、系统部署的全链条技术指南与标准。应建立基于风险的分级监管框架,对高风险应用实施强制性认证与周期性算法审计。同时,明确AI辅助决策的法律责任主体与追溯机制,并探索“监管沙盒”等创新机制以平衡安全与创新。还要借鉴检验检测机构资质认定(CMA)和中国合格评定国家认可委员会(CNAS)认可等实验室质量管理体系要求,做好相关评估标准适用性研究。完善的法规体系将显著提升技术应用的可信度与行业共识,保障AI赋能药品检验规范发展。


4.7 强化网络安全伦理规范


为确保技术应用的公正性与安全性,必须建立覆盖全生命周期的网络安全要求、伦理规范与审计体系。技术层面采用联邦学习、差分隐私等隐私计算技术,从源头保障数据存储、传输与处理的安全性;管理层面设立跨学科伦理审查委员会,对AI在药品检验中的应用场景、模型算法进行全面评估,确保技术发展符合社会核心价值观与行业伦理要求。


5

结论


目前,AI在药品检验领域已广泛应用并显著推动了技术进步与行业发展。本文在系统梳理上述应用进展的基础上,剖析面临的关键挑战,并提出可行的建议和行动路径。一是落实国家“十五五”规划,全面实施“人工智能+”行动,推动AI与药品检验的深度融合;二是可参照中国食品药品检定研究院“智慧药检行动计划”蓝图,构建“检验-监管-产业”全链条支撑体系;三是不断提升数据质量,深入研究算法模型,提前布局智能体技术;四是加速推进智慧实验室建设,通过技术的应用和迭代,推动业务流程再造,实现从“论文潜力”到“场景能力”的转化。AI正在也必将全面革新药品检验的研究与应用范式,并通过推动药品检验的现代化进程,为保障药品高水平安全与实现医药产业高质量发展持续注入强大动力。


参考文献


《中国药事》 2026年1月 第40卷第1期