AI驱动医药变革:成熟度分级与创新应用

内容来自演讲:王彬|连云港木杉医药科技有限公司|总经理

声明:以下内容由AI生成,请注意甄别

 

摘要

本次讨论围绕人工智能(AI)成熟度分级展开,解析其在控制设计与自动化维度的六阶段划分,结合医药行业合规性、数据质量等实际场景,探讨 AI 应用策略与挑战。通过企业应用案例与失败经验,强调数据真实性、投入产出比的关键作用,最后以开放式提问引导延伸思考。

 

章节速览

AI 成熟度分级与当前发展趋势探讨

本次讨论聚焦 AI 成熟度分级及行业快速发展,分析大模型迭代对用户场景与业务模型的影响,引入 ISPE 工业智能成熟度分级框架,展望 AI 在质量管理、药物研发等领域的创新应用。

 

AI 成熟度分类及其在控制设计中的应用

AI 成熟度从控制设计(Control Design)与自动化(Automation)双维度评估。控制设计维度分为五阶段:从结果仅供参考到系统自主设定执行空间,逐步降低人类参与度;以供应链采购计划为例,展示 AI 从建议提供到自主决策的演进。

 

AI 技术在医药行业的六个发展阶段及验证分级

医药行业 AI 应用分为 Stage 0 至 Stage 5 六阶段,从固定算法到自主学习优化,伴随人类参与度递减与系统自主性递增。讨论 AI 验证分级在计算机化系统验证中的必要性,适配技术进化需求。

 

通过明道云实现 AI 协作的实践与思考

以明道云HAP平台为例,阐述 AI 在软件开发中的协作应用,涉及分类、学习级别设计,以及应用时需考量的成本、数据安全、降本增效目标,结合医药行业合规限制提出实践建议。

 

AI 在企业应用中的分类及失败案例分析

区分商用 AI 与个人 AI,强调企业应聚焦商用场景以实现降本增效。通过审计助手未能有效抓取法规、化学合成路线助手数据失真等案例,剖析 AI 应用中的投入产出比与数据真实性问题。

 

化学合成路线助手开发的挑战与失败案例

分享化学合成路线助手开发经验,揭示数据来源真实性差、模型引用过时工艺等问题,指出推理型模型虽改善部分缺陷,但行业真实数据获取仍是核心瓶颈。文末邀请通过二维码交流,提供医药行业 AI 资料。

 

要点回顾

当前 AI 热潮对行业的影响

大模型技术快速迭代(月级更新)推动用户场景扩展(如 SOP 起草、文件核对),倒逼业务模型变革,需动态评估技术前沿性。

 

成熟度分类的概念与阶段

ISPE 框架从控制设计(五阶段)与自动化(六阶段)评估 AI 成熟度。控制设计涵盖结果参考、批准使用、微调优化、自动运行至自主设定置信区间;自动化从无机器学习(Stage 0)到自主学习优化(Stage 5)。

 

Stage two 的定义

Stage two 为智能灯检仪学习阶段,AI 检测后提示结果优化需求,依赖高质量数据提升识别能力。

 

stage three 与 stage four 的核心差异

Stage three 数据由人工提供并标识,Stage four 实现自我学习优化,可自主上网搜索资料提升能力。

 

AI 验证的级别分类

基于自动化与控制设计维度,验证级别从人工完全参与(第一阶段)到系统自动生成(第六阶段),需适配医药行业合规要求。

 

明道云案例中的 AI 应用与自主学习

明道云通过语言指令实现 AI 组件设计:基础响应属第一 / 二级自主学习,调试后应用属第三级。

 

AI 应用的关键考量因素

需评估费用、数据安全(尤其强监管领域)、降本增效实效,确保应用目标明确。

 

AI 分类与企业应用优先级

分为商用 AI 与助手型个人 AI,企业应优先布局商用场景(如法规抓取、SOP 审核),避免个人效率工具导致资源闲置。

 

失败案例的底层逻辑

审计助手因法规更新低频、模型识别能力不足导致投入产出比失衡;化学合成路线助手受制于公开数据失真,真实工艺数据获取困难。

 

数据来源在 AI 训练中的重要性

数据真实性与时效性是模型有效性的基础,尤其在行业规范与技术创新领域,需严格把控数据质量与来源可靠性。

 

演讲原文

连云港木杉医药科技有限公司总经理王彬 00:13

大家下午好,今天主要是和大家讲一下 AI 的成熟度分级。今天的主题写了这么多,其实主要是有两个:一个是讲从过年到现在 AI deep learning 开始的热潮,给我自己带来的思考,同时也想和大家探讨;第二个是 ISPE 推出的关于 II 成熟度的分级。我个人认为,这个分级对于我们聊 AI 时该怎么聊,非常有指导意义。先说一个现状 —— 我在写这张 PPT 的一个月内,一直在修改,因为这期间几个 AI 巨头不停创新,今天你第一,明天他第一。所以我个人觉得对于现状不敢讲,为什么不敢讲?

 

连云港木杉医药科技有限公司总经理王彬 01:11

第一个是大模型发展太快了,和我们常规的发展(过去好几年才推出一个模型)不一样,真的是日新月异,一个月之内老大换了好几次。第二个是用户场景变化特别快:从 DeepSeek 刚出来前,业内讨论更多是做合规助手、偏差助手、变更助手等各类助手;到现在,很多企业已将其用在 SOP 起草、文件核对等场景,发展特别快。

 

连云港木杉医药科技有限公司总经理王彬 01:43

第三个是用户的业务模型变化,这也是基于大模型本身及应用场景发展太快导致的。所以现在聊 AI 时,很多时候要看最流行的是什么,甚至要考虑是否追潮流 —— 如果不追,花三四个月做一个 agent,会不会已经过时?接下来讲场景,这是我过年后了解和遇到的:最常见的是质量管理助手、销售管理助手等简单生成式 AI,还有生产和供应链优化(可能在 ERP、CRM、SRM 中嵌入 AI 功能),以及医学影像(其实五六年前已接触,将医学影像图片喂给机器学习)。最上面我认为最难也最有用的是药物研发和优化,以前几十人几百人做好几年的事,现在用 AI 可能半年或三四个月完成。但我之前发朋友圈说过,人类无法想象认知以外的东西,我们对 AI 的应用肯定不仅限于此,更多应用在哪?可能需根据每个人的背景知识想象。这张图最重要,今天想花大量时间讲 —— 这是 ISPE 的成熟度分类图。

 

连云港木杉医药科技有限公司总经理王彬 03:20

我们对于 AI 的应用肯定不仅仅限于这个,但是更多的应用是在哪里呢?可能就是根据我们每个人的背景知识来进行一个想象,然后这张图是最重要的。其实我今天想花一个很大的时间来讲这张图,这张图是一个成熟度分类,是 ISPE 出的。

 

连云港木杉医药科技有限公司总经理王彬 03:37

成熟度分类是什么呢?它是分为两个维度。第一个维度是从 contour design 这个维度来讲,也就是说我们出了我们 AI 出的数据,我们该怎么用。另外一个维度就是说从 autonomy 这个角度来讲,就是我们如何去为这个 AI 去培训。我先从 control design 那个角度来讲,第一阶段就是我们可以用它,但是我们我们不会把它的结果作为任何的最终结果。

 

连云港木杉医药科技有限公司总经理王彬 04:07

就比如说最简单的,我们问豆包,豆包我如果现在想成为一个成功的明道云的合作伙伴应该怎么样做?他会给我很多很多建议。但是我相信在座的各位老师肯定不可能说完全 one by one 的去遵从他的建议。肯定会根据他的建议,最后最终决定我们的一个做法。

 

连云港木杉医药科技有限公司总经理王彬 04:35

然后第二个阶段其实就是说他产出的这个结果需要我们批准,批准以后我们就能用这个。比如说最简单的就是一个我们在供应链里面加上 AI 然后来计算我们的月度采购计划。如果这个月度采购计划它生成了以后,对于我们来说,我觉得产生的结果是可以接受的。我批准了签完字以后我们就直接用了。然后第三个第三个就是说我们可以用,但是我们在过程中可能会做一些调整,其实也就是微调。然后通过这微调,让它产生的结果成为我们真正想要的结果,然后再使用。

 

连云港木杉医药科技有限公司总经理王彬 05:12

然后第四个阶段就是说系统能够自动运行,并且自动控制自动运行。就是说我们不用我们人类开始结束,它可以一直持续的运行。然后自动控制是什么呢?就是我们人类会帮他设置一个置信区间,在这个置信区间内我们就可以用在我们还继续拿采购做例子,就是 AI 比如说做出了月度采购计划,我们我们正常的可能是采购比如说是 100 公斤到 200 公斤的那个二甲双胍原料。但是这个时候 AI 他帮我们算算出来说是采购 500 公斤,就是我们觉得我一个月怎么都不可能是五百,然后我们就设定了置信区间,100 到 200,如果在 100 到 200 之间 OK,这个结果我们可以直接引用你到下一下一个流程。但如果超过了 100 到 200,不好意思,那这个结果我们是不会引用的。

 

连云港木杉医药科技有限公司总经理王彬 06:07

然后第五个阶段,第五个阶段就是说他连置信空间都是它自动出的。比如说我们 AI 还是拿那个智能采购举例子。他我们以往最低的采购额度是 100 公斤,最高的是 200 公斤。然后他就自己制定了可接受的执行空间是这么多。

 

连云港木杉医药科技有限公司总经理王彬 06:29

我们这个时候,但是如果这个时候我们 AI 算出来说下一个月度我们的智能采购计划是二甲双胍原料原料药,我们采购是 202 公斤。那这个可不可以接受?这个时候不需要人任何参与,他自己决定根据我们的趋势,根据我们的历历史的历史的结果采购计划。然后觉得 202 虽然超过了 200,但是我们觉得是可以接受的。这个时候它就自动会到下一步了。所以说我们从 control design 这个维度我们可以看到,就是人参与的活动。从一开始平行共同做,然后到决定,到参与微调,到他给他一个执行空间,到执行空间都没有了,全部他自己决定,就是人参与的活动越来越少。

 

连云港木杉医药科技有限公司总经理王彬 07:13

然后 autonomy 这个阶段,其实我们是分为六个阶段。Stage 0 它其实就是这个时候我们是没有任何机器学习的。它虽然有算法,但是算法是固定死的。我们没有任何学习机器学习,所以认为是 stage 0。

 

连云港木杉医药科技有限公司总经理王彬 07:30

然后 stage 1然后就这个时候是什么?拿起瓶子,我不知道大家有没有接触过就是说智能灯检仪。拿智能灯简易举例子,我们可以拿标准的里边带还有白点,然后金属学的以及完全合格的这些注射剂,然后让智能灯眼一过。然后过完了以后我们让他学习,学习完了以后我们这个是会锁定学习。我每次下一次检验,我就用上次学习的结果来检验,这样就属于 stage1。

 

连云港木杉医药科技有限公司总经理王彬 08:00

Stage 2 是什么呢?Stage 2 就是我们还是智能灯检仪。智能灯检仪它是他是学完了以后,我们也用了,用了以后他这个时候会自动提示我们说,我们这次登检的结果其实并不是很好,很多的结果我这个 AI 我自己没法识别。所以说我需要更多的什么样质量的数据来为我来进行学习。

 

连云港木杉医药科技有限公司总经理王彬 08:25

然后 stage 3 其实就是和 stage 2 之间其实是有一定的模糊关系的。他们之间的分类并不是那种楚河汉界鸿沟一样特别明确的。其实我们是十几岁,他就是我们为你的这个数据,其实我们会标识。比如说我们拿一些不合格的,我们会告诉他这个是纤毛长了,这个是白点大了,这个是里面有金属学,这个里面是有玻璃学。然后还有接下来五瓶,这个是完全合格的。然后我们进行标识,然后对他进行一个学习。但是这个学习的数据是由我们人类来提供的。

 

连云港木杉医药科技有限公司总经理王彬 08:59

所以说 stage 3 和 stage 4 最大的区别是什么?Stage 4 是他自己学习,自己优化,根本不用你人来参与。这个时候我用智能灯检仪可能不好举例子,我这个时候我用那个智能图像系统来举例子。智能图像系统就是什么?这个时候我们平时是什么?我们平时是拿 B 超、彩超、X 光的片子,然后医生在那画。但是这片子是医生提供给他的,那个可能就是类似于我们 stage 1、2、3 这三个阶段都是这样,数据是人类提供给他的。然后到 statue 4,他如果可以联网的话,他上网搜,比如说搜所有人类腹腔的彩超,腹腔的 B 超。然后那个我自己搜,自己学,然后自己提高,这就是 stretch 4。

 

连云港木杉医药科技有限公司总经理王彬 09:50

Stage 5 就是更牛了。我们这个智能体,我们本身是让他学人的腹腔的的那个智能图像的,但是他在网上搜可以搜大象的、星星的、长颈鹿的,可能有脑腔的、胸腔的、腹腔的、脖颈的,他都会学。然后这个学的它是漫无目的的,它不是说是啊我就是跟人一样,我为了通过这次考试,我要好好学习。而是我就是兴趣广泛,我什么都想学。所以说这个也是一样,这是从学习的过程,人类参与的角程度是越来越少,然后就会造成我们的级别越来越高。我们根据这 automated y 和 control design 这两个维度,最后得出了我们 AI 验证的级别。

 

连云港木杉医药科技有限公司总经理王彬 10:36

这里面忘记说了,就是我本身是医药行业信息合规的咨询顾问出身,所以说验证这一块儿是我特别关注的。因为我们在医药行业,大家也知道医院可能会要求低一点。但是在药企那个化妆品、医疗器械以及兽药,我们对于验证是对于计算机化系统基 P 计算机化系统验证是要求非常高的。所以说我们刚才定义成熟度是为了什么?为了定义我们最终这个验证的一个分级。然后验证分析就是有各种各样的一个活动。然后最后到第六集的时候,ISP 的官员也说,我们目前是没法定义这种第六级的系统的验证。第六级就是刚才所说的什么,就是我们人类是完全不参与的,都是系统自己参与的。

 

连云港木杉医药科技有限公司总经理王彬 11:28

这个就是也是一样,我们目前无法识别这样的一个一个系统的该如何验证。然后接下来讲明道云刚才讲的是分类,然后接下来这个是通过明道云我们来做一个例子。这个明道云是什么呢?就是我们在开发设计我们软件的时候,我们会通过语言输入这这边这边右最右边其实就是我和他说说你该怎么样做。你大家可以看到就是说他一一开始我让他做一个倒计时,他就两个框,然后没有天,没有小时。后来我说在天的后边显示天,在小时的后边显示小时,然后他又做出来一个组件,然后左上角就是他做出来的样子,然后左下角就是他的代码这是明道云的一个东西。

 

连云港木杉医药科技有限公司总经理王彬 12:16

然后我们其实可以尝试着用刚才的一个分级,然后来去来去对它进行一个分类。我先讲一下,因为这个分类其实也像我刚才说的,不是楚河汉界,不是鸿沟不可那个的,有些地方是比较模糊的。首先他学习他是对于我来说,他其实是不存在学习的,我只是对他进行一个应用。他学习可能是就是明道云本身对这个智能体的一个培训。然后这个培训可能是持续的,也有可能是学习完以后就锁定了。所以说他学习的分类就 autonomy 的分类可能是一和 2。然后再再讲应用,如果说他出了这个自定义字段的这个程序,直接把它放在系统里面用了,那相当于就是第二级,就是我批准了以后,然后它产生的结果我会用的。如果它产生的这个东西就像我这样,我又进行了一个调试,我再用了,那就属于第三级,就是我进行了一些微调以后再用。

 

连云港木杉医药科技有限公司总经理王彬 13:17

这个就是讲通过明道云的这个 AI 的协作,然后讲的一个例子。然后接下来思考这个我本来想放在最后的,但是我觉得接下来还会有两个失败的案例。但是我想就是在讲失败案例之前,给大家一个思考。就是首先我们讲分类,刚才讲分类了,讲完分类以后我们要讲,大家都知道我们要分类,我们要把我们想做的这个 IAI 训练到什么样的一个程度。是直接用,还是用之前需要我批准,还是用的时候需要我微调,还是给他个执行空间,我就不管他了。最后一个,我觉得医药行业肯定是不会适合的,所以我就不说了。然后用到什么程度呢?这里边这个我过会会讲,就是我们到底是会用这个 AI 用了以后,然后把人员裁了裁一大半,还是说我们用了 AAI 以后,然后我们人员还继续留着。

 

连云港木杉医药科技有限公司总经理王彬 14:13

然后第三个就是如何如何实现,其实这个就涉及到费用了。这也是我这过完年以后和大家讨论最多的,就是我们要花多少钱,然后来实现我们的 AI 然后云部署本地部署。哪些数据可以泄露,哪些数据是不能泄露。刚才荣老师也讲了,就是有一些关键的数据是强监管的,是不能泄露的。然后最后一个就是根据之前这三个问题,我们要想真的这种降本增效吗?因为就是我刚才也说了,我是做合规咨询出身的,我一直认为做任何事都有目的的。如果你想玩玩那个 AI 的话,最好不要花别人的钱玩,可以自己部署。

 

连云港木杉医药科技有限公司总经理王彬 14:56

在这里面我再另外讲一个,其实我个人我个人对 AI 也有两个分类。其实大众对 AI 有各种各样的分类,生成式的、然后通用式的,逻辑式的、推理式的。但是我个人对 AI 也有两个分类,一个分类是商用 AI 一个分类是个人 ai 其实我们很多助手类的 AI 其实更多的是个人 AI 它对我们我们整个企业来说,其实是提供不了任何作用的。如果上企业要上 AI 的话,尽量避免上这种。因为像这种 AI 人依旧在那儿,我们不会裁员的。然后效率。会提高肯定会提高个人的效率的。但是会不会说我以前一天干一件事,然后有了 AI 我现在一天干五件事,然后我这五件事我真的一天全部都给领导了,还是说我把这五件事干好了,我干干一天歇四天。这个就不好说了。

 

连云港木杉医药科技有限公司总经理王彬 15:51

所以说我们真的要降本增效的时候,我们一定要考虑的是商用型的 AI 而不是那种助手型的个人 ai 然后和和大家分享一下失败的案例,那个成功的案例我觉得可能大家觉得炫耀,但是失败的案例我觉得大家肯定能铭记于心的。这是一个需这是一个审计助手,他的需求是什么呢?定期去法规网站抓取最新的法规,然后审核我们企业的 SOP 是否符合法规。然后同时审核我们 SOP 执行是否到位,是否有矛盾缺失,引用死循环。这个需求我觉得就是抛开效益来说,肯定是很好的需求。

 

连云港木杉医药科技有限公司总经理王彬 16:32

然后失败点是投入产出比不高,就刚才我说的那个就是根本没有降本增效。首先第一个就是我们的法规并没有达到需要去抓取的地步。我们像中国的 GMP 多少年换一次大家也知道,然后顶多会出一些指南或者附录。但这个附录也不是说一个月出一次的。所以说我们根本不需要花很多钱去做一个软件,去定期的去爬。然后第二个他还有一个缺点,就是我们后来发现,很多时候这可能是我的问题,就是很多时候它没法识别新法规和旧法规。就是因为有些法规还好,他会写,我这个法规于哪一天生效,然后将替代什么时候发布的法规。但是有一些法规它里面不会写,所以说它就学不会。

 

连云港木杉医药科技有限公司总经理王彬 17:26

然后这第三个就是幻觉,这个大模型它有幻觉。大家都知道其实对于医药行业的三大主流法规就是中国 GMP、欧盟 GMP 和美国的 211 和 210 以及 part eleven。它里边根本没有讲到任何的双因子认证的要求。但是当我问他的时候,而且当我们已经让他学习很久了,也做了很多纠偏的活动。但是当我问他的时候,他还会瞎说双因子认证那个双因素认证这个东西哪里来的?我不知道,这是一个失败的案例。

 

连云港木杉医药科技有限公司总经理王彬 18:00

然后讲第二个,第二个失败的案例就是我我想做一个化学合成路线助手,就是定期的去专利网站或者知网去抓取专利和论文。并且还通过企业内部的知识库,我们几年积累的一些工艺。然后最后,当我输入我想要是合成的一个化合物的时候,它能给我一个最优的工艺。然后最后做,最大的一个失败点就是数据的来源真实性就是太差了。然后第二个第二个我写错了,不是新旧法规,他甚至会拿出 1957 年的合成的方式来给我提建议。现在都已经 2025 年了,他还会拿 1957 年的,所以说这个也不行。然后第三个也是一样,大模型乱回答他就是他回答的时候,然后我们就对他进行一个纠正的时候,他就是会乱回答。

 

连云港木杉医药科技有限公司总经理王彬 18:54

以上这两个案例,我讲了表象的东西,然后接下来我讲一下最底层的逻辑。最底层的逻辑首先就是审计助手失败,这个我后来发现了,因为我是通用模型来训练。如果是用推理型模型来训练,我后来又做了一个。他他虽然投入产出比依旧不高,这个就是说实话是我满足了我个人的一个意愿来玩玩。

 

连云港木杉医药科技有限公司总经理王彬 19:18

然后另外一个,但是新旧法规它是能够识别的。就比如说我这个时候有两个法规的名字一模一样,他就会根据时间选第一,选最新的,而旧的就抛弃了。然后那个如果是用推理模型的话,他就会抛出了很大一部分幻觉。然后那个化学合成路线,我后来也是能够让他能够识别新旧工艺了。比如说至少 20 年前的工艺我们不会找了。同一个工艺有两年前的,有三年以前的,我可能会同时参考。但是同一个工艺有一个是 20 年前的,有个两年前的,我肯定抛弃 20 年前的。

 

连云港木杉医药科技有限公司总经理王彬 19:54

但是有一个最难的地方就在于一个正确的数据。那个正确数据就是业内的老师给我建议说,你从专利网站或者是从论文网站上来看,其实并没有能够找到一个真实的数据。没有人会把自己真正的公益放在我们的专利网站或者是论文上的。所以说我们要做那个大模型的话,其实我们也要考好好的考虑我们正确的一个数据的来源。

 

连云港木杉医药科技有限公司总经理王彬 20:22

最后这是我的二维码,大家有兴趣我们可以加一下二维码,然后进行个沟通。如果加入的话,是有礼品相送的,我这儿有 FFDA 整理的。就是过去几年的医药行业,就是医院和医药行业的一个 AI 的实力。但是这个 AI 的实力我也和大家说,他只有名称和描述,具体怎么样做的,他是没有的。谢谢大家,以上是我的分享。

关于HAP

HAP(Hyper Application Platform)超级应用平台可以帮助用户零代码构建企业应用,用户不需要代码开发就能够搭建出用户体验上佳的销售、运营、人事、采购等核心业务应用,打通企业内部数据。HAP还具备超自动化引擎,可以全面自动化复杂和重复的业务流程。运用HAP的集成中心与完整的API对接能力,用户可以轻松地将HAP与外部系统集成。除此之外,HAP还具备很高的可组合性,国际化支持,并支持云原生架构,实现了多云部署能力。通过插件架构,HAP正在逐步建立起繁荣的实施与开发生态。

HAP可以帮助企业大大节省软件费用、降低定制开发的成本和时间,拥有一个极度灵活和易用的数字化平台,是企业数字化建设的重要工具。目前已有上百万用户使用,付费企业超过4000家,包括可口可乐、复星集团、广汽本田、赛力斯汽车、中国移动、中石化、中铁集团、银鹭食品、民生银行、迪卡侬、艾默生电气、泰科电子、四川航空、东方证券、洲际酒店、科大讯飞、柳工集团、沃尔玛、中国烟草、三菱银行等知名客户。

2021年5月,明道云获得海纳亚洲近亿元投资。公司目前有超过130名员工,产品研发团队过半,总部位于上海漕河泾开发区,在北京、广州、深圳、成都、郑州、武汉、西安和宁波设有分支机构。公司为高新技术企业,上海市专新特精认定企业。