不是技术不行。是路子走歪了。这行当里太多人拿着大模型和论文指标去套车间里的鸡毛蒜皮,你让他去调一个打光角度,他觉得你在侮辱他的算法。说实话,工业AI的真正难题,根本不在模型精度上——而在那个沾满油污的传送带、那个每天变三次的环境光、还有那个干了二十年质检、斜眼看屏幕的老师傅。
## 工业AI的“理想”与“骨感”
PPT上永远是端到端、实时检测、无人值守。现实呢?我见过一个拧螺丝的机器人搭配AI力矩控制,项目演示当天崩了:因为前一天空调坏了,车间温度升了5度,润滑油粘度变了,模型直接抓瞎。没有人提前告诉算法,温度漂移必须进特征工程。这就是工业场景的残酷之处。你的“理想数据集”只是上帝视角。而车间里永远有新的干扰因素,像打地鼠一样冒出来。
2018年我们给一家轴承厂做裂纹检测,实验室准确率98.7%,到产线跑起来只有71%。你猜为什么?因为零件来料方向不一致,光照会在裂缝上形成各种诡异阴影,标注人员压根没考虑过这个变量。后来怎么解决的?不是升级网络结构,是加了三个补光灯、一个偏振片,还有——把标注团队拉到车间蹲了两天。所以工业AI里,有效数据生成机制比算法创新紧迫十倍。但很多团队偏偏迷恋调参,看不见真实物理世界的不可控性。

## 数据是工业AI的血液,但也可能是毒药
训练一个能用的缺陷检测模型需要多少张标注图片?课本答案可能是“每类缺陷至少200张”。工厂给的现实:对不起,只有23张,其中12张是同一个角度拍的,还有一张对焦没对准。这就是常态。你不可能让产线专门为你停机造缺陷,那是要把生产总监逼疯的。于是开始玩数据增强旋转、剪切、加噪声——结果模型学到了增强带来的伪影,上线后把灰尘都当裂纹。我气得骂人——这他妈不是智商税吗?
问:我们是个小钣金厂,想用工业AI搞质检,数据太少怎么办?
答:别上来就想着深度学习。先试试传统机器视觉加规则,哪怕用OCR和面积比筛掉大部分良品,只让AI处理模糊地带。这叫“人机协同过滤”。数据量不够就坚决不上端到端,用特征工程硬扛。另外,去产线捡报废品回来拍照,故意制造一些轻微缺陷——反正报废件本来就要扔,不心疼。我在佛山一个灯具厂就这么干,用80张图训练出了一个勉强能用的焊点模型。当然,你需要一个懂工艺的人一起标注,不然缺陷界线你都划不明白。
正是这种灰头土脸的实战,让我对“数据驱动”有了近乎偏执的理解:工业AI的成败,70%在于你能不能定义清楚问题边界,数据只是后面的砖瓦。可惜,太多项目上来就要搭数据中台、上云、搞联邦学习,忘了自己连本地文件夹里的图片都没管理好。

## 模型不是一切:当算法工程师遇见车间老师傅
我合作过的几家工厂里,最懂AI潜力的人往往是设备主管或工艺工程师。他们可能写不出一行Python,但能直觉般告诉你:这个工位震动大,那个参数漂移和湿度有关。有一次,算法团队花两周调试一个装配拧紧的异常检测模型,怎么都消除不了周期性误报。后来车间班长路过,瞄了一眼曲线,说:“你们不知道这台设备开着门和关着门,风扇震动频谱不一样吗?”大家面面相觑。原来空调出风口正对着控制柜。那条误报波动,每七分钟一次,跟空调压缩机启停完美吻合。你说这是数据科学问题还是工程常识问题?
所以我越来越觉得,工业AI必须是一种“混合智能”。让老师傅的经验显性化,变成规则或半监督的约束,再让模型去啃他们说不清楚的部分。千万别摆出一副“AI替代人类”的傲慢姿态。真惹急了老师傅,他给你标注数据里故意埋雷,你哭都来不及。
问:我们产线上AI预警的系统太多了,工人根本来不及反应,最后都把报警喇叭拔了,怎么破?
答:现象级问题。这叫“告警泛滥”,工业里平均每个操作员每5分钟就要应对一个警报,90%以上是无效的,不拔喇叭才是奇迹。解方不是升级模型降低误报率那么简单——你永远降不到零。真正有效的做法是分层处置和闭环升级:先静默推送到班组长的平板,由他判断是否要停线;同时把重复出现的低危告警聚合,生成周期性的维修建议清单。我们在一家化工厂搞了一套,把无效警报从每天上万个压到几十个,核心不是算法多牛,而是把人的判断重新放回了环路里。记住,工业AI必须以人为中心设计交互,否则就是昂贵的背景噪音。
## 从试点到规模化的死亡之谷
最让我血压飙升的场景是什么?一个AI试点项目完美收官,厂门口挂上了“智能示范产线”的牌子,然后……就没有然后了。你问为什么没推广?答曰:第二台设备型号不一样、产品换了模具、供应商协议没签、运维跟不上、数据权限扯皮……随便一条就能卡死你。工业环境本来就是高度异构的,AI的泛化能力在物理世界里脆弱得像个瓷娃娃。我在一篇内部报告上写过:工业AI的规模化本质上是一场工程治理革命,不是技术复制粘贴。你得重新梳理标准作业程序、改造数据管道、甚至调整采购流程,这几乎是在动工厂的神经系统,没有一把手工程根本推不动。
而且,经济账比技术账难算。一个质检工位年成本20万,AI设备初期投入80万,如果每年维护还要砸进去10万,老板算半天,发现不如雇两个人三班倒。你不能怪老板短视——因为很多AI方案根本没考虑全生命周期成本:模型重新训练要不要额外人力?专用光源要不要定期更换?软件授权是不是按年收?这些隐性成本才是吃掉利润的狼。所以我现在给方案,先谈三年总拥有成本,再聊技术先进性。
问:是不是所有工厂都该马上去拥抱工业AI,有优先级吗?
答:当然不是。先看你的设备是否已经稳定产生结构化数据,比如PLC信号、传感器时序、视觉图像。如果连基本的数据采集都靠手抄本,上来就搞AI无异于沙滩盖楼。我建议的顺序:先把设备联网和关键工艺参数监控做扎实,哪怕只是简单的SPC控制;接着找重复性高、规则明确、但容易疲劳的工位试点,比如外观终检、拧紧扭矩监控;最后才是黑箱工艺(如注塑、焊接)的AI优化。切忌一听到“AI”就觉得能包治百病,没有数字化骨骼,工业AI就是一团模糊的血肉。
## 一些真心话:做工业AI,别太“AI”了
我入行这些年,最大的感悟反而是:工业里真正的智能,不是让机器模仿人,而是让机器成为可解释、可干预、可进化的工具。别痴迷端到端黑盒,多用机理模型 + 数据驱动的混合方案;别迷信云端,记住工业现场网络的延迟和断线可能致命;别总提“人工智能”,车间里大家更认“高级自动化”。有一回,我们把一套复杂的推理系统说成“自学习参数整定器”,从那之后工艺员接受度高了一大截——你看,语言就是权力。
最终,工业AI拼的不是谁的模型在ImageNet上多高,而是谁更懂产线的烟火气。那些在地板上摔过跤、被机油弄脏过笔记本的人,才可能做出真正用得起来的东西。我甚至有点偏激地认为,没有在生产一线跟过夜班的人,根本没资格设计工业AI系统。这很粗暴,但无数次被证明是对的。
所以,如果你正准备在厂里开搞工业AI,不妨先把PPT关上,去车间站一个下午,听一听设备运转时的杂音,闻一闻切削液的味道,问问老师傅最烦什么重复劳动。那里,才藏着真正值得用AI解决的问题。