工业AI落地：从幻想到现实的辛辣笔记-中远盛泰工业

我上周去了趟东莞，一个做连接器的老厂。老板拉着我看新上的AI视觉检测线，兴奋得像个孩子——然后指着屏幕上一堆疯狂跳动的红色缺陷框，说：“你看，它连头发丝都能抓出来！”我凑近一看，好家伙，合格品被误判成缺陷的比例快三成了。操作工闷头把“NG”的零件捡回来悄悄放回OK线。这画面，实在是工业AI落地的典型缩影。

不是技术不行。是路子走歪了。这行当里太多人拿着大模型和论文指标去套车间里的鸡毛蒜皮，你让他去调一个打光角度，他觉得你在侮辱他的算法。说实话，工业AI的真正难题，根本不在模型精度上——而在那个沾满油污的传送带、那个每天变三次的环境光、还有那个干了二十年质检、斜眼看屏幕的老师傅。

## 工业AI的“理想”与“骨感”

PPT上永远是端到端、实时检测、无人值守。现实呢？我见过一个拧螺丝的机器人搭配AI力矩控制，项目演示当天崩了：因为前一天空调坏了，车间温度升了5度，润滑油粘度变了，模型直接抓瞎。没有人提前告诉算法，温度漂移必须进特征工程。这就是工业场景的残酷之处。你的“理想数据集”只是上帝视角。而车间里永远有新的干扰因素，像打地鼠一样冒出来。

2018年我们给一家轴承厂做裂纹检测，实验室准确率98.7%，到产线跑起来只有71%。你猜为什么？因为零件来料方向不一致，光照会在裂缝上形成各种诡异阴影，标注人员压根没考虑过这个变量。后来怎么解决的？不是升级网络结构，是加了三个补光灯、一个偏振片，还有——把标注团队拉到车间蹲了两天。所以工业AI里，有效数据生成机制比算法创新紧迫十倍。但很多团队偏偏迷恋调参，看不见真实物理世界的不可控性。

## 数据是工业AI的血液，但也可能是毒药

训练一个能用的缺陷检测模型需要多少张标注图片？课本答案可能是“每类缺陷至少200张”。工厂给的现实：对不起，只有23张，其中12张是同一个角度拍的，还有一张对焦没对准。这就是常态。你不可能让产线专门为你停机造缺陷，那是要把生产总监逼疯的。于是开始玩数据增强旋转、剪切、加噪声——结果模型学到了增强带来的伪影，上线后把灰尘都当裂纹。我气得骂人——这他妈不是智商税吗？

问：我们是个小钣金厂，想用工业AI搞质检，数据太少怎么办？
答：别上来就想着深度学习。先试试传统机器视觉加规则，哪怕用OCR和面积比筛掉大部分良品，只让AI处理模糊地带。这叫“人机协同过滤”。数据量不够就坚决不上端到端，用特征工程硬扛。另外，去产线捡报废品回来拍照，故意制造一些轻微缺陷——反正报废件本来就要扔，不心疼。我在佛山一个灯具厂就这么干，用80张图训练出了一个勉强能用的焊点模型。当然，你需要一个懂工艺的人一起标注，不然缺陷界线你都划不明白。

正是这种灰头土脸的实战，让我对“数据驱动”有了近乎偏执的理解：工业AI的成败，70%在于你能不能定义清楚问题边界，数据只是后面的砖瓦。可惜，太多项目上来就要搭数据中台、上云、搞联邦学习，忘了自己连本地文件夹里的图片都没管理好。

## 模型不是一切：当算法工程师遇见车间老师傅

我合作过的几家工厂里，最懂AI潜力的人往往是设备主管或工艺工程师。他们可能写不出一行Python，但能直觉般告诉你：这个工位震动大，那个参数漂移和湿度有关。有一次，算法团队花两周调试一个装配拧紧的异常检测模型，怎么都消除不了周期性误报。后来车间班长路过，瞄了一眼曲线，说：“你们不知道这台设备开着门和关着门，风扇震动频谱不一样吗？”大家面面相觑。原来空调出风口正对着控制柜。那条误报波动，每七分钟一次，跟空调压缩机启停完美吻合。你说这是数据科学问题还是工程常识问题？

所以我越来越觉得，工业AI必须是一种“混合智能”。让老师傅的经验显性化，变成规则或半监督的约束，再让模型去啃他们说不清楚的部分。千万别摆出一副“AI替代人类”的傲慢姿态。真惹急了老师傅，他给你标注数据里故意埋雷，你哭都来不及。

问：我们产线上AI预警的系统太多了，工人根本来不及反应，最后都把报警喇叭拔了，怎么破？
答：现象级问题。这叫“告警泛滥”，工业里平均每个操作员每5分钟就要应对一个警报，90%以上是无效的，不拔喇叭才是奇迹。解方不是升级模型降低误报率那么简单——你永远降不到零。真正有效的做法是分层处置和闭环升级：先静默推送到班组长的平板，由他判断是否要停线；同时把重复出现的低危告警聚合，生成周期性的维修建议清单。我们在一家化工厂搞了一套，把无效警报从每天上万个压到几十个，核心不是算法多牛，而是把人的判断重新放回了环路里。记住，工业AI必须以人为中心设计交互，否则就是昂贵的背景噪音。

## 从试点到规模化的死亡之谷

最让我血压飙升的场景是什么？一个AI试点项目完美收官，厂门口挂上了“智能示范产线”的牌子，然后……就没有然后了。你问为什么没推广？答曰：第二台设备型号不一样、产品换了模具、供应商协议没签、运维跟不上、数据权限扯皮……随便一条就能卡死你。工业环境本来就是高度异构的，AI的泛化能力在物理世界里脆弱得像个瓷娃娃。我在一篇内部报告上写过：工业AI的规模化本质上是一场工程治理革命，不是技术复制粘贴。你得重新梳理标准作业程序、改造数据管道、甚至调整采购流程，这几乎是在动工厂的神经系统，没有一把手工程根本推不动。

而且，经济账比技术账难算。一个质检工位年成本20万，AI设备初期投入80万，如果每年维护还要砸进去10万，老板算半天，发现不如雇两个人三班倒。你不能怪老板短视——因为很多AI方案根本没考虑全生命周期成本：模型重新训练要不要额外人力？专用光源要不要定期更换？软件授权是不是按年收？这些隐性成本才是吃掉利润的狼。所以我现在给方案，先谈三年总拥有成本，再聊技术先进性。

问：是不是所有工厂都该马上去拥抱工业AI，有优先级吗？
答：当然不是。先看你的设备是否已经稳定产生结构化数据，比如PLC信号、传感器时序、视觉图像。如果连基本的数据采集都靠手抄本，上来就搞AI无异于沙滩盖楼。我建议的顺序：先把设备联网和关键工艺参数监控做扎实，哪怕只是简单的SPC控制；接着找重复性高、规则明确、但容易疲劳的工位试点，比如外观终检、拧紧扭矩监控；最后才是黑箱工艺（如注塑、焊接）的AI优化。切忌一听到“AI”就觉得能包治百病，没有数字化骨骼，工业AI就是一团模糊的血肉。

## 一些真心话：做工业AI，别太“AI”了

我入行这些年，最大的感悟反而是：工业里真正的智能，不是让机器模仿人，而是让机器成为可解释、可干预、可进化的工具。别痴迷端到端黑盒，多用机理模型 + 数据驱动的混合方案；别迷信云端，记住工业现场网络的延迟和断线可能致命；别总提“人工智能”，车间里大家更认“高级自动化”。有一回，我们把一套复杂的推理系统说成“自学习参数整定器”，从那之后工艺员接受度高了一大截——你看，语言就是权力。

最终，工业AI拼的不是谁的模型在ImageNet上多高，而是谁更懂产线的烟火气。那些在地板上摔过跤、被机油弄脏过笔记本的人，才可能做出真正用得起来的东西。我甚至有点偏激地认为，没有在生产一线跟过夜班的人，根本没资格设计工业AI系统。这很粗暴，但无数次被证明是对的。

所以，如果你正准备在厂里开搞工业AI，不妨先把PPT关上，去车间站一个下午，听一听设备运转时的杂音，闻一闻切削液的味道，问问老师傅最烦什么重复劳动。那里，才藏着真正值得用AI解决的问题。

工业AI落地：从幻想到现实的辛辣笔记

最新文章

热门标签