最近在一次交流中,一位国外同行笑着说,他们那边用的大模型,就像是“严师教出来的理科生”,而我们呢?基本还属于“自学成才的文科生”。这话听着有点刺耳,但细想还真不是空穴来风。 我们这边的大模型,严格来说,是“基于深度学习机制的生成式自然语言大模型”,主要集中在文本、图像这些“内容领域”,在制造业、能源、交通这些硬核场景里,这类大模型往往水土不服。不是企业不想用,而是用了也不好用。这不是抱怨,这是现状。你看,据调查,94%的央企受访者认为大模型的精准性还难以满足实际生产需求——也就是说,它能说会写,但拧不动螺丝,进不了车间。
精准性问题,是“理科”世界的门槛 工业场景讲究什么?靠谱、稳定、细节精准。一句话,不能错。而生成式语言大模型最大的毛病就是“不太靠谱”——它善于语言、擅长总结,但对结构力学、电机控制、热传导这些工科里的“硬知识”,没有逻辑理解或者理解并不深,靠的是死记硬背。有时候看着挺像那么回事,其实一问细节逻辑道理就露怯。 你要让它回答“变频器在高温环境下的载波频率调整策略”,它可能还能整出一堆话来,但到底靠不靠谱?得打个问号。讲白了,现在的大模型,顶多算个聪明的记忆力特好的旁听生,还不是合格的工程师。**
最大短板:缺人,缺“专家知识工程师” 这个短板,在工业领域尤其致命。不是有个AI就能搞智能制造,它需要那种懂工程又懂AI的复合型人才。比如一个做风电设备的专家,能说出叶片负载曲线的小数点后三位变化是为什么,同时又能跟AI工程师把这个逻辑建成模型。否则呢?细节挂不上钩,业务逻辑全浮在表面,大模型就成了“人工智障”。 这类人我们现在太稀缺。企业找不到,科研机构也不多。全靠算法工程师闭门造车,最后造出来的东西,谁都不敢真上产线。**
海外同行怎么玩?“理科生”模型更多 国外的做法有些不一样的条件。他们那边除了大语言模型,还有一票“理科生模型”——比如用于物理建模的PDE推理模型、用于预测和优化的控制大模型,甚至在材料仿真、设备异常分析里,也有专门训练的混合模型。人家把这些模型当“工具箱”用,用一个场景选一套组合。 相比之下,我们这边就偏单一,一股脑地都想用LLM解决问题,结果呢?用不上,用不好,还烧钱。**
前景不是没有,但得讲方法 悲观没用,真正的问题是:我们怎么破局?我觉得可以从这几条路试试: 工科化改造大模型架构:比如把物理约束、工业规则、结构知识显式融入模型,不让它乱猜。我目前的团队就是这么干的,机理模型要用,大数据模型也要用,大模型用在它有长处的方面。“三个笨模型,顶一个专家工程师”。 先啃微场景,不图一步到位:比如质检识别、能耗预测、故障预警,这些场景数据闭环快、落地见效快。 落地班子要搭双人组:懂行的老工程师 + 能沟通的算法师。不是让算法工程师一个人“闭门瞎想”,而是让工程师带着AI干活,像当年电工带学徒一样。**
最后一句:人工智能不懂工程细节,就是人工智障 我们可以接受大模型现在还不成熟,但不能接受它一直“长不大”。想让它在制造业里落地开花,不是靠空中楼阁的畅想,而是靠一线工程知识的灌注和场景细节的死磕。 工业不是写小说,也不是画图,工业是动真格的。靠大模型讲大道理没用,能解决“小问题”才是硬道理。**
|