CTO案头必备|AI技术产业落地的42章经( 二 )


——《产业计算机视觉落地难点与应对》
掌握主流和全面的技术复杂任务先拆分简化 , 抽象问题是关键能力
当遇到复杂场景的问题时 , 将其拆分成一些小的任务与目标 。 因为小的任务相对简单一些 , 而复杂任务相对难一些 , 把复杂任务拆分成小任务本身就是一个技术建模的过程 。 拆分成小的任务之后 , 针对每一个小任务 , 我们都可以进行非常细致的技术选型 。
CTO案头必备|AI技术产业落地的42章经文章插图
(抽象问题的拆分举例)
这个其实在我们实际场景中是非常常用的 , 因为真实的业务场景它可能不是一个任务 , 而是众多任务 。 比如说文本纠错、复杂的问答系统、复杂的对话系统等 , 它可能包含了多个子任务 。
——《产业NLP任务的技术选型与落地》
很多油田电力和工矿企业 , 它里面存在很多传统的机械指针式的仪表 , 这种仪表与数字仪表不同 , 机械表无法将表具的读数实时发送到监控系统 , 需要人工进行读表检查 , 这种表大部分是用来做监控用的 。
比如说监控设备的运行是否正常 , 而且这些表大部分是部署在厂区的各个位置 , 为了监测仪器是否工作正常 , 或者系统是否工作正常 , 工厂或者是一些企业都要派大量的人力到现场去进行巡检 , 检查表的读数是否正常 , 进而去判断整套系统或者仪器是否正常 , 这样的话就会消耗很多企业的人力成本 , 而且每次巡检周期长 , 频次非常低 。 实际解决问题之前 , 需要清晰的梳理出表计识别项目会面临到的难点问题:
1、 表具种类多 , 相似度大 , 样本采集困难且不易分类
2、 在复杂环境下 , 读数精确度不易保证
3、 室外环境恶劣导致读数难以识别
CTO案头必备|AI技术产业落地的42章经文章插图
(技术方案拆解:目标检测+语义分割)
所以我们没选择直接识别的方案 , 因为直接识别会遇到多尺度的问题 。 我们选用了更为复杂的方案:目标检测+语义分割 , 当我的读数难度变小了 , 精确度会得到更好的保证 , 这是最核心的 。 同时 , 因为模型复杂度的提升 , 我的推理时间变长了 。 不过没关系 , 因为在表计巡检的场景里 , 对时效要求并不高 。 所以很多时候 , 大家问这样的方案好不好那样的方案好不好 , 还是要首先去回答自己的问题 , 你的场景到底有什么样的限制条件 。 没有最好 , 只有最适合 。
——《能源电力传统仪表综合无人巡检》
Last but not least,优选工具
京东物流最开始自己要做快递单识别 , 其工程是非常复杂的 。 中国的四级地址 , 有的用户名字叫“一个橘子” , 区号和电话号码连在一起 , 还有大量的附言词 。 在这之中我们要做大量的分词、文本解析、结构化处理、信息的补全、消歧等 , 最后进行语义相似度的打分和匹配 。 有监督+无监督的方法结合去应用 。 整个团队花了很长的时间 , 去建立一整套的系统 。
CTO案头必备|AI技术产业落地的42章经文章插图
(京东物流快递单识别所使用的ERNIEAPI)
完成了这些工作 , 跨过了这些坑之后 , 当我遇到百度文心ERNIE , 瞬间觉得豁然开朗 , 觉得它比我更懂我应该做什么 。 刚才说的所有那些很复杂的东西 , 从以前的Framework转到飞桨以后 , 前面三个API其实就搞定了 。 最后一个API地址识别 , 我画了小太阳 , 对我们的工作效率提升带来了很大的帮助 。
很多应届生同学他们进来就能很快地上手 。 对于他们来说 , 一开始觉得这件事太难了 , 可能很难坚持下来 。 在新同学还不是特别懂深度学习的原理情况下 , 能够把整个技术做出来 , 能够有结果 , 这是件非常让人兴奋的事 。