如何“教会”AI看图识字?这些人工智能训练师花了不少心思


如何“教会”AI看图识字?这些人工智能训练师花了不少心思文章插图
“胡萝卜 , 重量1.3kg , 单价3元 , 总价3.9元……”
在鄞州惠风西路菜市场 , 一台能识别蔬果的智慧溯源秤 , 让消费者购买的菜品名称跃然于屏上 。 而智慧秤自行“拍摄”的食品照片 , 不仅能让菜市场管理者在后台一目了然 , 还能同步呈现在技术提供方——国研软件物联网研发部副经理王宏梁的眼前 。
“一家菜市场 , 每天可以产生1万条这样的实时交易数据 。 我们把它分拣归类后 , 还能用来改进算法模型 , 进而提高识别率 , 让‘认识’蔬果的人工智能更加‘聪明’ 。 ”
看着在密密麻麻的照片前目瞪口呆的采访人员 , 王宏梁笑着打开了话匣:图像识别、人脸识别、语音识别……在每个人工智能(AI)应用背后 , 都得由专人花功夫“教会”机器学习 , 而这正是他们的工作之一 。
如何“教会”AI看图识字?这些人工智能训练师花了不少心思文章插图
“投喂”素材 , 才能“教会”机器
王宏梁所从事的工作 , 和今年2月纳入国家职业分类名录的新岗位——“人工智能训练师”不谋而合:即标注和加工原始数据、分析提炼专业特征 , 并通过训练和测评让算法迭代升级 。 通俗地讲 , 就是通过不断的“投喂素材” , 让AI学会看图识字 。
故事得从2017年说起 。 彼时 , 国研软件打算研发智慧溯源秤 , 让菜市场的电子秤能自动识别蔬果 , 以实现农贸交易信息的采集与追溯 。 当然 , 要想让电子秤像人类一样分得清苹果、番茄、胡萝卜等成百上千种菜品 , 背后得花费大量的时间精力 。
王宏梁和团队成员们 , 由此打开了AI训练的大门 。 每天 , 他们都要去菜市场买来新鲜的食材 , 为每个品种拍摄至少3000张照片 , 再传到电脑里标记分类 , 这样才能让算法对该品种具备一定的识别率 。 一开始 , 大家对这份工作满怀新奇 , 但等新鲜劲过去后 , 也发现了它繁琐而重复的一面:
“我每天上班之前 , 都会先到钟公庙菜市场采购一番 , 买来十几样蔬果海鲜 , 让大家各自分头拍照 。 每个品类要3-5秒钟拍一张 , 中间还不能休息 , 拍完一两个品类 , 一天的时间就过去了 。 ”在王宏梁的记忆中 , 这段五味杂陈的经历也带来了不少趣事——
有一次 , 他在菜市场买来活蹦乱跳的虾和泥鳅 , 没想到因为天气炎热 , 鲜虾的外壳竟然在“翻身”拍照时摇身一变 , 成了烤熟的红色 , 而泥鳅熟透的样貌 , 仿佛可以直接被端上餐桌 , “只得重新再买一次” 。 整个办公室也随即弥漫着经久不散的荤腥味 , 令路过的同事们避之不及 。
更为复杂的 , 是对照片的分拣和标记 , 并用处理完的数据训练算法 , 即“把数千张照片的‘番茄’用方框标记出来 , 再告诉机器具备这些特征的蔬果叫‘番茄’” 。 那一阵子 , 王宏梁每天都盯着电脑处理上万张照片 。 有一次 , 他在海量的五花肉、里脊肉、前腿肉图片之间连续挑拣了十几天 , 双眼竟因疲劳过度而出现红肿 , 只好去医院开了点药……
如何“教会”AI看图识字?这些人工智能训练师花了不少心思文章插图
尽管如此 , 王宏梁仍觉得这份工作很有价值 。 目前 , 该公司智慧秤的蔬菜识别率已超过95% , 广泛应用于宁波、南京、杭州等地的数百家农贸市场 , 为城市供应链的数字化改造打下了基础 。
人工智能训练 , 还有哪些应用场景?
智慧菜场 , 仅仅是人工智能应用的一个细分场景 。 无论是生活中的支付宝人脸识别、科大讯飞语音转文字、微软小冰机器人交互对话 , 还是媒体聚焦的阿尔法狗战胜围棋冠军李世石 , 这些成功的案例背后都有训练AI的人 。
最近 , 国研软件推出的社区治理小程序 , 还嵌入了名叫“微微”的智能服务机器人 , 能够自动回复“如何缴物业费?如何参加党员活动?”等社区常见问题 , 大大节省了沟通的人工成本 。 教会“微微”向居民答疑解惑的 , 正是公司小伙伴们反复“投喂”的问题素材和标记训练 , 而与居民的实时交互数据 , 也会成为优化算法的一部分 。