互联网广告内容审核专题(二)——机器审核( 二 )


互联网广告内容审核专题(二)——机器审核】那在面对一张新图片时,索引库中如有与之相似的特征,即可以进行识别判断。作者对于图像识别研究并不深入,不作更多妄论。
3. 音频识别asr语音识别技术,将音频转换为文字后进行识别。
首先对音频进行预处理,提取音频的特征。特征提取出来后,建立索引库存放特征。在面对一段待识别的语音时,将其与索引库中特征进行匹配,输出识别的结果。
音频识别与同为多媒体元素的图片识别,基本的原理是一样的,都是提取特征、建立索引库存储、特征匹配这三大过程。
4. 视频识别视频审核目前主要以视频切帧的方式,将视频切成一张张的图片,再按照图片识别的方式进行审核。
三、总结可以看到,相较于机审规则,模型的识别范围更加广泛,识别能力更加强大。但在实际机器审核中,通常是规则和模型组合拳的方式使用。
原因在于,模型的研发需要更加海量的数据和极细粒度的标准,并经过严格的线上测试,准召率达标后才能够上线使用。而机审规则不需要研发,通常配置即可生效,是一种实时服务。
对于紧急风险来说,最合适的办法是使用机审规则应急,同时进行模型研发,以最大程度降低风险影响。
当然机器算法的识别能力也是有限的,除了准召率的问题外,对于某些场景几乎不适用。
比如直播的审核,对时效性要求极高。如使用视频切帧、音频识别的方式,直播画面结束还没审核完成,远远达不到风险管控的目的。因此通常使用人工审核,盯在直播间前防止风险突发。
本篇文章的内容就到这里,关于更多的审核模式、审核机制、审核业务管理方式等会在后续文章中继续和大家分享!欢迎大家一起探讨!
本文由 @声生 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议