仇恨|Facebook:正利用AI更好处理平台仇恨言论问题

据外媒报道,Facebook表示,他们正在使用人工智能(AI)技术主动检测出更多的仇恨言论。周四发布的一份新透明度报告则更详细地说明了该公司于今年早些时候公布政策变化后其社交媒体上的仇恨情绪情况,不过报告中仍对一些重大问题没有做出回答。
Facebook的季度报告包括了仇恨言论盛行的新信息。该公司估计,Facebook用户看到的内容中有0.10到0.11%违反了仇恨言论规定,相当于“每1万次浏览内容,就有10到11次会看到仇恨言论”。这是基于帖子的随机样本,其衡量的是内容的范围而非单纯的帖子数量。不过它还没有得到外部资源的评估。Facebook负责诚信的副总裁Guy Rosen在跟采访人员的电话交谈中表示,公司正在计划并努力进行一次审计。
Facebook坚称,在用户举报之前,它会主动删除大多数仇恨言论。该公司表示,在过去三个月里,Facebook和Instagram上约95%的的仇恨言论被删除是他们主动进行的。
仇恨|Facebook:正利用AI更好处理平台仇恨言论问题
文章插图
这跟它最初的努力相比是一个巨大的飞跃--在2017年底,它仅主动删除了约24%的数据。另外,Facebook还加大了删除仇恨言论的力度:在2019年第四季度,约64.5万条内容被删除,而在2020年第三季度,这个数字则飙升到了650万。有组织的仇恨组织被归为一个独立的温和类别,其增长幅度则要小得多,从139,900个增加到224,700个。
Facebook表示,其中一些被取消的原因是AI的改进。今年5月,Facebook发起了一项研究竞赛,其目的是研究能更好地检测“仇恨网络迷因”的系统。在其最新的报告中,该公司就提到了自己能同时分析文字和图片、捕捉像下面展示的图像宏等内容。
仇恨|Facebook:正利用AI更好处理平台仇恨言论问题
文章插图
然而这种方法有明显的局限性。正如Facebook所指出的,一个新的仇恨言论可能跟之前的不一样,因为它引用了一个新的趋势或新闻故事。这取决于Facebook对多种语言的分析能力和捕捉特定国家趋势的能力以及Facebook对仇恨言论的定义,这个类别随着时间的推移已经发生了变化。例如,大屠杀否认上个月才被禁止。
另外,它也不一定会帮助到Facebook的版主,尽管最近有了一些变化,但新冠病毒大流行扰乱了Facebook的正常审核程序,因为它不允许审核人员在家中查看一些高度敏感的内容。Facebook在其季度报告中表示,由于AI的作用,其减少的数字正在回到大流行前的水平。
但一些员工抱怨称,他们被迫在安全之前返回工作岗位,为此,有200名内容管理员签署了一份公开请求,要求获得更好的新冠病毒保护措施。在那封信中,版主说自动化未能解决严重的问题。“AI不能胜任这项工作。重要的演讲被扫进了Facebook的过滤器里,而像自残这样危险的内容却被保留了下来,”他们说道。
Rosen则不同意他们的评估并表示Facebook的办公室满足或超过安全工作空间的要求。他表示:“这些都是极其重要的工作人员,他们在这项工作中扮演着极其重要的角色,我们在AI方面的投资正帮助我们检测和删除这些内容以保障人们的安全。”
仇恨|Facebook:正利用AI更好处理平台仇恨言论问题】Facebook的批评者包括美国的立法者可能仍不相信它捕获了足够多的仇恨内容。上周,15名美国参议员向Facebook施压,要求其回应攻击全球穆斯林的帖子,同时还要求其提供更多具体国家的信息以此来说明其温和做法和仇恨言论的目标。Facebook CEO马克·扎克伯格在参议院听证会上为公司的适度做法辩护,其暗示Facebook可能会在未来的报告中包括这些数据。