对抗仇恨言论,Facebook推出看得懂
Facebook宣布开发出了一款名为Rosetta的新型人工智能(AI)系统,可用于检测图片和视频帧(videoframe)中的仇恨性言论。
对于Facebook来说,他们面对的是每月22亿用户发布的浩如烟海的信息,这其中不仅有文本,还有图片、视频、表情包等等——仇恨言论可能会在其中以任何形式出现。Facebook称,Rosetta可以读懂图片和视频帧上的影像和文字,分辨其是否是违反Facebook内容审核指南的内容。
Rosetta检测示例图来源:Facebook
Facebook官方展示了一张示例图。在检测一张印着“企鹅会飞”(penguinscanfly)的文字的企鹅图片时,Rosetta将文字与图像区分开来,并使用卷积神经网络来识别和转录两部分的内容,最终判断出这是一张“表情包”(meme)。
对于一直因难以有效控制仇恨言论传播而饱受指责的Facebook来说,这一系统的推出将有助于缓解其燃眉之急。
自年以来,Facebook一直在使用一种名为光学字符识别(OCR)的检测系统,但OCR在检测仇恨言论的能力上稍逊一筹。具体差在哪,从Facebook今年5月公布的《社区标准实施报告》结果中就能看出。
这份报告公示了Facebook今年一季度删帖、封号的记录。在他们删除的所有内容中,“裸体和性”占到了72.7%,“图片暴力”占到了11.8%,而“仇恨言论”只有8.7%。
一季度受到Facebook处理的仇恨言论只有万条,是所有类别中数目最小的一个。而且,其中Facebook自主检测的内容只占到了所有被标记内容的38%,有超过60%的内容需要靠用户举报来发现,让人怀疑是否有更多的内容还隐在暗处未被揪出。
这其中的原因,一部分是因为“Facebook的人工智能系统目前仍然难以辨别言论中的仇恨情绪。”Facebook产品管理副总裁GuyRosen说。另一部分原因是Facebook上的仇恨言论本身可能并不那么显而易见。
今年4月,Facebook上的一些不实信息助长了斯里兰卡佛教徒和穆斯林之间的冲突。罪魁祸首其实往往是一些带有煽动性质的谣言,起初可能和仇恨与偏见并无瓜葛。内容本身已经足够具有迷惑性,更不用说OCR能够理解的语言还非常有限,在很多小语种地区Facebook还需要依赖当地人工审查员来分辨内容。
马克·扎克伯格在国会证词中表达了将来使用AI来清除其平台上的仇恨言论的计划:“我乐观地认为,在五到十年的时间里,我们将拥有一些人工智能工具,可以深入了解不同类型内容的语言细微差别,以便更准确。”
Rosetta就是在此关头临危受命的AI系统了。据Facebook介绍,这一系统同时适用于Facebook和Instagram,每天可以检测十亿张图片,并识别除了英语和拉丁语系以外的语种,比如阿拉伯语和印度语等。
目前,Facebook和Instagram团队已经开始使用Rosetta。该公司计划继续增加它可以理解的语言数量,并使其能更好地从视频帧中提取文本。
说到语言,Facebook最近还为其自动翻译服务增加了24种新语言,包括塞尔维亚语,白俄罗斯语,马拉地语,僧伽罗语,泰卢固语,尼泊尔语,卡纳达语,乌尔都语,旁遮普语,柬埔寨语,普什图语,蒙古语,祖鲁语,科萨语和索马里语。Facebook称,这些语言的翻译尚处早期阶段,可能会包含很多错误,公司正在完善它们,并会在未来加入更多语种。
题图/visualhunt
转载请注明:http://www.mengdejiexix.com/lxjj/11202.html