人工智能|人工智能正在冲击整个新闻行业


早在2014年 , 《洛杉矶时报》就在地震发生的三分钟之后发表一篇报道 。 这一壮举的实现 , 源自该报社某位员工开发的Quakebot机器人(一款软件机器人) , 其能够根据美国地质调查局发布的数据自动编写文章 。 时至今日 , 每周多达数十万篇主流媒体发表的文章都出自AI技术之手 。

人工智能|人工智能正在冲击整个新闻行业
本文插图
【人工智能|人工智能正在冲击整个新闻行业】起初 , 生成这类文章的大多数自然语言生成(NLG)工具主要由Narrative Science等软件企业提供 。 但越来越多的媒体组织开发出适合自身需求的内部版本 。 BBC拥有Juicer , 《华盛顿邮报》拥有Heliograf , 彭博社发布的近三分之一内容都来自一套名为Cyborg的系统 。 这些系统以数据为起点 , 通过图形、表单与电子表格进行内容分析 , 提取特定事实 , 并将其作为叙述的构成基础 。 他们还为文章制定结构规划 , 最后使用自然语言生成软件将一个个句子填充到框架中去 。
这些系统只能依靠高度结构化的数据作为输入 , 据此生成文章——适用的数据类型包括足球比赛视频、或者企业年报中的电子表格数据等 。 可以肯定的是 , 它们写不出需要天赋、想象力或者深入分析的文章 。 结果就是 , 这类系统的出现并没有替代成千上万采访人员相反 , 它们让采访人员的日常工作更轻松、也让以往某些因受众过少而鲜有报道的领域得到媒体关注 。
正如《经济学人》杂志高级编辑Kenn Cukier所言 , “我们必须坦言:这类系统出现之后 , 最大的受益者是公众 , 而不是新闻从业者 。 但我们在打字机刚刚出现的时代没有拘泥于羽毛笔 , 现在也不应该对AI写手过分抵触 。 这一切都是为了在小众市场上建立起规模化效应 , 否则单靠人力将永远无法实现成本效益 。 ”
当计算机拥有自己的观点
作为前BBC采访人员 , Cait O’Riordan如今担任《金融时报》的首席产品与信息官 。 她坚信 , 在可预见的未来 , 文章生成系统并不会取代人类新闻工作者:“人类读者希望看到意见控制分析 , 而不仅仅是算法处理后的结构化数据 。 ”她当然承认 , IBM的Debater项目等系统已经能够很好地模拟人类分析观点 , 但在她看来“如今媒体行业并不缺观点 , 真正缺少的是精彩的观点 。 在这方面 , IBM还有很长的路要走 。 ”Martin Wolf与Yuval Harari这样的一流采访人员不太可能被AI系统所取代而且真正的问题在于 , 随着观点的泛滥 , 新的意见领袖似乎越来越难以出现 。
另一个有趣的可能性在于 , 文章将针对特定的小众群体量身定制 , 并最终让每个人都拥有适合自己的报道可看 。 例如 , 如果某家研究组织宣布调整汽车胎压最多可将行驶油耗降低7% , 那么读者可以根据自己的具体车型、每周行驶里程数甚至是驾驶风格来获取更有针对性的参考内容 。 “我的日常新闻”这个想法已经存在多年 , 谷歌新闻等多种服务一直在以比较简陋的方式努力达成这个目标 , 包括帮助用户管理最适合其口味的新闻报道 。 未来 , 哪怕只有一位读者感兴趣 , 媒体也许都有能力为其提供定制化的报道文章 。
运用AI发现趋势与偏见
《金融时报》使用AI技术解决的另一大难题 , 在于发现经济体之内与市场当中的种种趋势 。 作为一家英国媒体 , 《金融时报》自身的内容就很适合进行这类分析 , 并结合其他数据源给出令人眼前一亮的汇总性结论 。
《金融时报》还使用机器人帮助自身解决偏见问题 。 以美联储前任主席Janet Yellen命名的Janetbot系统 , 能够分析报道中所出现面孔的性别比例 。 遗憾的是 , 这套使用新闻行业大规模照片样本训练而成的模型目前已经暂停使用 , 理由是该样本缺少种族差异性、不足以对图像中的性别做出可靠检测 。分页标题
订阅模式
当然 , 《金融时报》并不属于常规报刊 。 当陈旧的展示性广告与分类宣传在数字时代下难以继续发挥作用时 , 《金融时报》通过推出付费专区创下媒体转型的首个成功案例 。 近年来 , 他们还朝着订阅收入模式发展 。 《金融时报》创新编辑John Thornhill的格言是 , 只有两种人愿意为准确的新闻资讯付费:一种是投资者 , 一种是间谍 。 前者希望借此避免错误的投资 , 后者希望避免错误的打击指令 。 他认为《金融时报》的主要受众是前者 , 但谁也没法保证间谍们不会渗透进来……
考虑到准确性的重要意义 , 《金融时报》一直在寻求方法以发现并纠正各种错误 。 其系统能够跟踪读者与文章间的交互 , 同时监控他们的反馈 。 Thornhill表示 , 这有点像是在对用户的“家庭作业”进行AI标记:很有价值 , 但也会让很多人感到不自在 。 不过这也是目前最强大的错误检测机制——凭借读者们的强大头脑与知识储备 , “如果我们的哪篇文章中存在谬误 , 大家在几分钟内就能将其发现 , 并提供反馈信息供我们参考 。 ”
标题党
Buzzzfeed与MailOnline属于Daily Mail的在线版本 。 作为在数字时代下获得广泛成功的另一种前所未有的新闻媒体类型 , 其成为全球阅读量最大的英文报纸网站 , 但维基百科却禁止将其作为参考源 。 这是因为此类网站会使用程序化的广告宣传 , 通过种种方式诱导读者打开链接、阅读文章 , 并由此产生每次点击(CPC)收益 。 事实上 , 他们的策略就是疯狂打擦边球 , 为了点击率毫无下限 。
这门生意其实并不稳定 。 如果单纯响应用户倾向数据提供内容 , 那么网站发布的新闻很可能一直在不断重复 。 真正新鲜有趣且充满创意的原创作品 , 反而会被忽略掉 。
为了对抗标题党问题 , Facebook会频繁修改其CPC算法 , 以防止被他人所滥用 。 在Cambridge Analytica事件之后 , Facebook大大减少了对严肃新闻的发布 , 开始着力传播由用户自己上传的个人新闻与八卦资讯 。
营销分析与机器人流程自动化
为了继续保持良好运营 , 《金融时报》还在使用数据分析改善自身销售能力 。 以往 , 他们只能向伯明翰宿舍里的学生与硅谷科技企业CEO发送相同的新闻内容 。 但如今 , 该公司使用机器学习为不同用户推送更有针对性的优秀资讯 。 为了保质保量实现这个目标 , 各项相关任务与活动都需要以自动化形式推进 。 机器人流程自动化(RPA)能够加快并改善市场报告的生成速率、充实客户数据库并快速对客户查询做出响应 。 总而言之 , 把适合机器人的工作交给机器人 , 已经成为当今企业管理的前提与基础 。