ai技术|要做人工智能领域的扫地僧?苹果是如何低调玩转AI技术的( 六 )


无论如何 , 机器学习会带来一种非常真实且迫在眉睫的危险:破坏用户隐私 。 一些公司以机器学习和训练为理由 , 积极收集用户的个人数据 , 并将其上传到数据中心 。
正因为如此 , 苹果在用户本地设备上进行大量数据收集和处理 。 詹安德里亚明确地将这一决策与隐私问题联系起来 。 “我认为我们在这个问题上有一个非常明确的立场 , 那就是我们将在用户设备上尽可能多地使用这种机器学习先进技术 , 而且数据不会离开用户设备 , ”他说 。 “我们明确认为我们的设备更安全更好 , 或者应该更值得信任 。 ”
詹安德里亚以文字转语音举例:“如果你说 , ’请给我读一下鲍勃发来的信息 。 ’信息文本转语音是在本地设备的神经引擎上进行的 。 正因为如此 , 我们永远不会看到鲍勃发来的信息内容 , 因为是你的手机在读取信息 , 而不是服务器在读取 。 因此 , 该消息的内容从未到达服务器 。 ”
”所以这是一个很好的例子 , 说明先进技术实际上改善了实用性 。 因为语音是在本地设备上合成的 , 所以即使用户断开网络连接 , 它仍然可以工作 。 还有隐私问题 。 这真的很难做到 , 为了把现代高质量的文本到语音功能整合到一个可以装进口袋里的设备中 , 我们需要进行很多艰辛的工程 。 ”
当然在许多情况下 , 苹果必须使用一些用户数据进行机器学习 。 那么苹果到底是如何使用所处理的用户数据呢?詹安德里亚解释道:“一般来说 , 我们有两种构建模型的方法 。 一种是我们在合适情况下收集和标记数据 。 还有一种情况是 , 我们会请求用户捐赠数据 。 最著名的例子就是Siri , 当你设置iPhone时 , 我们会说 , ’你愿意帮助让Siri变得更好吗?’”
”在这种情况下 , 用户会将一定量的数据捐赠给我们 , 然后其中非常小一部分可能会用于训练 。 但是 , 诸如手写笔等很多应用大可以通过收集足够数据来进行训练 , 基本上不需要使用任何消费者数据就能处理每位用户的笔迹 。 ”
最近 , 苹果添加了一些请求使用用户数据的提示 。 去年夏天 , 一份报告显示 , Siri会记录用户在意外激活后的说话内容;负责Siri功能质量审核的第三方外包人员也听到了其中一些录音 。
作为回应 , 苹果承诺只在用户明确选择通过分享录音来改善Siri功能时才会存储与Siri相关的音频 , 并将所有的功能质量审核工作都放在了苹果公司内部进行 。 当问及苹果在数据处理上与外包商有什么不同时 , 詹安德里亚回答说:“我们有很多保障措施 。 例如 , 我们有一个确定音频是否与Siri有关的过程 , 这与实际听音频的过程是完全分离 。 所以我们在内部做了很多事情来确保我们没有收集任何意外的音频 。 ”