业界 | 亚马逊AWS Re:Invent大会推出首款深度学习无线摄像机AWS AWS DeepLens 是世界上第一款深度学习

选自nlp.hivefire

机器之心编译

参与：刘晓坤、黄小天

AWS DeepLens 是世界上第一款深度学习型无线摄像机，可为开发者提供机器学习的实践经验。Amazon SageMaker 是为开发人员和数据科学家提供的全托管式服务，可以快速构建、培训、部署和管理自己的机器学习模型。Amazon Transcribe、Amazon Translate、Amazon Comprehend 和 Amazon Rekognition Video 允许应用程序开发人员轻松构建将语音转录为文本的应用程序，翻译不同语言的文本，从文本中提取见解以及分析视频。

Amazon SageMaker 使得机器学习模型的构建、训练和部署更加简单

今天在 AWS Re：Invent 现场，亚马逊旗下公司 AWS (NASDAQ: AMZN) 宣布推出 5 项机器学习新服务，以及一款面向开发者的深度学习型无线摄像机。Amazon SageMaker 是为开发人员和数据科学家提供的全托管式服务，可以快速构建、培训、部署和管理自己的机器学习模型。AWS DeepLens 是一款深度学习型无线摄像机，可以运行实时计算机视觉模型，为开发者提供机器学习的实践经验。而且，AWS 还宣布了 4 项新的应用服务，允许开发人员构建仿效人类认知的应用程序：Amazon Transcribe 将语音转换为文本；Amazon Translate 可以翻译不同语言之间的文本；Amazon Comprehend 能够理解自然语言；Amazon Rekognition Video 是一种新的计算机视觉服务，可以批量实时分析视频。要了解有关 AWS 机器学习服务的更多信息，请访问：http://aws.amazon.com/machine-learning.com。

AWS DeepLens

Amazon SageMaker 和 AWS DeepLens 使得所有开发者都可以使用机器学习

如今，实现机器学习非常复杂，涉及到大量的试错，并需要专门的技能。开发人员和数据科学家必须首先对数据进行可视化、转换和预处理，以将其转化为可以被算法用来训练模型的格式。即使是简单的模型也需要巨大的算力，并耗费大量时间进行训练，公司可能需要雇佣专门的团队来管理涵盖多个 GPU 服务器的训练环境。训练模型的所有阶段（从选择和优化算法到调试影响模型准确性的数百万参数）涉及大量的人为努力和假设。然后，在应用程序中部署已训练模型需要在应用程序设计和分布式系统方面具备一系列不同的专业技能。随着数据集和变量的增长，客户不得不一再重复这个过程，因为模型已经过时了，需要不断地重新训练，以便从新信息中学习和进化。所有这些都需要大量的专业知识、巨大的算力和存储以及大量的时间。迄今为止，机器学习对于大多数开发人员来说是遥不可及的。

Amazon SageMaker 是一项全托管式服务，可以消除机器学习过程中每一步的繁重工作和假设。它通过提供预先构建的开发 notebook，针对 PB 级数据集进行优化的常用机器学习算法以及自动模型调优，使得建模和训练变得更加简单。Amazon SageMaker 还大大简化和加速了训练过程，自动化配置和管理基础设施以训练模型和运行推理做出预测。AWS DeepLens 的设计从头开始，旨在帮助开发人员通过将物理设备与大量教程、示例、源代码以及与熟悉的 AWS 服务集成进行配对，获得构建、训练和部署模型的实践经验。

「我们最初的 AWS 愿景是让世界上（包括宿舍或车库）的任何个人都能像巨头公司那样获得相同的技术、工具、规模和成本结构。我们的机器学习愿景也不例外，」AWS 机器学习副总裁 Swami Sivasubramanian 说。「我们希望所有的开发人员能够更加广泛和成功地使用机器学习，而不管他们的机器学习技能水平如何。Amazon SageMaker 消除了机器学习中涉及的许多麻烦和复杂性，使开发人员可以轻松上手，并成为构建、训练和部署模型的能手。」

通过 Amazon SageMaker，开发者可以：

轻松构建拥有效能最优化算法的机器学习模型：Amazon SageMaker 是一个全托管式的机器学习 notebook 环境，可以使开发者轻松地探索和可视化他们保存在 Amazon Simple Storage Service（Amazon S3）上的数据，并可使用所有流行的库、框架和接口转换数据。Amazon SageMaker 包含 10 种最常用深度学习算法（例如，k-均值聚类、分解机、线性回归和主成分分析），并经过 AWS 最优化从而可以获得比标准实现快 10 倍的运行速度。开发者只需要选择一个算法并指定数据来源，Amazon SageMaker 就会安装和配置相应的驱动和框架。Amazon SageMaker 原生集成了 TensorFlow 和 Apache MXNet，很快将添加对其它框架的支持。开发者也可以指定自己选择的任何框架和算法，只需把它们上传到 Amazon EC2 Container Registry 的一个容器。

快速的全托管训练：Amazon SageMaker 使训练过程变得简单。开发者只需要选择 Amazon EC2 实例的类型和数量，并指定数据的位置。然后 Amazon SageMaker 将建立分布式计算集群，进行训练，并把结果输出到 Amazon S3，完成之后解散计算集群。Amazon SageMaker 可以通过超参数优化自动地调整模型，调整数千种不同的算法参数的组合以达到最准确的预测结果。

一键将模型部署到产品中：Amazon SageMaker 针对的是实例的应用、模型的部署、为应用构建可靠的 HTTPS 端点（end-point）以获得高传输率和低延迟的预测，以及将 Amazon EC2 的实例自动扩充到多重可用区（multiple availability zones，AZs）。它还提供了对 A/B 测试的原生支持。一旦部署到产品上，Amazon SageMaker 就能消除由机器学习基础建设管理、健康检查执行、安全补丁应用以及其它日常维护管理带来的繁重工作。

通过 AWS DeepLens，开发者可以：

获得亲自动手机器学习的经验：AWS DeepLens 是新一类的产品：可以执行深度学习的完全可编程摄像机，其设计的目的就是为了把深度学习送到每一个开发者手上（没错，就是字面上的意思）。AWS DeepLens 包括一个高清摄像机，内置了可以实时运行复杂深度学习计算机视觉模型的机载计算机。其中专门设计的硬件可以每秒运行超过 1000 亿次深度学习运算，自带了示例项目、示例代码和预训练模型，因此即使是没有机器学习经验的开发者也可以在 10 分钟之内运行自己的第一个深度学习模型。开发者可以进一步使用 AWS Lambda 函数创建自定制的、深度学习驱动的项目。例如，可以对 AWS DeepLens 编程以识别车牌号码，并触发家庭自动化系统打开车库的门，或者识别跑到沙发上的狗然后给主人发消息提醒。

在云中训练模型并将其部署到 AWS DeepLens：AWS DeepLens 与 Amazon SageMaker 集成，以便开发人员可以使用 Amazon SageMaker 在云中训练其模型，然后只需在 AWS Management Console 中点击几下便可将其部署到 AWS DeepLens 中。摄像机将在设备上实时运行模型。

新的语音、语言和视觉服务使应用程序开发人员能够轻松打造智能应用程序

对于那些不是机器学习专家，但有兴趣使用这些技术构建展现人类一般的智能的新应用开发者，Amazon Transcribe、Amazon Translate、Amazon Comprehend 和 Amazon Rekognition Video 提供了高质量、高精确的具有可扩展性和成本效益的机器学习服务。

「如今，客户使用亚马逊简易存储服务（Amazon S3）作为可扩展、可靠和安全的数据湖，存储的数据比以往任何时候都多，他们希望将这些数据为公司和客户所用，因此需要容易上手的工具和技术开启数据中的智能，」AWS 机器学习副总裁 Swami Sivasubramanian 表示，「我们很高兴能够提供 4 种全新的机器学习应用服务，以帮助开发人员立即开始创建新一代的智能应用程序，可以看到、听到、说话，并与周围的世界进行互动。」

Amazon Transcribe（可用预览版本）将语音转换为文本，允许开发人员将存储在 Amazon S3 中的音频文件转换为准确、完整的标点符号文本。Amazon Transcribe 已接受训练，可高度准确地处理低保真音频，如联络中心的录音。Amazon Transcribe 可以为每个单词生成一个时间戳，以便开发人员可以精确地将文本与源文件对齐。目前，Amazon Transcribe 支持英语与西班牙语，后续会支持更多语言。在未来的几个月，Amazon Transcribe 将能够识别音频文件中的多个扬声器，并且还将允许开发人员上传自定义词汇表，以便为这些词语进行更精确的转录。

Amazon Translate（可用预览版本）使用当前最佳的神经机器翻译技术提供两种语言之间的高准确率的文本翻译。Amazon Translate 可以翻译短文本和长文本，并支持英语对其它六种语言（阿拉伯语、法语、德语、葡萄牙语、简体中文和西班牙语）的翻译，到 2018 年会支持更多类型。

Amazon Conprehend（可用）可以理解自然语言文本，包括文档、社交网络博客、文章或任何其它保存在 AWS 的文本数据。Amazon Conprehend 使用深度学习技术识别文本实体（例如，人物、地点、日期、组织）、文本使用的语言、文本表达的情绪，以及概念、形容词的关键词语（例如，漂亮的、温暖的或晴朗的）。Amazon Comprehend 已经经过了广泛的数据集的训练（其中包括 Amazon.com 上的产品描述和用户评价），以建立从文本中提取关键特征的最佳语言模型。它还拥有对标题进行建模的能力，可以帮助应用从文本的主体中提取常用的标题。Amazon Comprehend 还整合了 AWS Glue 以允许对保存在 Amazon S3、Amazon Redshift、Amazon Relational Database Service（Amazon RDS）、Amazon DynamoDB 或其它常用的 Amazon 数据源上的文本数据进行端到端的分析。

Amazon Rekognition Video（可用）可以在保存在 Amazon S3 的几百万部视频中追踪人、检测活动，以及识别目标、面部、名人和不宜内容。它还可以对直播视频实时识别数百万张人脸。Amazon Rekognition Video 的易用 API 由计算机视觉模型驱动，这些模型被训练用于准确检测数千个目标和活动，并可以从直播视频流和保存在 Amazon S3 上的视频内容中提取基于运动的语境。Amazon Rekognition Video 可以自动地为视频的特定部分加上标签以及标记位置（例如，海滩、太阳、儿童），检测活动（例如跑步、跳跃、游泳），检测、识别和分析人脸，追踪多个人（即使他们在视频中被部分隐藏）。业界 | 亚马逊AWS Re:Invent大会推出首款深度学习无线摄像机AWS

原文链接：http://nlp.hivefire.com/articles/share/90598/

本文为机器之心编译，转载请联系本公众号获得授权。

?------------------------------------------------

加入机器之心（全职记者/实习生）：hr@jiqizhixin.com

投稿或寻求报道：content@jiqizhixin.com

广告&商务合作：bd@jiqizhixin.com