服务器|让数据中心运行更稳定,AI也是个能手

Equinix可能算不上知名,但他们的服务却支撑着总值数万亿美元的全球网络商务体系。这家总部位于加利福尼亚州红木城的企业拥有720亿美元市值,去年收入总额达60亿美元,在26个国家/地区运营着由220多处数据中心构成的全面基础设施网络。
服务器|让数据中心运行更稳定,AI也是个能手
文章插图
图:Milind Wagle, Equinix公司CIO
客户使用这些数据中心提供的大量服务器(总面积达240多万平方米)存储并处理在线业务所必需的海量数据。此外,客户还可以通过Equinix管理的近40万条光纤链路在自有服务器及其他企业的服务器间传输数据,享受通畅便捷的互连支持。
Milind Wagle于2016年9月出任Equinix公司CIO,在他看来,“我们已经成为数字化经济的引擎室。毕竟互联网总要有物理基础才能构成并保持运行,而这种基础正是数据中心。”
由Equinix公司负责运营的基础设施,以及Digital Realty Trust与CyrusOne等竞争对手提供的服务资源,并不会直接出现在客户们的视野当中。但这些设施的故障却很可能造成严重破坏:本月初,另一家网络骨干企业Fastlyl就遭遇事故,导致涉及亚马逊、《纽约时报》以及福布斯等客户在内的多个网站受到影响。虽然事件本身受到高度关注,但还有很多人们根本感受不到的严重问题,而Wagle等技术高管也一直在寻求增强网络弹性的方法。
前瞻性思维
与其他竞争对手一样,Equinix公司也需要衡量数据中心内的服务器何时可能达到用量上限、何时需要购买土地并规划新的数据中心建设、新的设施可能需要多少电力。Wagle解释道:“准确预估数据中心的电力消耗与空间占用量,是一项非常重要的工作。”根据Equinix的数据,可容纳数千台服务器的数据中心往往需要投入上亿美元,而实际费用取决于具体位置、当地电价、所选设备以及硬件配置。
此外,数据中心企业还需要认真考虑设计远期电力采购合同,这是因为每处数据中心都会消耗掉数兆瓦的电力,而任何计算错误都可能带来巨大代价。Equinix公司的发言人还分享了一份硅谷数据中心合同示例,其中包含一项每月22万3千美元的罚款条文,强调该中心的预期用电量不得低于承诺使用量3兆瓦。
Wagle认为,准确预估数据中心的电力消耗与空间占用量,是一项非常重要的工作。因此,长期以来,Equinix公司一直通过规划流程、手动电子表格和专职规划人员回顾历史趋势,并结合来自客户渠道的信息对未来需求做出明确估计。但随着业务的发展,这项工作变得越来越复杂。为此,Wagle团队开始寻求AI技术的新应用,希望开发出算法以协助Equinix规划人员提高工作效率、增强预测水平。
但早期结果却给了大家当头一棒。Wagle回忆道:“最初大家的兴致不高,多数员工都对此抱有怀疑态度,我们的模型也并不是百分之百准确。”但在探索当中,他也体会到AI技术的巨大潜力,力主给团队预留更多时间。他坚定地认为,算法以及来自客户渠道及历史使用模式的大量数据,正是公司实现规划流程升级的关键所在。
Wagle的IT团队发现,其AI模型在早期预测需求方面之所以表现不佳,一个重要原因在于部分输入信息本身不够准确。为此,他开始说服同事们共同参与,帮助他广泛改善整个企业之内的数据质量。
服务器|让数据中心运行更稳定,AI也是个能手】不少业内人士认为,此次事件也是Wagle赢得反对者们信任与支持的重要节点。曾在Web域名注册服务商Verisign与Wagle共事的Brian Lillie表示,“他的意志非常坚定。只要是他看准的事,他总能迸发出强大的意志力与工作热情,务必要把反对者拉到自己这边。”也正是凭着对他的了解,Lillie才决定邀请Wagle加入Equinix并担任CIO职务。
AI探索
Wagle还表示,Equinix公司现在已经全面推开了使用AI推动设施规划的新思路。“这给我们带来了一种极具价值的建模工具,我们可以预测数据中心容量会在多久之后被彻底耗尽,借此做出更好的供应链决策。”这些模型还帮助Equinix更有针对性地优化自身电力消耗,尽可能改善业务的环境可持续性。
他的团队也一直尝试在其他领域引入AI技术。在销售方面,他们建立起新模型以识别并吸引新客户。这套模型吸纳约100种不同的输入指标,包括目标企业的财务状况与预期增长轨迹等。他们还使用AI技术推动工作流程自动化,包括与内部财务团队合作开发算法,将每年需要处理的手动审批工作量缩减至约三分之一。
服务器|让数据中心运行更稳定,AI也是个能手