『埃尔法哥哥』2020年技术领导者需要关注的5个关键领域( 三 )


『埃尔法哥哥』2020年技术领导者需要关注的5个关键领域
本文插图
图6. O'Reilly在线学习平台上的基础架构和运营主题 , 在2019年使用率最高(左) , 每个主题的变化率(右) 。
基础架构和操作的出现表明组织可能在扩展 DevOps方面遇到困难 。 DevOps旨在培养能够在系统“ 堆栈 ”的每个层中胜任工作的程序员 。 但是在实践中 , 开发人员倾向于减少对DevOps运营组件的投入 , 这一事实催生了站点可靠性工程(SRE)的思想 。 即使“全栈”开发人员不是独角兽 , 她当然也不是司空见惯的 。 组织将基础架构和操作视为实用的 , 以操作为重点的补充 , 可从DevOps容易失败的地方准确地接手 。
深入了解数据 , AI和ML主题
与数据相关的主题的结果既可预测 , 又无可避免地令人困惑 。 从数据工程开始 , 所有数据工作的基础(该类别包括涵盖数据管理的标题 , 即关系数据库 , Spark , Hadoop , SQL , NoSQL等) 。 总体而言 , 2019年数据工程使用量下降了8% 。 2018年下降了3% 。 这两年都是由于数据管理职称使用量下降所致 。
当我们更具体地关注数据工程主题(不包括数据管理)时 , 我们看到的份额很小 , 但使用率稳步增长 , 2018年增长了7% , 2019年增长了15%(见图7) 。
在广泛的“数据”主题中 , 数据工程(包括数据管理)仍是该主题中占有最大份额的主题 , 在平台上的所有使用中占约十二分之一 。 这几乎是数据科学主题的使用份额的两倍 , 数据科学主题的使用份额在2018年下降了(-2%)之后在2019年增长了(+ 5%) 。
在其他地方 , 对ML和AI的兴趣一直在增长 , 尽管速度有所下降 。 举个例子:2019年 , ML / AI组合主题的使用量增长了7% , 约为其2018年增长的一半(+ 13%) 。
『埃尔法哥哥』2020年技术领导者需要关注的5个关键领域
本文插图
图7. O'Reilly在线学习平台上的数据主题(2019年使用率最高)(左)和每个主题的变化率(右) 。
具有讽刺意味的是 , 在特定于数据的主题中 , ML / AI的优势可能没有在其他主题领域(例如编程语言)中那么明显 , 在编程语言中 , Python使用的增长在很大程度上受到该语言对ML的实用性和适用性的驱动 。 但是自然语言处理(NLP , 2019年增长22%)和神经网络(增长17%)等与ML / AI相关的主题的使用量也强劲增长 。
数据工程作为一项任务当然并没有减少 。 对数据工程的兴趣也可能不会下降 。 如果有的话 , 数据工程和ML / AI都将数据工程作为一个实践领域包含在内[3] 。 我们从其他研究中知道数据科学家 , 机器学习和AI工程师等在工作中花费大量时间来发现 , 准备和设计数据 。 我们已经看到 , 流行的工具和框架通常以自动化/引导式自助功能的形式 , 或者(对于Jupyter和其他笔记本而言)具有构建和编排调用Python的数据工程管道的能力 , 从而通常包含数据工程功能 。, R(通过Python)等库 , 以同时或(如果可能)并行运行数据工程作业 。
与老式数据工程相对应的术语(例如“关系数据库” , “ Oracle数据库解决方案” , “ Hive” , “数据库管理” , “数据模型” , “ Spark”)按年下降 , 在2019年 。 部分下降是由于更大的市场驱动因素所致 。 从我们的研究中我们知道Hadoop及其相关项目的生态系统(例如Hive)正处于持续多年的长期衰退之中 。 这种下降在我们的使用量数据中得到了证实:Hadoop(-34%) , Hive(也为-34%)甚至Spark(-21%)均同比大幅下降 。
我们在对O'Reilly Strata会议发言人提议的分析中 , 更详细地讨论了造成这种下降的可能原因 。
云持续攀升
尽管O'Reilly在线学习的速度较慢 , 但对与云相关的概念和术语的兴趣仍在不断增长 。 从2017年到2018年 , 与云相关的使用量激增了35%; 在2018年至2019年期间 , 它的增长率不到一半(17%) 。 这种放缓表明云作为一个类别已经取得了很大的份额 , 因此(从数学上)任何其他增长都必须以较慢的速度发生 。 就云而言 , 虽然增长速度较慢 , 但仍然强劲 。