大数据文摘▲入职第一年我都做了些什么?,从全栈工程师到数据科学家


大数据文摘▲入职第一年我都做了些什么?,从全栈工程师到数据科学家
文章图片
大数据文摘出品
来源:codebuildrepeat
【大数据文摘▲入职第一年我都做了些什么?,从全栈工程师到数据科学家】编译:徐玲、lin、夏雅薇
万事开头难 , 从一个软件开发程序员转型为数据科学家 , 第一年该怎么做?
一位博主就记录了自己从全栈工程师转行数据科学家第一年的心路历程 , 包括好的方面和不好的方面 , 希望能帮助到同样处境的人 。
大数据文摘▲入职第一年我都做了些什么?,从全栈工程师到数据科学家
文章图片
我觉得自己非常幸运雇主给了我一个机会 , 让我从一个全栈软件开发人员转型变成数据科学家 , 和内部数据团队一起工作 。
入职一年 , 我很享受这份工作给我带来的全新挑战 , 完全不同于以前做开发 。 我想写这篇文章 , 首先是为了回顾过去一年所做的事情:我经历的改变 , 我做得好的地方 , 我可以改进的地方 。 第二 , 通过记录我曾经遇到过的问题和挑战 , 我希望能帮助到和我处境相似的人 。
在开始之前 , 我先介绍一下我的背景:我之前不是做软件开发的 , 我拥有计算机科学的硕士学位和博士学位 。 因此 , 我不算冷启动 , 我有工具、模型和分析方法方面的相关经验 。 我从事开发工作将近8年 。 自从我的论文发表以后 , 我经历了很多变动 。
本文将分为两部分 。 进展顺利的部分和进展不佳的部分 。 对于那些只对结果感兴趣的人 , 也可以拉到底直接看最后的结论 。
进展顺利的方面
Python和R
刚开始 , 我不确定在项目中该使用Python或R 。 所以一开始我对这两种语言均作了研究学习 , 并在项目中结合使用了这两种语言 。
R经常让我想起Matlab , 两者在用来编写和执行代码的界面非常像(我尝试了RStudio和VisualStudio的R插件) , 同时写代码和处理数据的方法也很像 。
但我只在硕士论文中用了R , 还在博士学位论文中用了一些 。 除此之外 , R和其他编程语言相比(这些年来 , 我在软件开发中经常使用C#)就没什么共性了 。 R这个工具极度以数据为中心 , 与数据进行交互的方法也很不一样 。
在R里有:列表 , 矩阵 , 向量 , 数组和数据帧 。 每个都有不同的使用场景 , 你需要学会什么时候使用 。 R与C#的语法很不一样 , 所以刚开始学R我遇到了不小的困难 。 我并不是说R不好 , 只是我使用Matlab10年 , 并且作为开发我的脑子已经习惯了某种思维方式 , 所以比较难转变 。 所以我刚开始的时候觉得R很难上手 。
作为一名有8年C#开发经验的程序员 , 我觉得Python比R更容易起步 。 很可能是因为我的大脑已经习惯了C#的思维方式 。 python比R更接近于C# , 所以我学Python比R快很多 。
在使用这两个语言时 , 我没觉得两者有明显区别 , 尤其是对于可用的库 , 两者在我想做的工作的实现方面有差不多的处理能力 , 我也会得到相同的结果 。 但在摸索过程中 , 我对两个工具分别都有些困惑 。
总的来说 , 编程编久了 , Python对于我的程序员思维更友好 。
所以我很快放弃了学习R , 转而专注Python 。 这有助于我更快地进步 , 不必再花时间阅读新语法 , 事情变得简单许多 , 我一直觉得简单才是王道 。 这对我应对角色的许多其他变化也是有帮助的 , 因此 , 这样做可以最大程度地减少更改 。
关于使用哪种以及何时使用 , 我敢肯大家定对此有很多意见 , 但是对我来说 , 从开发人员过渡到数据科学家后 , 我发现Python变得更容易掌握和使用 , 尤其是在我担任新职位后想快速发展并取得成果的初期 。
所以与R相比 , 使用Python让我更快进入状态 , 在输出方面 , 我没有发现两者有任何明显区别 。 所以我把这个归类为进展顺利 , 因为我很早做出了决定 , 且至今没有遇到任何情况让我觉得自己选错了Python , 相反我节省了不少时间 , 所以我能更快地开始工作 。