数据分析师必须知道的项目问题
根据我在工作和领导数据分析项目组方面的经验 , 有3个标准可以定义一个好的项目 。 这些是:
1.明确目标 。 如果你不理解问题 , 就无法解决 。 我们获得的大部分时间都是由普通人设计的 , 需求通常是含糊的 , 有时是基于幻想的 。 这是由于总体上缺乏有项目经验所致 。 大多数普通人既不了解数据分析也不了解项目概念 , 并且很难为他们要最终模型做什么提出清晰的规范 。 这会导致很多数据分析师不知道自己要的是什么 。 因此 , 为什么这是我的第一标准 。 在开始编写代码或寻找数据之前 , 你应该做的第一件事是定义项目的目标以及应该实现的目标 , 以避免与不良沟通有关的所有麻烦 。
文章插图
2.明确定义的成功指标 。 如果你是数据分析师 , 则可以将其视为损失函数 。 这基本上就是模型应具有的准确性 。 由于准确性和均方误差之类的东西是超级抽象的项目经理 , 因此客户通常很难决定如何衡量数据分析/ ML项目的成功 。 通常 , 你会听到非机器学习人员要求更高的准确性 , 而实际上诸如召回率之类的其他指标可能更重要 。 还需要对它们进行很好的定义 , 因为你可能最终出于错误的目的优化和构建模型 。
【数据分析师必须知道的项目问题】3.足够的高质量数据 。 我不记得有多少次客户来找我 , 要求我建立一个没有数据或数百个样本的模型 。 在大多数情况下 , 如果你从未从事过数据分析项目的工作 , 而这实际上很难决定所需的数据量 , 这并不是客户的错 。 对于数据分析专家而言 , 有时甚至对你公司的非技术经理而言更是困难重重 。 数据的重要性绝对不可低估 , 因为这是使模型变得更好的秘密所在 。 太少了会使你的模型平淡无奇 , 而太多的无目的项目会使企业方对你失去信心 。
- 查询|数据太多容易搞混?掌握这几个Excel小技巧,办公思路更清晰
- 黑莓(BB.US)盘前涨逾32%,将与亚马逊开发智能汽车数据平台|美股异动 | US
- 健身房|乐刻韩伟:产业互联网中只做单环节很难让数据发挥大作用
- V2X|V2X:确保未来道路交通数据交换的安全性
- 短视频平台|大数据佐证,抖音带动三千万就业,视频手机将成生产力工具?
- 权属|从数据悖论到权属确认,数据共享进路所在
- 统计|多久才能换一次手机?统计机构数据有点意外
- 发展|大数据解读世界互联网大会·互联网发展论坛!
- 网购|黑色星期五及网购星期一大数据出炉 全球第三方卖家销售额超48亿美元
- Veeam|Veeam让企业数据拥有“第二次生命”