可视化|以互联网行业为背景下的数据分析通识(中)( 三 )

2. 数据收集数据是一切分析的基础,一般情况下,每个公司都有自己的一些服务器和数据库或者运营后台。而数据收集的程度和准确性往往就决定了数据分析结果的可靠性和有效性。
3. 数据清洗收集好以后,我们需要对数据去做一些清洗。因为很多数据有问题,不准确的数据分析出的结果毫无价值意义。比如 数据残缺(空数据)、数据错误、数据重复、数据异常等问题,我们都需要对这些数据进行清洗。
4. 数据分析在数据进行简单的清洗后,我们就需要去做一些数据分析了。
即通过一系列的数据分析方法从数据得到可以回答需求的答案,根据分析需求以及目的,围绕是多少、是什么、为什么、会怎样、又如何来展开,通过进行描述性分析、诊断、用户分类/分层、预测等分析方法,对数据进行分析。
1)是多少、是什么:描述性分析,评估业务现状
描述性分析主要是将基础数据进行汇总,并转化为便于理解的形式,清晰地展示目前的业务是怎么样的,例如各种周月报表、图表等。通过描述性分析可以快速评估业务特征,以及找到分析的方向。通过观察数据的分布情况、 业务指标的波动情况,从中找到出现异常的数据,并分析出异常现象的原因。
2)为什么:相关性分析,找到关键因素,进行指标拆解
基于描述分析进行问题的深入挖掘,寻找业务变化的原因,通过相关性分析,找到关键因素,进行指标拆解,分析问题是如何发生的,我们就可以从哪些方面去解决问题。
例如:发现本月整体的GMV(成交总额)减少,我们该如何发现原因?
首先,可以通过计算各个级别门店GMV变化与整体GMV变化的相关系数,确定那个类别的门店GMV对整体GMV影响最大(这里不展开具体分析,简单了解一下场景)。
其次,拆解GMV业务指标:GMV =顾客总数*成交转化率 * 平均客单价= 门店数量 * 店均人数 * 人效,当GMV发生变化时,我们可以通过分析门店数据、平均客单价、成交转化率、门店人效等子指标的变化来确定原因。
再者,指标维度下钻,GMV = A店GMV + B店GMV +C店GMV ,通过逐步细化指标维度,实现原因判断。常用的维度下钻有日期、地理等维度。
最后,挖掘并总结各种事物的相关性,进而,对于制定精准营销策略具有指导意义。
3)会怎样:预测
预测未来可能发生的事情,侧重于未来的走势以及是否可以提前规避风险。实际工作中,可根据历史数据和分析技术(如机器学习)对未来结果进行预测。
通过技术手段可以以很高的精度形成对未来的见解。但需要高深的技术知识,对于入门的朋友来说,可以通过同比,环比,对比分析,趋势、回归分析等,结合以往经验和知识,进行预测分析和判断。
4)又如何:分群、分层
基于描述、指标拆解、预测等以上一系列操作分析 ,对业务提出可落地可执行的措施。并进行用户特征、用户行为对用户进行分群分层,实现精细化运营,进一步提升运营效率和转化率。
比如,以要实现GMV的稳定增长为例,通过数据分析描述现状、发现原因、指标拆解、预测未来变化等操作,并结合业务状况,和业务运营共同制定用户分层精细化运营、增加活动力度,提升转化率等运营策略。
总之,数据分析方法有很多,如对比分析、多维分析、转化分析、留存分析等,这里就不一一展开了,可根据自己的业务场景,选择合适的分析方法!
5. 数据展现其实也就是数据可视化,把数据结果通过不同的表和图形,可视化展现出来。
可视化是数据分析结果呈现的重要步骤,可视化是以图表方式呈现数据分析结果,这样的结果会更清晰、直观,容易被理解,对于入门级别的常见的数据可视化工具可以是excel。
6. 数据报告经过上述一些列的步骤,得出了哪些结论?可以采取哪些优化措施?这些都需要以数据报告的形式进行呈现。基本结构如下:

  • 背景——描写报告的业务背景,只有受众了解了才能知道报告的价值所在;
  • 数据来源——注明数据来源,才能提高可信度;
  • 数据展示——数据文字合理的排版,才会有好的可视化效果;
  • 抛出结论——有结论的分析才有意义;
  • 提出建议——根据分析结论提出相应的建议。
7. 结果验证数据分析结果的应用是数据产生价值的直接体现,而这个过程需要具有数据沟通能力,业务推动能力和项目工作能力。
如果得到了结果却不知道做什么,那么这个数据分析可能就是失败的。此时我们就需要检查数据分析方法是不是有问题;其次,数据是否进行过加工处理?再其次,数据收集的是否可靠?这就需要具体问题,具体分析了。