数据分析|如何用线性回归模型做数据分析?( 二 )
当我们加入一个年龄强相关的自变量车龄时,通过最小二乘法所计算得到的各变量系数如下,多重共线性影响了自变量车龄、年龄的线性系数。
这时候,可以使用VIF消除多重共线性:VIF=1/(1-R方),R方是拿其他自变量去线性拟合此数值变量y得到的线性回归模型的决定系数。某个自变量造成强多重共线性判断标准通常是:VIF>10
文章插图
我们发现,年龄的VIF远大于10,故去除年龄这一变量,去除后重新计算剩余变量VIF发现所有均
4. 计算调整R方
文章插图
5. 数据标准化我们希望不同自变量的线性系数,相互之间有可比性,不受它们取值范围影响。
文章插图
6. 拟合模型,计算回归系数共享单车分数案例,因变量是分数,自变量是年龄、组别、城区,线性回归的结果为:分数 = 5.5 + 2.7 * 年龄 +0.48 * 对照组 + 0.04 * 朝阳区 + 0.64 * 海淀区 + 0.19 * 西城区。
文章插图
7. 生成分析洞见——驱动力因素
文章插图
最终产出不同用户特征对用户调研分数的驱动性排名——驱动力分数反应各个变量代表因素,对目标变量分数的驱动力强弱,驱动力分数绝对值越大,目标变量对因素的影响力越大;反之越小,驱动力分数为负时,表明此因素对目标变量的影响为负向。
8. 根据回归模型进行预测至此,回归模型已经建好,预测就不写了,把要预测的数据x自变量导入模型即可预测y。
相信大家读完这篇文章,对线性回归模型已经有了一些了解,大家快快动起手来把模型应用到自己的实际工作中吧!
作者:赵小洛,公众号:赵小洛洛洛
本文由 @赵小洛 原创发布于人人都是产品经理。未经许可,禁止转载
【 数据分析|如何用线性回归模型做数据分析?】题图来自Unsplash,基于CC0协议
- 页面|如何简单、快速制作流程图?上班族的画图技巧get
- 培育|跨境电商人才如何培育,长沙有“谱”了
- 抖音小店|抖音进军电商,短视频的商业模式与变现,创业者该如何抓住机遇?
- 计费|5G是如何计费的?
- 车轮旋转|牵引力控制系统是如何工作的?它有什么作用?
- 视频|短视频如何在前3秒吸引用户眼球?
- Vlog|中国Vlog|中国基建如何升级?看5G+智慧工地
- 涡轮|看法米特涡轮流量计如何让你得心应手
- 手机|OPPO手机该如何截屏?四种最简单的方法已汇总!
- 和谐|人民日报海外版今日聚焦云南西双版纳 看科技如何助力人象和谐