难倒80%数据分析师的面试题!看看你能答上来几道?
整理了数据分析面试中11道常见的面试真题 , 对初级数据分析师来说有一定难度 , 能全答对的估计不超过20% , 看看你能答对几道:
统计学部分
1、一副扑克牌一共54张 , 平均分成2份 , 求这2份都有2张A的概率
本文插图
答案
先求分母:
54张牌 , 分成2份 , 每份应该27张 。
第一步:我们从54张牌取27张 , 作为第一份 , 就是C(54,27)
第二步:剩下的27张牌取27张 , 作为第二份 , 就是C(27,27)
这样分母就有了:把第一步和第二步相乘 , 就是54张牌 , 随机平均分成2份的组合数量 , 因此分母= C(54,27)*C(27,27)
【难倒80%数据分析师的面试题!看看你能答上来几道?】再求分子:
一副牌有4张A , 50张非A的牌 。
为了保证两份都要有2张A , 在挑第一份的时候 , 应该先在4张A里面挑2个A , 50张非A的牌里挑25个非A 。 然后第二份就是在剩下的2个A里挑选2个 , 25个非A里面挑25张 。
第一步:从4张A里挑2张A , 50张非A里挑25张 , C(4,2)*C(50,25)
第二步:从2张A里挑2张A , 25张非A里挑25张 , C(2,2)*C(25,25)
分子:C(4,2)*C(50,25)*C(2,2)*C(25,25)
所以概率是:
C(4,2)*C(50,25)*C(2,2)*C(25,25) / C(54,27)*(C27,27)
=(27*13)/(53*17)
2、男生录取率增加 , 女生录取率增加 , 总体为何减少?
本文插图
答案
此题考查的是辛普森悖论 , 因为男女的录取率可能有较大差异 , 同时低录取率群体的占比增大 。
如原来男性20人 , 录取1人;女性100人 , 录取99人 , 总录取率100/120 。
现在男性100人 , 录取6人;女性20人 , 录取20人 , 总录取率26/120 。
即那个段子“A系中智商最低的人去读B , 同时提高了A系和B系的平均智商 。 ”
3、置信度与置信区间是什么意思?
本文插图
答案
置信区间是我们所计算出的变量存在的范围 , 置信水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度 。
举例来讲 , 如果我们有95%的把握 , 让真正的数值在我们所计算的范围里 。
那么在这里 , 95%是置信水平 , 而计算出的范围 , 就是置信区间 。
如果置信度为95% ,则抽取100个样本来估计总体的均值 , 由100个样本所构造的100个区间中 , 约有95个区间包含总体均值 。
4、p值的含义
本文插图
答案
假设检验的基本原理只有3个:
- 一个命题只能证伪 , 不能证明为真
- 在一次观测中 , 小概率事件不可能发生
- 在一次观测中 , 如果小概率事件发生了 , 那就是假设命题为假
我要证明命题为真——证明该命题的否命题为假——在否命题的假设下 , 观察到小概率事件发生了——否命题被推翻——原命题为真
比如:要证明A是合格的投手——证明“A不是合格投手”这个命题为假——观察到一个事件(比如A连续10次投中10环) , 而这个事件在“A不是合格投手”的假设下 , 概率为p , 小于0.05——小概率事件发生 , 否命题被推翻 。
可以看到p越小——这个事件越是小概率事件——否命题越可能被推翻——原命题越可信
5、怎么向小孩子解释正态分布
- 铁血观世界|发射时筒体发红发亮,网友看着都烫手,国产80毫米口径火箭筒
- 疫情|美国疫情速报:确诊数已逼近284万;特朗普发话:99%新冠病例完全无害;美专家:实际感染数或是现有数据10~24倍
- 美搭说说大文|巴萨核心将转会尤文,身价8000万,梅西公开欢迎新队友到来
- 主从|Redis系列(五):主从复制
- 麒麟|赵明也没料到,麒麟980降700沦为千元机后,被用户抢断货
- 上海市公安局|男子开着8000欧“潜水艇” 在街头行驶?!民警:扣“船”
- 脱贫|云南文山近60万人摆脱贫困 80%通过产业扶贫实现增收
- 魔宠|抓个青蛙要抓800只?这手游乐坏宠物党,极限属性就靠刷
- 阿拉图图科技说 而给华为仅仅是800万枚!,台积电为苹果准备8000万枚芯片
- 欧阳晓沫|下周黄金要顺势破1800?,欧阳晓沫:A股迎来“牛市”