文章图片
文章图片
文章图片
3月30日 , 朋友转了一篇文章《用Excel来预测一下明天的上海的阳性病例数量》 。 看后极为震惊 。
文中用过去上海3月28日之前18天的阳性病例数据 , 利用Excel的“设定趋势线” , 预测了3月29日以后 , 上海的每日新增数据 。
其中 , 29日的数据与公布数据非常接近 , 因此被小郝许多朋友点赞、转发、甚至赞赏 , 迅速达成阅读10万+ 。
更扎眼的是 , 他的预测下 , 甚至算到4月13日 , 单日新增到了10万+的地步 , 又一个预测大神就此诞生?
但小郝作为一个金融工程毕业的学生真的看不下去这种误导 , 在上海异常艰难的时候 , 继续这种不明原理、乱带节奏的博眼球做法 , 给上海添乱 , 必须吹毛求疵地说明他究竟错到哪里:
1、万能的预测方法?错!小郝常做科技公司财报分析 , 就拿京东近13年的营收来用 , 套用王先生的方法 , 立马就能做出更好的趋势线 , 四项式下 , R2拟合度(决定系数)高达99.9% 。
与之类似的 , 还有亚马逊近10多年的营收 , 苹果公司近2012年前的营收 , 都能做出类似的预测公式 , R2超过99.4%比比皆是 , 王先生说的“在统计学里面非常少见的精确” , 完全不存在 , 明明是很常见 。
同时 , 这些模型也都能精准预测那些公司近两年的营收 , 误差极小 , 难道这就是完美又万能的预测方法?绝非如此 , 反例立刻来打脸 。
拿苹果2001-2015年的营收数据做这类模型 , 得出图如下:
其趋势线预测下2016年营收是2447亿美元 。
可现实呢?2016年苹果公司的营收只有2170亿美元 , 是15年来第一次下降 。 销售负责人换将、外部环境影响等多重因素 , 造成了整个预测模型的失败 。
可见 , Excel做的简单预测模型 , 根本无法精准预测“拐点”何时到来 , 毕竟单一维度的数据 , 实在单薄 , 根本无法覆盖造成数据变化的复杂因素和假设变更 , 这正是统计学里“蝴蝶效应”的本意 。
2、尊重专业 , 别做“野仙”没错 , Excel提供了方便的统计工具 , 但其背后的统计原理 , 逻辑假设 , 王先生真的明白吗?
统计预测是极为严谨的 , 要考虑的因素 , 对假设条件的考量都极为严苛 , 稍有不慎 , 预测就变得南辕北辙 , 因为现实状况本身就是复杂多变 , 一个小要素的变更 , 都可能毁掉整个模型的基础 。
所以 , 单一数据的统计模型 , 向来在严谨预测里从未被大量采用 , 就像基因和某种疾病的关系 , 常常说只“存在统计学上的关联” , 而确认基因是导致疾病的关键要素 , 还需要海量的各种方面的验证 。
因为专业 , 才能分清什么是“王道” , 什么是“旁门左道” 。
如果用Excel选一组数据 , 做个趋势线就能预测世界的种种现象 , 那还要复杂的统计学干什么?还要计量经济学、计量金融学复杂的理论干什么?
套用《潜伏》里余则成、李涯“录音大决战”里的台词 , 王先生现在的所作所为就是不懂其中的“基本原理” 。
的确 , 王先生是知名企业家 , 创立的百姓网也已经上市 , 也拿过“青年精锐”的称号 , 还是技术专家出身 , 但统计预测 , 并非您的专业 , 就拿兴趣来当真理 , 是不是太不把病例预测当回事了?
我2012年采访过王先生 , 映像里他是谨慎、逻辑严密的理工男 , 应该不会走网红“野仙”的路子 , 要做“高手在民间 , 失手在阴间”的事 。
只是 , 当下上海正值关键时刻 , 担忧、难过、不平等负面情绪已经不少 , 此时 , 王先生还火上浇油 , 搞出数据如此扎眼的不靠谱预测 , 不是更激化矛盾 , 制造焦虑?这和当年的“咪蒙”有啥区别?这对病例清零有什么好处?
所以 , 请王先生把专业预测的事交给专业的机构 , 只有孙悟空的爱好 , 没有孙悟空的本事 , 还捉哪门子妖啊?
小郝知道 , 写了这些 , 也没有王先生的能力造出10万+的阅读量 , 毕竟 , 数理分析都太过理智 。 比不过那些“专业不够 , 手段来凑”高人 。
- |每个黑客必须学习的10项技能,你掌握了吗?
- 上海市|上海分区分批“封控”!半导体产业或受影响,台积电、合晶回应
- 显示器|想做好一份PPT,布尔运算这个功能必须学会用!
- CPU|一台好手机必须要具备的3个要素,少一个都不行,预算不够再等等
- 自媒体|做自媒体这5点必须要知道!
- 软件|10大人机界面常识!工控人必须要了解的知识!
- Apple Watch|必须出货EUV光刻机?ASML这次没得选了
- 苹果|苹果税必须交?库克懒得继续废话:不想交税就别用苹果手机
- 一加科技|购机不知怎么选?手机发烧级玩家:这几款机型必须要看一看
- 域名|运营一个网站,必须有域名注册和虚拟主机