编辑导语:数据分析如何与算法模型协同?相信很多人都思考过这个问题。本文将描述两种典型的错误做法,并提供破局的基本思路,再结合三个典型的合作场景进行分析。推荐对此感兴趣的朋友阅读,希望对你有所帮助。
文章插图
数据分析该如何与算法合作,是个老大难问题。一方面是业务方日益提高的,对模型的幻想。另一方面是大量企业里存在的,数据采集差,缺少足够数据人员,工作目标不清晰等等问题。到底该如何和分析与算法协同增效?今天系统分享一下。
一、两种典型的错误做法1. 狗不理式有些公司领导喜欢嫌弃自家数据分析师没本事,总认为“上个模型才牛逼”。于是数据分析师们皆明哲保身,干脆和所有带“模型”俩字的工作划清界限,统统甩给算法工程师。
这么干,当然会坑死算法。
且不说,很多时候领导口中的模型根本就是“SWOT”一类虚无缥缈的东西;
且不说,很多建模目标根本就是:“预测我做什么能成功”一类不切实际的东西。
就单单基础特征筛选工作没人支持一项,就会让算法工程师累死。项目进度慢,最后还是被嫌弃:“为啥你的模型不能100%精准预测!!!”
当然,此类问题常见于传统企业。特别是数字化转型阶段,领导们看了很多高大上的ppt,自以为自己很懂的传统企业。
2. 当狗用式一些互联网公司对于算法的应用有相对清晰的定位,算法小组的地位也较高。于是走向另一极端:把配给算法组的分析师当狗使。做啥你不用管,你按我说的取数就好了。用无休无止的取数表淹没了数据分析的工作。
这么干,坑的是所有人。因为连数据分析师都不懂算法逻辑,那运营部门更不懂。在茫然无知的情况下,运营部门只能通过简单的数据指标监控,来推测算法效果。并且稍有风吹草动,就开始质疑:“算法不灵了吧!”,“你们悄悄改了啥!”,“就是你们瞎搞!”这些质疑,又会成为部门间甩锅、扯皮的导火索,引发无休无止的内耗。
二、破局的基本思路从本质上看,分析和算法,都是数据的应用。那么灵魂拷问来了:是不是有了数据,钞票就源源不断从电脑里喷出来了?显然不是!数据本身不能包治百病,想让数据发挥作用,得紧密结合业务实际,找好数据能帮上忙的发力点才行。
而业务的实际情况又很复杂,经常是数据和业务行为交织在一起。
比如:
- 短视频DAU下降,是算法推荐不给力,还是创作者本身质量太差;
- 交易转化率下降,是商品推荐不给力,还是货源本身没有选好;
- 业绩预测不精准,是预测模型不给力,还是业务自己放水了。
空口说显得太空洞,下边结合一个具体问题场景看看。
三、典型合作场景之一:项目立项问题场景:某大型制造企业,期望建立“多维度立体式分析模型”,提升招聘效率。问,此时该怎么接需求?
这是个典型的需求不清晰场景。
- 什么叫:招聘效率?
- 招聘成本更低?招聘回来以后留存更好?招聘到合适的人?
- 什么叫合适的人?是否已经有清晰定义?
- 流水线工人、销售、营销策划、管理人员的“合适”定义是否一致?
- 流水线工人、销售、营销策划、管理人员的招聘问题是否相同?
因此无论是算法/分析,谁接需求,都得先问清上边的问题。当然,在问题定义都模糊不清的时候,让数据分析师站出来沟通更合适。数据分析师和业务贴的更近,更容易理解业务语言,引导业务思路。
业务方进一步给出的回答是:
- 要帮助管理岗位招到更合适的人
- 要发现:XX省市的流水线工人更容易招,我们集中招聘
- 要让整个部门的用人成本,控制在XXX万元以内
不!远远不到!
四、典型合作场景之二:任务分解有三大问题,制约着项目推进:
第一,管理岗位的“合适”定义不清晰。
管理人员的考核,远比流水线工人复杂。流水线工人只要考察年龄、身份证、学历几个简单维度即可,考操作技巧也能通过标准化作业考核。管理人员则复杂的多,还有“领导看他顺不顺眼”这种高度个性化、无法量化的考核点。因此不能简单的止步在这里。需要进一步定义。
- 算法|千人千面的算法,走到了十字路口
- 千人千面的算法,走到了十字路口
- 英特尔|近年来,生成式深度学习模型在分子设计中的应用已经出现
- 算法|你必须明白:战略是有逻辑的!
- 杀熟|2022,算法推荐的野蛮生长时代快结束了
- 算法|效率低下的方式,如何更有效地吸收信息?
- excel|比Excel还简单,跳槽数据分析岗必会的工具
- 业绩|数据分析,这样才算读懂数据
- 模型|下沉市场企业,单店发展到连锁的切入点:打造门店KOL
- 大数据|深度学习也能不玩大数据?小企业训练大模型有新解