业界 | 车好多CTO张小沛:从高管到一线,如何营造全公司一致的数(14)


不同于国内外二手车行业其他玩家,张小沛认为瓜子保卖的定价更多是用黑盒的、机器学习的方式,需要大量的数据用于学习训练,而其他公司例如CarMax则是偏规则、偏白盒的方式,难度则会低很多。


通过黑盒定价需要大量的数据输入,这些数据有瓜子二手车在线上线下自己积累的,也有一些通过合法渠道购买来的行业数据,还有通过爬虫爬取的行业数据,这些爬取得来的数据虽然不花钱,但噪音也相对地特别多,需要花大量的时间和精力去清洗。


2016年开始,车好多自己做了基因图谱库,到目前这个图谱库里已经有560多万辆车、3亿左右的车主的数据,每辆车、每位车主的数据都有上千个维度来描述,车好多技术团队对这些不同的车和人之间的相关系数也进行了计算,包括不同的人购车的可能性、浏览的可能性、搜索点击的可能性,也包括对瓜子的销售和评估师售车转化率的评估。