数据|数据源发生变化时需要注意的点( 二 )


但不论是哪一种数据类型的数据源发生了变化,其共同特点是,如果放任不理,都会给产品带来重大影响,所以需要我们面对变化作出调整方案。
二、数据源变化后应对方案我们已知数据源变化会给产品带来重大影响,因此需要对此作出应对方案,这个方案需要包含变化前后的差异和可能带来的影响,以及解决方案(不局限于产品方案,也可以是运营方案等)。应对方案是为了尽可能地降低数据源变化所带来的影响,避免出现严重的负面情况,具体应对方案中我们可以根据下面二步进行展开,一起来讨论下吧。
1. 充分了解变化前后的数据差异变化前后的数据差异,是问题产生以及带来负面影响的直接原因,因此我们需要分别在相同条件下获取1份变化前的数据,和1份变化后的数据,充分了解两者之间的差异,包括数据格式的变化、数据内容的变化、以及数据传输方式的变化,才能为后续的解决方案提供理论依据。
可以按以下几个方面对两份数据一一比对,并最终得出差异结论。
1)数据格式差异
定义:什么是数据格式差异?数据格式差异就是指改变前的数据格式和改变后的数据格式不同。
例如数据源变化中数据格式由格式A变化成格式B,那么这里改变前的数据格式是A,改变后的是B,A和B是不同的格式,这就是一次数据格式差异。
产生差异的原因:不同的数据格式满足不同的场景,当场景发生变化时,数据格式也就随之发生了变化。
影响及对策:
改变后的数据相比较改变前,更改了数据格式,可能会导致产品无法使用数据,例如为了使得数据不被直接解读,数据格式从数值改变为了字符串,而原有产品都是以数值作为标准数据格式直接进行数据存储,并提供数据分析。
当数据格式改为字符串时,产品无法获取数据,原有产品以“数值”设计的功能都将无法使用,会给产品带来客诉以及退款等负面作用,为此我们需要根据最新的数据格式,修改涉及到的功能,降低其产生的影响。
2)数据内容差异
定义:同样的,什么是数据内容差异?数据内容的差异就是改变前后的数据在内容方面有出入,例如数据源变化中数据内容差生了差异,改变前的内容是A,改变后的内容是B,A和B是不同的内容,这就是一次数据内容差异。
而具体的A和B之间内容的差异关系会存在A多于B,A小于B,A和B存在交集,即改变后数据内容多于改变前,改变后少于改变前,以及改变前后互有多少。
产生差异的原因:不同的数据内容是由业务决定的,当业务发生变化时,数据内容也会随之进行变化。
影响以及对策:
首先,我们先看A多于B的情况,即改变后数据相较于改变前,多了很多数据内容,多出来的内容对与现有功能是一个多余的状态,我们需要分析多出来的部分是否会对现有功能产生影响,多出来的数据内容可能会对原有的数据展示和存储产生影响,包括因数据内容溢出导致的页面展示错位,数据存储异常等,会导致现有功能无法使用,从而产生负面影响。
对于这个影响,我们需要修正展示和存储规则,解决这个问题后,我们可以再分析多出来部分的内容是否支持做一些新能力或新功能,从而提升产品的价值和竞争力。
一起看个案例,例如订单数据中的“订单生成时间”原先只返回了年月日,本次改动返回了年月日时分秒,而产品中存储的时间格式是 yyyy-mm-dd,而当前年月日时分秒的格式为 yyyy-mm-dd HH:MM:SS,如果不对订单生产时间进行处理,会导致订单生产时间直接无法被储存,从而依赖“订单生成时间”字段的功能就将失去原始数据,不再能向用户提供依次统计的字段或者功能,导致用户问题或场景无法解决。
其次,来看A少于B的情况,即改变后数据相较于改变前,少了很多数据内容,这一情况会直接导致改变后的原始数据少了一部分内容,从而导致产品功能中关键数据丢失,无法再向用户提供原有设计的字段和功能。对于这个影响,我们需要尽快解决数据差异带来的问题,尽可能让功能和改变前保持一致。
还是通过案例来了解下,例如订单数据中包含了买家ID、订单编号、订单生成时间、订单状态等,如果改变后订单状态缺失,那么就会直接导致产品中依赖“订单状态”的功能少了原始数据,无法计算数据或提供功能。
最后是,A和B存在交集的情况,即改变后数据相较于改变前,部分数据内容多了,部分数据内容少了。需要分别将多的部分和少的部分,参照A多于B和B多于A的情况,作出相应的改动。