电子化|如何15天完成14亿人口普查数据登记?云计算、大数据立功
11月1日,第七次全国人口普查正式进入登记阶段。此次普查是我国首次使用电子化方式进行登记,由腾讯云联合企业微信提供云计算、大数据等核心技术支持。如何在短短15天内完成我国14亿人口的普查数据登记?如何缩短登记时间同时保证数据安全?澎湃新闻(www.thepaper.cn)采访人员采访了国家统计局工作人员与负责普查电子采集器技术开发的腾讯云、企业微信相关人员。
腾讯政务云副总裁王景田向采访人员介绍道,此次人口普查的技术方案利用了企业微信这一现成产品,同时把普查需要的特定数据审核关系架构在上面。
这就意味着,如果公众选择自主申报,那么打开个人微信扫描普查员出示的二维码即可;而对于700万入户普查员来说,则可以把他们看成一个公司,在企业微信的框架基础上,普查员将进行数据的电子化登记及加密上传,实现“智能终端做普查”。
据介绍,我国第七次全国人口普查项目筹备于今年3月启动。腾讯云、企业微信相关员工与国家统计局工作人员合作,在新冠肺炎疫情期间完成了电子化的所有准备。
“我们应用了TDSQL和Tbase的数据库产品,目前它们一起承接了每秒接近50万次更新,这标志着我国的国产数据库技术完全可以满足政府金融的数字需求,而且在任务量这么大的极端情况下安全可靠。”王景田表示。
王景田称,这一技术在研发实施的过程中,首先面临着“人和户要对应起来”的难题,这是一个复杂关系,也是时刻变动的关系,要把信息捕捉准不容易。
“项目开始后,我们发现我们对业务理解还是简单了,登记的这15天里所有人员是流动的,比如一个人今年在北京,第二天又在深圳,”他举例称,由于一个人在15天内可能在多个地点出现,其数据可能被多次重复登记,所以需要后期进行校验,有一个“数据排重”的过程。
同时,在普查员完成登记后,要把数据间的逻辑关系搞清楚。例如普查员上门进行登记后,会发现家庭关系、父母子女关系、夫妻关系等多种社会关系,这些关系在数据处理工作中意味着,每一个数据都需要经过700多条业务规则的校验,这对整个系统来说是十分复杂的。
“大量的数据要收集上来,同时数据的更新和数据的查询是互相交错的,所以我们做了双数据库设计,一个数据库专门用来做生产系统的处理,另一个数据库用来查询。”王景田说。
此前,北京市昌平区统计局副局长、区人口普查办常务副主任王建华曾对澎湃新闻(www.thepaper.cn)采访人员表示,入户登记阶段基本上是1个普查员负责一个普查小区,工作量在250到300人之间。
通过配置了“定制版”企业微信的Pad或手机电子采集器,普查员通过询问户主进行包括个人基本信息、住房、婚姻生育、死亡等情况的登记,再用电子采集器扫描、自动识别身份证号码等信息,点击上传,一次入户登记就完成了。与2010年全国第六次人口普查的纸表入户登记方式相比,电子采集的方式将登记时间缩小到了20分钟以内,也很大程度上降低了后期数据录入、处理的难度。
文章插图
王景田对于数据传输过程中的安全保护进一步介绍道,数据采集之后,从留存本地到链路过程中全部有加密程序。同时,数据采集后将直接到达统计局的数据中心,中间没有任何节点。他表示,保护个人隐私,一直是移动互联网业务拓展过程中很重要的方面,截止到目前,此次人口普查的登记工作中还没有发现出过数据安全问题。
值得注意的是,基于移动端的电子化普查手段,不仅是我国普查工作的一个技术革命,同时也引领了国际上普查手段的技术进步。
目前,国外的人口普查大多是基于PC端的,但我国此次采用的移动化终端采集可以说是电子化普查的最新手段,因此在国际的普查数据采集方面都起到引领作用。
王景田称,在15天的入户普查登记结束后,将是数据整理、分析的过程,腾讯云仍将对后期数据分析等环节独家提供技术支持。
【 电子化|如何15天完成14亿人口普查数据登记?云计算、大数据立功】(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
- 抖音|抖音如何获取更多流量?一文读懂直播自然流量提升技巧
- 东芝|如何分辨手机配置的“好坏”?认清这四点,你也能成为行家
- iqoo neo|一部手机可以用多久?来看下iQOO次旗舰是如何解答的
- 人机|人机融合时代,中国机器人如何弯道超车
- 显卡|显卡和处理器如何组合?
- 小米科技|别吵!理性分析:i5-12600K和锐龙7 5800X该如何选择呢?
- 骁龙870|骁龙778G和骁龙870的差距究竟有多大?作为消费者应该如何选择?
- 芯片|算力的阿克琉斯之踵,阿里达摩院如何破局?
- 机器|工业触摸屏一旦出现了失灵,我们要如何处理你知道吗?
- 验证码|如何把谷歌两步验证设计到产品中