数据目录已死?为什么要重新思考元数据管理和数据治理?( 三 )
·分布式发现的数据沿袭
数据发现在很大程度上依赖于自动的表级和字段级沿袭来映射数据资产之间的上下游依赖关系 。 沿袭有助于在正确的时间显示正确的信息(数据发现的核心功能)及绘制数据资产之间的连接,以便在数据管道发生故障时更好地进行故障排除 , 随着现代数据栈不断发展以适应更复杂的用例 , 这个问题变得越来越常见 。
·数据可靠性确保数据的黄金标准——始终如此
事实上 , 你的团队可能以这样或那样的方式已经在数据发现方面进行了投资 。 无论是通过团队手工验证数据 , 还是工程师编写的自定义验证规则 , 或者仅仅是基于破碎的数据或未被注意到的无声错误所做出的决策的成本 。
如今 , 数据团队已经开始利用自动化方法 , 在数据管道的每个阶段确保高度可信的数据 , 从数据质量监控到更健壮的端到端数据可观察性平台 , 这些平台可以监控和警报数据管道中的问题 。 此类解决方案会在数据损坏时进行通知 , 以便能够快速识别根本原因 , 快速解决问题 , 防止将来宕机 。
数据发现使数据团队能够相信他们关于数据的假设与现实相符 , 从而支持跨数据基础设施的动态发现和高可靠性 , 而不需要考虑领域 。
文章图片
下一步是?
如果坏数据比没有数据还要糟糕 , 那么没有数据发现的数据目录比没有数据目录还要糟糕 。 要获得真正可发现的数据 , 重要的是你的数据不仅要“编目” , 而且要准确、干净、完全可观测 , 从接收到使用——换句话说:可靠 。
一种强大的数据发现方法依赖于自动化和可扩展的数据管理 , 它适用于数据系统的新分布式特性 。 因此 , 要真正实现组织中的数据发现 , 需要重新考虑如何处理数据目录 。
只有理解数据、数据状态以及如何全方位地使用数据 , 我们才能开始信任它 。
文章图片
留言点赞关注
我们一起分享AI学习与发展的干货
如转载 , 请后台留言 , 遵守转载规范
- 魅族公布15项数据,证明四大系统中,华为EMUI安全性最差
- ITBD-TWS耳机全球市场数据监测
- 巴萨2-0奥萨苏纳,梅西2个助攻,不进球也是王:4项数据第一
- 进球全靠点球?曼联中场大将回击穆里尼奥:有些人只会关注数据
- 萧华:从数据看今年的吹罚没问题 尊重LBJ意见但全明星赛必须得办
- 大数据告诉你:福原爱只是“犯了天下女人都会犯的错”!
- 重要上市公司电商1月线上数据分析
- 中国海军现在有多强?英国曾给出一组数据,让美俄都不能接受
- 危及国家安全?GPS导航和自动驾驶采集大量测绘数据,该如何化解
- 爱立信|爱立信官宣最新数据,5G订单量全球第一,华为5G却有核心优势