数据目录已死？为什么要重新思考元数据管理和数据治理？( 三 ) 全文共4233字

·分布式发现的数据沿袭
数据发现在很大程度上依赖于自动的表级和字段级沿袭来映射数据资产之间的上下游依赖关系。沿袭有助于在正确的时间显示正确的信息(数据发现的核心功能)及绘制数据资产之间的连接,以便在数据管道发生故障时更好地进行故障排除，随着现代数据栈不断发展以适应更复杂的用例，这个问题变得越来越常见。
·数据可靠性确保数据的黄金标准——始终如此
事实上，你的团队可能以这样或那样的方式已经在数据发现方面进行了投资。无论是通过团队手工验证数据，还是工程师编写的自定义验证规则，或者仅仅是基于破碎的数据或未被注意到的无声错误所做出的决策的成本。
如今，数据团队已经开始利用自动化方法，在数据管道的每个阶段确保高度可信的数据，从数据质量监控到更健壮的端到端数据可观察性平台，这些平台可以监控和警报数据管道中的问题。此类解决方案会在数据损坏时进行通知，以便能够快速识别根本原因，快速解决问题，防止将来宕机。
数据发现使数据团队能够相信他们关于数据的假设与现实相符，从而支持跨数据基础设施的动态发现和高可靠性，而不需要考虑领域。

文章图片
下一步是?
如果坏数据比没有数据还要糟糕，那么没有数据发现的数据目录比没有数据目录还要糟糕。要获得真正可发现的数据，重要的是你的数据不仅要“编目” ，而且要准确、干净、完全可观测，从接收到使用——换句话说：可靠。
一种强大的数据发现方法依赖于自动化和可扩展的数据管理，它适用于数据系统的新分布式特性。因此，要真正实现组织中的数据发现，需要重新考虑如何处理数据目录。
只有理解数据、数据状态以及如何全方位地使用数据，我们才能开始信任它。

文章图片
留言点赞关注
我们一起分享AI学习与发展的干货
如转载，请后台留言，遵守转载规范