读懂数据网格原理与逻辑架构.docx
《读懂数据网格原理与逻辑架构.docx》由会员分享,可在线阅读,更多相关《读懂数据网格原理与逻辑架构.docx(16页珍藏版)》请在第一文库网上搜索。
1、谈谈如何跨越数据架构的漩涡目录1.编者按12 .前言13 .数据的巨大鸿沟21. 1.数据网格的核心原则和逻辑架构43. 2.原则一:领域所有权54 .逻辑架构:面向领域的数据和计算54.1. 原则二:数据即产品75 .逻辑架构:数据产品作为架构量子75. 1.代码86. 2.数据与元数据87. 3.基础设施88. 4.原则三:自服务数据平台106 .逻辑架构:一个多平面的数据平台107 .自服务平台127 .1.原则四:联合计算治理128 .逻辑架构:嵌入在网格中的计算策略139 .原则总结和高阶逻辑体系结构15关键词:数据分析;数据;大数据1 .编者按我们渴望用数据来增强和改善商业和生活的
2、方方面面,这要求我们在大规模管理数据方面进行范式转变。过去10年的技术进步已经解决了数据量和数据处理计算的规模问题,但它们未能解决其他方面的规模问题:数据格局的变化、数据来源的增加、数据用例和用户的多样性,以及对变化的响应速度。数据网格基于以下四个原则解决这些维度:面向领域的分散数据所有权和架构、数据即产品、自服务的数据基础平台和联合计算治理。每个原则都驱动着技术架构和组织结构的新逻辑视角。2 .前言为了实现数据驱动、能使用数据进行竞争、或者使用数据在规模上驱动价值,今天的架构和组织都面临挑战,之前的文章如何从单一数据湖移动到分布式数据网格对此中痛点深表同感(阅读下文前,鼓励你先读这篇文章)。
3、它提供了另一种视角,这一视角已经引起了许多组织的注意,并为不同的未来带来了希望。虽然最初的文章描述了这个方法,但它也留下了很多设计和实现的细节,让人去想象。我无意在本文中作明确的界定,从而扼杀了围绕数据网格实现的想象力和创造力。这里,将阐明数据网格的架构方面,作为推动范式向前发展的垫脚石。写这篇文章更多是作为一个续集。它总结了数据网格方法,列举了它的基础原则,以及这些原则所驱动的高级逻辑架构。在以后的文章中深入研究数据网格核心组件的详细架构之前,高级逻辑模型是必要的基础。因此,如果您正在寻找数据网格的具体工具和方法,这篇文章可能会让您失望。如果您正在寻找一种简单的、与技术无关的模型来建立一种通
4、用语言,那就来吧。3 .数据的巨大鸿沟我们所说的数据到底是什么?答案取决于你问的是谁。今天提到的数据,可以分为运营数据和分析数据。运营数据位于由微服务提供的业务功能背后的数据库中,具有事务性,保持当前状态并满足运行业务的应用程序的需求。分析数据是对业务事实随时间推移产生的临时和聚合视图,通常用于建模以提供回顾或未来视角的洞见;它也用于训练M1模型或提供分析报告。Ana1ytica1DataP1ane技术、架构和组织设计的当前状态反映了这两个数据平面的分歧一一两个层次,既集成而又分离。这种分歧导致了一个脆弱的架构。许多人试图连接这两个数据平面,将数据从运营平面流动到分析平面,然后再返回到运营平面
5、。然而不断失败的ET1(提取、转换、加载)作业和不断增长的迷宫般的数据管道的复杂性变得越发常见。Operationa1DataP1aneRunningthebusinessServingtheusersOptimizingthebusinessAugmentingtheuserexperiencewithinte11igence图1数据的巨大鸿沟分析数据平面本身分为两大主要架构和技术栈:数据湖(b1iki:Data1ake)和数据仓库;数据湖支持数据科学访问模式,数据仓库支持分析和商业智能报告访问模式。而同时,数据仓库正试图支持数据科学工作流程,数据湖也试图为数据分析和商业智能服务。本文将先把
6、这两个技术栈之间的交错放在一边,数据网格最初的文章探讨了现有分析数据平面架构所面临的挑战。DataAna1ysts图2数据仓库DatascientistsM1trainingOperationa1DataP1aneDataPipe1ines!Main1yExtract-1oadAna1ytica1DataP1aneData1akeMorepipe1ines!Main1ytransform图3数据湖数据网格认可并尊重这两个层面之间的差异:数据的性质和拓扑、不同的用例、数据消费者的角色,以及最终它们的不同访问模式。然而,它试图在不同的结构(基于领域的倒置模型和拓扑,而不是基于技术栈)下连接这两个平
7、面,并将重点放在分析数据平面上。当今管理两种数据原型的可用技术中,都不应该导致组织、团队和工作人员的分离。在我看来,运营性和事务性数据的技术和拓扑是相对成熟的,并且主要由微服务架构驱动;数据隐藏在每个微服务内部,通过微服务的api控制和访问。当然,真正实现混合云本地操作数据库的这解决方案还有创新空间,但从架构的角度来看,它已经满足了业务的需求。然而,管理和获取分析数据仍存在大量的摩擦。这,就是数据网格的重点所在。我相信,在未来的某个时刻,我们的技术将会发展,使这两各数据层面能更加紧密地联系在一起,但现在,建议先把关注点分离。3.1.数据网格的核心原则和逻辑架构网格目标是为了构建一个基础底座,便



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 读懂 数据 网格 原理 逻辑 架构
