《数据建模方法标准及应用.docx》由会员分享,可在线阅读,更多相关《数据建模方法标准及应用.docx(14页珍藏版)》请在第一文库网上搜索。
1、数据建模方法标准及应用数据建模用于定义和分析数据要求,支持信息系统设计的过程。装备管理数据建模主要用于两个方面,一是支撑装备管理信息系统建设和数据交互,二是服务于装备大数据业务分析所需的数据结构框架。技术发展促进信息系统的升级换代,数据是可继承的资产,需要持续维护、管理、分析和挖掘;数据建模是信息系统设计和业务分析的核心要素,直接影响系统的架构设计和技术特性;所以,深入剖析业务本质,抽象对象模型表达,设计科学、合理、可扩展的数据架构和数据模型,是数据资产建设的基础,是业务系统设计的重中之重。作战装备结构复杂、研制周期较长,装备管理涉及要素多,不同装备类型研制管理模式和部门分工不同,依照业务流程
2、设计的信息系统结构和逻辑也不尽相同,在数据交互和关联分析时,出现信息融合困难、关联度低等问题,归根到底还是数据建模是否科学、合理,包括是否顶层设计、合理抽象、横向考虑、适当超前超宽规划等。一、体系结构设计方法体系结构框架是体系结构设计方法学的别名,为开发、描述和沟通体系结构提供指南、模型和规则。最早是上世纪80年代J.A.Zachman提出的企业体系结构框架“扎克曼框架”,先后开发了 C4ISR和DoDAF体系结构框架,基于信息管理技术架构TheOpen Group组织开发了面向复杂组织信息系统设计参考的企业架构框架TOGAF等。体系结构框架提供了信息系统设计和实施的一般方法和步躲,其中对数据
3、框架和模型都有不同程度的单独论述,作为方法论都可以作为数据建设自顶向下设计、循环迭代开发的参考,也为数据建模提供了顶层视图和全局思维方式。1. 1T0GAF开放组织结构框架TOGAF是用于开发组织架构的一套方法和工具,支持最佳实践和一套可重用的架构资产。它将架构域分为四个关键领域:1)业务架构,定义业务战略和组织,关键业务流程以及治理和标准;2)应用架构,为部署各个系统提供蓝图,包括应用程序系统之间的交互以及与基本业务流程的关系;3)数据架构,记录逻辑和物理数据资产的结构以及任何相关的数据管理资源;技术架构,描述了支持关键任务应用部署所需的硬件,软件和网络基础架构,如图1所示。其中,数据架构,
4、需要清晰理解业务功能、流程和服务如何使用数据实体,以及在哪里如何创建、存储、传递、转换数据。摩贝卜差距架构原则、需求和路线图约束“勃机犷事.基时设费合并扩及加温沆福法案姓事数络建集F晚,.要务f I * *技术架构数据架构数据实体一应用架构,逻辑应用组件,HSJ&用以件基0ftM合为#晨平台服务,物理技术组件”图1 T0GAF关键领域架构Determine theintended use ofthe chrtecture6步法(DoDA麻.准).碟定架构的用途Determinescope ofarchitecture文义寿杓的总困required tosupportarchrtecture d
5、evelopment .决定攵持票杓开发所哥的效掂CoH*ct. organizecocrtiste. andstore architecture收a整理.右桂东均效疆aanalyses insupport ofarchrtectureobjectives辱枸Q林文杓的雄子.分析DocumentResults IAWDeasion-Makerneeds偏档地理的、作战和功能的约束技术上的约束时间上的限制体系架构资源和进度的约束所需的体系架构特体系架构数据实体详细程度度量单位相关的元懒自动化的存储库活动模型数据模型动态模型组织模型元数据注册缺陷分析能力分析互操作性评估业务流程分析测试体系架构的完
6、成性、精确性和充分性体系柒构的表示不哝图可复用的体系辑逐据分析报告利益攸关方的需求目的关键问题目务重要的权衡决策点可能使用的分析工具图2 DoDAF体系架构六步法参考步骤如下:1)选择参考模型、视角和工具,包括确定总体建模流程、识别所需的数据构建块FI录集、识别所需的矩阵和图、识别待收集的需求类型,形成数据FI录集、数据权限矩阵、数据实体业务功能矩阵、实体关系图和类图、数据架构视图(概念数据图、逻辑数据图、数据传播图、数据生命周期图、数据迁移图、数据安全图)、数据需求类型等。2)开发数据架构描述,包括基线描述、目标描述、差距分析、候选路线图、分析架构影响、利益攸关者审视、确定数据架构、定义架构
7、文件,形成业务数据模型、逻辑数据模型、数据管理流程模型、数据实体业务功能矩阵、数据交互需求等。3)输出结果细化和更新,包括草拟的架构工作说明、数据原则、架构定义文件、架构需求规范,和数据实体/数据组件目录、数据实体/业务功能矩阵、应用/数据矩阵、概念/逻辑数据图、数据传递/安全图、数据迁移图、数据生命周期图。T0GAF给出模板式数据架构设计方法,衔接业务、应用和技术架构,保证需求和架构的整体性、步骤和操作的规范性,且要素齐全,是信息系统正向设计的规范表达,在信息系统设计数据建模过程中可直接参考。1. 2DoDAF体系结构框体系结构框架(DoDAF)2.0版是一套顶层的、全面完整的框架和概念模型
8、,聚焦于关键决策者所需的体系结构数据和信息。DoDAF V2.0提供了体系结构开发6步方法论、DM2本体模型、概念模型和元模型数据组、视角和模型。DoDAF是以数据为中心的体系结构设计方法,通过典型的全景、能力、数据和信息、作战、计划、服务、标准、系统等8个视角为各利益相关方提供决策视图,构建了一套数据建模方法支撑数据采集、汇总、分析、展示,包括:1)基于DM2基础本体的数据建模方法论,将顶级基础本体元素抽象为事物、个体、类型、组合;2)将整个领域对象概括为条件、规则、活动、资源、能力、计划、位置等24个关键概念,形成概念级体系结构框架数据元模型,见图3;3)按照业务概念域描述概念关系,形成执
9、行者、资源流、信息和数据、规则、能力、服务、组织结构、谱系等11个数据组和52个视角模型;在数据交互规范中,给出领域概念和概念关系的全貌。DoDAF以数据为中心的体系结构方法,非常适合大数据建设或决策系统建设参考。其定义的DM2基础本体、领域概念、领域概念关系,是自顶向下、高度抽象的建模方法,保证整个数据模型的体系性和一致性;其定义的数据组元模型描述、视图元模型图,是对业务领域实体及关系的描全部都可以度量图3 DoDAF2概念数据模型二、数据建模抽象方法根据GB 18391和GB 32392中的定义,元数据是定义和描述其他数据的数据,元模型是描述模型的模型。在信息技术标准中,元是相对的概念,是
10、对数据、结构进行抽象的表达,以适应信息系统的设计和开发。2. 1元数据概念与标准GB 18391信息技术 元数据注册系统系列标准是对元数据注册系统的一个定义,用于管理数据的语义。包含六个部分:1)第一部分对数据的表示、概念、含义以及它们之间的关系进行形式化描述,使任何机器都能理解;2)第二部分确定了一系列原则、方法和程序,用于规范在为各类管理项与一个或多个分类方案间建立关联时至少要的记录信息;3)第三部分规定了数据元的基本属性,包括定义、说明及内容等,保证对数据元有共同的认识;4)第四部分规定了构建数据和元数据定义的要求与建议;5)第五部分规定了对数据元概念、概念域、数据元和值域等管理项的命名
11、和标识;6)第六部分规定了对不同应用领域的管理项进行注册和赋予国际唯一标识符的规程。标准的第一部分给出了数据元的基本模型,包括数据元概念和表示,其中概念又由对象类和特性组成,见图4。数据元概念数据元-J|(1 : D特性一 农示图4数据元的基本模型对象类是我们希望采集和存储数据的事物,对应描写对象模型中的类,对应实体-关系模型中的实体;特性对应类和实体中的属性。这就是信息系统数据建模的抽象用法和基本概念,可直接用于装备管理的数据建模。标准的第三部分给出了数据元属性的常规描述符集,包括名称、定义、约束、条件、最多实例数、数据类型、最大长度、字符集、语言和备注等;和数据元属性的基本属性,包括标识类
12、、定义类、关系类、表示类和管理类等。在数据建模的过程中,定义、关系和表示类的属性是基本要求,标识和管理类的属性在建大系统的数据模型过程也要遵循。2.2元对象设施与标准GB 32913信息技术 元对象设施定义了元模型、接口集合,可以用来定义和操纵一组可互操作的元模型以及它们对应的模型。它是一种抽象语言,用于说明、构建和管理技术中立的元模型;是一种框架,用于实现拥有由元模型描述元数据的存储库和集成框架。MOF研究的中心主题是元数据管理的可扩展性,提供支持任何种类的分层元数据框架,给出了经典的四层建模体系结构,通过递归地将语义应用到不同层次上,完成语义结构的定义,为元模型扩展以及实现提供体系结构基础
13、,如图5所示。图5 MOF典型四层建模结构每层具体描述如下:1)信息(对象)层(M0)的信息包含了用户希望描述的数据。2)模型层(Ml)包含了描述实例层数据的元数据。元数据聚在一起形成了模型。3)元模型层(M2)包含定义了元数据结构和语义的描述信息(即元元数据)。元元数据聚在一起形成的元模型是一种抽象语言,可以用来描述不同类型的数据。4)元元模型层(M3)包含描述元元数据结构和语义的描述信息。换句话说,这是定义不同类型元数据的“抽象语言”。构建适用于装备全寿命周期管理数据建模的元模型,按应用领域泛化形成业务数据模型,对应的装备全寿命周期数据模型的MO、Ml、M2 层见图 6。图6 MOF技术映
14、射1)M0层信息包含了装备管理信息系统存储的各类装备、器材、计划、项目等的具体数据;2) Ml层包含了描述实例层数据的元数据,聚在一起形成预研科研、采购接装、使用维护、退役报废等数据模型;3) M2元模型层定义装备管理所需的元数据结构和语义的描述信息。装备管理数据建模工作量大、涉及要素众多,建立规范一致的建模规则和具有普适性参考模型意义重大,可保证具体业务领域数据建模过程中的一致性和体系性。DoDAF中的DM2本体模型本质上就是所有数据模型的元模型,支撑各种具体对象和业务的数据建模,保证美国国防部规划、指挥、采办、保障等系统数据汇总分析和共享交互。三、数据建模管理与评价体系架构设计方法强调迭代完善,数据管理和数据模型管理也是其中的一个方面。DAMA国际和GB36073中,都将数据模型迭代设计和评价完善作为一个重要内容。4) 1DAMA数据建模与设计过程国际数据管理协会(DAMA国际)编制的DAMA数据管理知识体系指南将数据建模定义为发现、分析和确定数据需求的过程,用数据模型的精确形式表示和传递这些数据需求。1)在建模方法中,推荐了关系、多维、面向对象、事实、时间序列和NoSQL等6种表示模式,概念、逻辑、物理等3层模型,描述了数据建模和设计过程的基本概念、目标和原则。2)在规范化抽