《2023年数据管理中的文件档案与内容管理白皮书.docx》由会员分享,可在线阅读,更多相关《2023年数据管理中的文件档案与内容管理白皮书.docx(35页珍藏版)》请在第一文库网上搜索。
1、1背景12 文件、档案与内容管理的相关概念22 . 1 文件、档案与文档23 . 2 内容、数据与知识24 .3文档管理与内容管理35 .4文档生命周期与数据生命周期43 数据管理框架下的文件档案与内容管理 44 文档与内容管理价值与效用61.1 1 安全合规61.2 提效降本61.3 业务连续71.4 决策支持71.5 洞察创新71.6 权益保障71.7 资产增值81.8 记忆(历史)留存85 内容管理软件的应用及类型 85.1 应用架构视角下的内容管理软件应用85. 1. 1企业内容管理系统96. 1.2内容协作系统107. 1.3网页内容管理系统108. 1.4文档管理系统109. 1.
2、5影像管理系统1110. . 6质量体系文件管理系统1111. 1.7知识管理系统1112. 1.8合同管理系统125.2 不同行业领域中的内容管理应用类型125.2.2制药行业内容管理应用 135. 2.3军工行业内容管理应用145. 2. 4金融行业内容管理应用155. 2. 5新能源行业内容管理应用165.2.6 核电行业内容管理应用165.2.7 工程设计行业内容管理应用176 内容管理系统与文件档案管理系统的发展 176.1 内容管理系统的发展过程176.2 内容管理系统的发展阶段186.3 文件档案管理系统的发展207 文件档案与内容管理的应用问题 207. 1 IT视角下的应用问
3、题207. 1. 1业务系统核心文件“烟囱割裂”208. 1. 2离散过程文件难以统一存储219. 1. 3海量数据带来存储扩展和安全问题2110. 1. 4多分支机构对部署架构挑战217.2 业务视角下的应用问题217. 2.1用户很难发现想要的文件档案228. 2. 2业务文件不能及时、完整归档229. 2. 3文件档案未形成体系化知识2210. 2. 4文件档案与业务融合不足2211. .5管理人员综合能力依然欠缺227.3 数据视角下的文档档案应用问题237. 3. 1文件档案核心数字资产地位未被认可238. 3. 2非结构化数据管理战略规划缺失239. 3.3内容数据化能力不足231
4、0. 3. 4文件档案数据价值释放不够248 数据管理中的文件档案管理框架2411. 1价值实现层2512. 管理活动层2613. 技术实现层289 数据管理中文件档案与内容管理的发展趋势289.1 结构化数据和非结构化数据融合发展289.2 文档管理和内容管理融合发展299.3 3文档管理和数字化业务融合发展309.4 文档管理与内容模型的融合发展319.5 文档管理基础建设和智能开发融合发展321背景自2017年党的十九大报告中明确提出“数字中国”这一概念之后,数据作 为第五大生产要素,逐渐得到了社会广泛的认可与重视。为了进一步规范数字中 国建设,中国中央、国务院于2023年2月印发数字中
5、国建设整体布局规划 (以下简称规划),为构建数字中国提供了顶层设计与整体谋划。依据规 划,“数字中国”的建设需要夯实数字基础设施与数据资源体系“两大基础”, 数据管理对于机构的重要性愈发凸显。同时,“东数西算”国家战略体系正在全面铺开,为了构建全国一体化大数 据中心体系,需要布局包括宁夏、甘肃、贵州、成渝、内蒙古、京津冀、长三角 与粤港澳大湾区枢纽等算力网络枢纽,辅以各地数据中心集群,最终实现东西部 网络直连,对全国的数据输送与计算进行一体化调度,从而充分发挥数据要素在 数字中国构建中的重要作用,赋能数据要素高效流通。然而,根据国内外多个研究机构的调查,大多数机构中非结构化数据占全部 数据的8
6、0%以上。数字环境下,大多机构的文件档案管理依赖基于非结构化数据 (即本白皮书所称内容)的解决方案,文件档案与内容有看异常紧密的关系。如 果说数据是一座煤矿,谁能掌握这座煤矿,谁就能为机构发展提供动能,那么文 件档案与内容数据就是潜藏在煤矿深处的钻石,谁能够率先发现这些钻石,谁就 能先人一步洞察和刻画机构内外的种种变化,进一步将数据的价值和潜能释放出 来。国际数据管理协会在其标志性出版物数据管理知识体系指南(DAMA- DMBOK2)(第二版)中将文件档案与内容管理放在了数据管理框架中显著的 位置,凸显了文件档案与内容管理对于数据管理的重要性。然而,现阶段我国大 多数机构管理者和相关人员对文件
7、档案与内容管理的认识尚有不足,文件档案与 内容管理在实践中并没有受到应有的重视。文件档案与内容管理的管理范式与一 般的数据管理相比也存在较大差异,相关方法和技术工具尚不丰富。面对现状与 问题,编写组特别编制了数据管理中的文件档案与内容管理白皮书,为行业 从业人员、用户及潜在用户和社会相关人员提供文件档案与内容管理涉及的基本 概念、效用价值、主要技术、系统功能等通识性知识,以期加强文件档案管理领 域和技术领域的对话和合作,推动文件档案管理事业与内容管理行业的共同发展, 此次更新(2023版)更是追随当下的非结构化数据管理发展脚步,与时俱进,为 读者提供最新的行业实践与发展趋势。本白皮书的编制主要
8、参考了中华人民共和国档案法(2020)、ISO 15489- 1:2016信息与文献文件管理-第1部分:概念与原则、GB/T 18894-2016电 子文件归档与电子档案管理规范、GB/T 36073-2018数据管理能力成熟度评估 模型、数据管理知识体系指南(DAMA-DMBoK2)(第二版)等法律法 规、标准规范和文献材料。2文件、档案与内容管理的相关概念2.1 文件、档案与文档从文件档案管理视角来看,文件(records)是指机构或个人在履行其法定义 务或开展业务活动过程中形成、接收并维护的作为凭证和具有查考作用的信息, 可简称为“业务凭证 1档案(records/archives)是指
9、形成文件的业务活动结束之 后仍然具有保存价值的文件。文档是文件和档案的合称。从计算机技术视角来看,文件(Ele)是作为一个单元存储或处理的命名的记 录集。2文档(document)主要是指非结构化数据。除非特别说明,本白皮书使用的文件、档案、文档概念均来自文件档案管理 领域。2.2 内容、数据与知识从信息的角度来看,内容是指以任何形式或载体存在的有含义和背景的信息。 在计算机技术领域,内容(COntent) 一般指非结构化数据,是非结构化数据厂商 提出的特定概念。在本白皮书中,数据与数字数据同义,是指以数字形式存在的 信息记录。按照数据单元被定义的程度,数据一般包括结构化数据、非结构化数 据以
10、及介于两者之中的半结构化数据。其中,结构化数据是指存储在数据库里,1中华人民共和国国家标准GB/T 26162.1-2010/ISO 15489-1:2001信息与文献 文件管理 第1部分:通则 S2中华人民共和国国家标准GBA 5271.1-2000/ISO/IEC 2382-1:1993信息技术词汇 第1部分:基本术语 S可以用二维表结构来逻辑表达实现的数据。非结构化数据是指未通过数据模型预 先定义的数据。 DAMA国际著,DAMA中国分会翻译组译.DAMA娄好居管理知识体系指南M.北京:树戒工出版社, 2020 : 229而知识是人们通过实践对客观事物及其运动过程和规律的认识,即被人们理
11、 解和认识并经头脑重新组织和系列化的信息,是经验、技能的总结,是组织发展 竞争力的基础。在反复实践和认识的过程中,人脑通过对相关概念的判断、组合 和推理,形成对事物本质的认识,构成头脑中的知识,可称为主观知识,或者称 为隐性知识;如果经过各种载体记录下来,则成为客观知识,也可以被称为显性 知识。2.3 文档管理与内容管理文档管理是一项专业工作,指对文件从生成、处理、流转、归档、移交、鉴 定、保存到利用、处置等全生命周期进行管控的领域。手工环境下文件形成过程 中的管理和档案管理相对独立,数字环境下文档一体化是文件档案管理的基本要 求。内容管理是一个IT产品分支,支持对非结构化数据进行采集、处理、
12、组织、 存储、查询和共享,实现从内容采集、创建、传递到内容分析等整个内容价值链 的整合。从概念来看,文件档案既可能是结构化数据,也可能是非结构化数据。但是 在实践中,文件档案管理系统通常采用非结构化数据管理方案,以结构化数据存 在的文件或者在归档环节被转化为非结构化数据(比如版式电子发票),以便固 化其内容、背景与结构并进行长期保存;或者以数据文件的方式保存在文档系统 中,该数据文件可能是多个业务记录的集合体。虽然内容管理方案是非结构化数据的管理方案,但对内容的管理,需要借助 于描述内容的结构化数据(元数据)展开;对内容的分析、挖掘与开发,则需要 将非结构化数据转化为结构化数据,这是电子文件数
13、据化的重要任务。结构化数 据和非结构化数据,存在互相转化、互相支持、相互协同的关系。2.4 文档生命周期与数据生命周期生命周期是看待和管理文档、内容和数据的重要视角,它倡导将文档、内容 和数据看成一个有始有终、不断发展变化的对象,并根据其不同阶段的特点实施 区别化的管理。其中,文档生命周期是指文件从产生到最终销毁或作为档案永久 保存的整个运动过程。从文档价值来看,文档生命周期包括现行文件、半现行文 件和非现行文件等不同阶段;从管理环节来看,文档生命周期主要包括生成、鉴 定、归档、分类、存储、利用、分析、保存和处置等环节。根据DAMA的界定, 数据生命周期包括计划、设计、创建/接收、存储或处置、
14、利用或复用、增值等环 节,一方面,该定义将生命周期提前到数据实际产生之前的规划设计阶段,这与 1997年国际档案理事会把电子文件划分为设计/概念阶段、形成阶段和维护阶段 异曲同工。另一方面,该定义更为强调数据的增值利用,这提醒文档管理工作人 员也要重视文档的复用和增值。3数据管理框架下的文件档案与内容管理随着文件档案和内容的数据属性逐渐明确,价值逐渐得到认可,文件档案与 内容管理已经成为数据管理的重要组成部分。在DAMA的数据管理功能框架中, 文件档案与内容管理被认为是数据生命周期管理中数据,使用与增强,阶段的组 成部分,如图1所示,在文字描述部分,综合了非结构化数据和文件档案专业管 理的内容
15、。在数据管理的框架下,文件档案与内容管理已经成为机构数字治理和 数据资产化的关键环节,是在数据流转过程中数据价值洞察和挖掘的基础性工作。数据管理职能监督:数据治理文化变革生命周期管理规划和设计实现和维护使用和增强数据架构数娓存储 和运营数据仓库商务智能数扼应模 和设计献越 和互操作大数据存储主数据应用数据货币化主教娓 龌参考数据SU文件和 内容告理预测性分析数据风险管理:安全、隐私、元数据首理I*3图1 DAMA数据管理功能框架尽管DAMA将文件档案与内容管理放到了一个比较高的位置,但是其提出 的数据管理功能框架对于文件档案与内容管理的描述层次比较单薄,对文件档案 与内容管理的价值认知有限。DAMA的数据管理功能框架将文件档案与内容管 理描述为数据生命周期管理中一个特定阶段,即在数据管理中的某个阶段,数据 管理会表现为文件档案与内容管理。但是,文件档案与内容有着更丰富的内涵, 从横向来看,文件档案与内容管理同样存在其生命周期。文件档案与内容的管理 过程与其生命周期相对应,包括文件档案与内容数据的产生、捕获、分类索引、 访