《基于数据全生命周期的数据资产价值评估方法及应用.docx》由会员分享,可在线阅读,更多相关《基于数据全生命周期的数据资产价值评估方法及应用.docx(24页珍藏版)》请在第一文库网上搜索。
1、基于数据全生命周期的数据资产价值评估方法及应用基于数据全生命周期的数据资产价值评估方法及应用1弓I言21 .研究现状32 .数据资产价值评估理论框架和方法52.1数据资产价值评估理论框架62 .1.1基本概念界定63 .1.2数据资产价值评估整体框架72.2数据资产价值评估方法91.1.1 1基础成本的计算101.1.2 血缘继承成本的计算111.1.3 阶梯价格的计算143 .实证分析173.1 1基础成本价173.2 2血缘成本价183.3 阶梯价值结果193.4 阶梯价值结果223.5 实际应用234 .结语24引言数据资产价值评估是现代数据资产管理和运营以及数据流通的基础。基于数据全生
2、命周期理论,从第一性原则出发,通过评估单张数据资产表的成本、数据管理以及数据应用价值,实现对单张数据资产表的系统性评估。利用数据仓库和图算法等技术,以层为单位,每层分摊,血缘路径继承,精确计算得到单张数据资产表的成本价值;然后利用层次分析法得到数据资产非经济因素权重,进而得到数据资产阶梯价值;最后通过实例分析验证了新方法的合理性和可行性。“十四五”数字经济发展规划中指出,数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态。数据要素是数字经济深化发展的核心引擎
3、,需要有序开展数据确权、定价和交易活动,并探索建设与数据要素价值和贡献相适应的收入分配机制。数据资产价值评估是实现数据流通和应用的重要基础,数字经济的发展迫切需要人们对评估数据资产这一课题进行深入研究。在国家大力推动数字经济发展的同时,企业也在积极响应并开展大规模的数字化转型。目前,科技的高速发展使数据在工业生产中的体量日益增大,同时各种技术也日新月异。不论是内部管理方面,还是外部交易方面,企业都需要一套合理的数据资产价值评估方法。数据资产的合理估值对内可以衡量企业数字化建设进程和数据运营效果,对外可以提升数据资产的流动性,如数据交易,给企业提供新的收益来源。从公司价值层面来说,数据资产价值将
4、在企业的会计3张报表中展现或在附录中披露,这将直接影响未来企业的市场估值。目前,世界级科技公司基于大量用户数据进行挖掘和分析以创造商业盈利。然而,数据资产价值的衡量仍缺乏实际的解决方案。广为人知的IBM大数据4V特性意味着大数据的价值评估一定是一个难题。尽管各种关于大数据的研究、挖掘、分析、实践和应用等热门技术都已经取得了显著的成果,但是客观且科学的数据资产价值评估体系和数据交易研究仍处于初期。只有经过科学管理,并且能够被运营转化为应用价值的数据才能算作真正的数据资产。在价值评估方法论方面,传统领域包括无套利定价、收益最大化定价、公平和真实定价。同时,也有一些涉及机器学习的动态数据定价、在线定
5、价以及联合和协作学习中的定价方法。综合目前的数据估值发展研究,总结得出,同时考虑数据的经济因素(如数据成本、市场收益等)和非经济因素(如数据质量、时效性等)是更可行且可操作的方案。迄今为止,数据资产价值评估问题尚未有成熟的解决案例和类似计算器的数据资产价值评估操作系统。本文基于国内互联网行业通用的数据技术,设计并开发了一套数据资产评估模型,旨在解决这个问题。1研究现状数据资产价值评估属于交叉学科,涉及计算机科学、经济学、市场营销学以及新兴的数据科学等多个领域。由于数据具有多面性并且价值评估的目的不同,其原理和侧重点也有一定差异。近年来,随着信息和数字化时代的发展,该领域的研究逐渐受到重视。姚建
6、国等人研究了基于燧的数据价值衡量与定价方法,仅依赖数据交易平台收集到的数据集的浏览点击次数和获得该数据集支付的成本费用信息来对数据进行定价。信息埔定价法充分考虑了数据资产的稀缺性,但该方法缺乏对数据的本质的讨论,没有考虑到实际数据源获取和加工等问题的复杂性。2019年,中国资产评估协会制定了资产评估专家指引第9号一一数据资产评估,阐述了成本法、收益法和市场法3种方法。成本法适用于对个人数据的隐私补偿定价;收益法主要用传统金融学模型对未来现金流和收益做折算,直接量化数据效用,体现买方市场增收;市场法主要基于有效率的交易价格(类似二级市场的股票)的供需关系进行定价。对于难以量化的数据资产来说,市场
7、法(如拍卖和交易)是最公正的方法。然而现实情况是数据交易所的机制并不是对所有的企业都适用的,并且尚未进行规模化发展。闭珊珊等人基于成本法提出了一种数据资产评估的CIME模型,即成本费用、固有价值、市场供求和环境约束4个因素分别对应4种简单的方法:成本评估、层次分析法(ana1ytichierarchyprocess,AHP)评估、市场法评估和收益法评估。但其更侧重于对系统框架的构建和工具的设计,并没有对方案的算法和实现技术进行进一步的精细化设计,同时缺乏落地的结果的合理性检验。熊巧琴等人总结了数据资产的特性、流通方式、交易方式以及不同的数据估值方法和局限性,同时对数据产品作为交易对象和区块链技
8、术如何完善交易体系进行了讨论。但是其仅从理论和研究现状方面进行了总结以及客观评价,并没有给出具体可以进行实际操作的解法。与经典的金融领域中的资产抽象的资产估值问题不同,Babaioff等人认为数据资产具有协同性,即不同的数据集组合可以带来不同的价值;Kerber指出数据资产具有先验不确定性,即如果买方了解该数据资产的详细信息,则数据带来的效用价值难以确定。DemChenko等人认为数据只有满足了6个重要属性,才可以进行价值评估,分别为独立、可靠、可复用、可互换、可操作、可衡量(sovereign,trusted,reusab1e,exchangeab1e,actionab1e,measurab
9、1e),即STREAM原则,这为未来的数据交易提供了一些标准和参考。Pei等人对数据资产评估背后的动机、基础原理和相关方法进行了总结,但该文章仅从理论层面进行探讨,缺乏实际案例。而在信息经济学中,资产估值工作被分为3个阶段:质量衡量、价值衡量和经济效益衡量。资产价值衡量指标如图1所示。其中,质量衡量指标比较可靠,而价值衡量指标和经济效益衡量指标则更多是理论指导,不太具备实际参考价值。现有大多数研究还停留在理论层面,仅对数据的价值评估因素进行描述,如从数据使用者、数据生产者、数据管理者等视角进行分析,或者根据某个学科专业,在该学科的背景下解释数据资产价值问题。然而,数据资产价值问题涵盖的领域非常
10、广泛,目前还没有一套完整的数据资产价值评估方案,能够全面考虑数据从生产到消费的价值链,并能够在实际生产实践中落地,取得明显的效果和成果。本文结合数据的生产和使用路径,基于数据全生命周期的框架,提出了一个具有实际应用意义的企业数据资产价值评估解决方案。该方案使数据从采集阶段便可进入价值评估系统中,同时重点考虑数据存储和加工的价值转化过程,让资产价值从数据源沿着数据仓库加工链路流动到数据实际应用层。数据资产价值可以从单张表的维度进行计算、查询和监控,使企业可以在内部对运营情况进行量化评估,在外部为数据在交易市场上流通提供价值参考。本文的创新性体现在3个方面:首先,从数据加工角度结合数据仓库的理论和
11、大数据的特征,提出了数据成本和数据血缘的成本继承思想,并通过图算法解决其中相关路径问题,开创性地对单表数据资产进行价值评估;其次,设计了非经济因素和专家打分机制,将行业相关性重点且灵活地反映在关键指标上,使用期望回报率代表数据的本身效能和使用价值。最后,本文提供了实证结果验证,并研发了数据资产价值计算器产品,有利于方案后续效果评估数据的积累和更多行业的覆盖性应用。有效性(准确率)完整性(覆盅率)完整性(合理性)一致性I稳定性I质蝌衡量指标时效性I独特性I楮确性I可达性I费产价值篇最指标1价值衡量指标-信息内在价值“效性,完整性柿缺性),生命周期信总商业价值关联度效性完整性失效庭一信息绩效价值一
12、信息成本价值空息市场价值信息经济价值经济效益衡时指标图1资产价值衡量指标2.数据资产价值评估理论框架和方法2.1 数据资产价值评估理论框架2.1.1 基本概念界定在数据资产价值评估中,需要明确数据交易范围、数据隐私和数据归属这几个基本假设。具体而言,在数据交易方面,需要交易已经被清洗和分析过的应用层数据,而底层数据尚未被处理;在数据隐私方面,数据需要存储在数据管理系统中,并采取适当的权限保护措施,以避免因共享而导致的数据泄露;在数据归属方面,交易双方需要确保数据的归属权,并确保使用方向数据表归属方付费。数据的全生命周期是指数据采集、传输、存储加工,以及数据后续使用的从生产到消费的全周期。该方法
13、沿着该链路讨论各个环节的重要影响因子。数据规范加工和生产是数据资产价值评估的基石。在数据成本分摊计算中,依照数仓维度建模准则,数据加工方法如下。数据仓库由数据仓库之父比尔恩门(BiI1Inmon)于1990年提出。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据系统。范式建模是一种基于特定范式的建模方法,从数据源到公司级数据仓库再到部门级数据集市,可以减少数据冗余,提高数据的一致性和稳定性。维度建模采用的是从数据集市、数据仓库到分散的异构数据源自下而上的建模方式。维度建模允许将维度信息适度冗余到事实表中,以提高易用性和查询效率。目前,传统行业(如银行等)普遍使用范式建模,而互联
14、网公司则普遍采用维度建模。在维度建模基础上发展了OneData建模规范:将公共数据划分为操作型数据仓储(OPerationa1datastore,ODS)和通用数据模型(CommOndatamode1,CDM)两层。ODS主要完成基础数据引入开放数据处理服务(opendataprocessingservice,ODPS)(一种阿里云自主研发的分布式处理服务),CDM主要完成公共数据加工与整合,建立一致性的维度,构建明细事实表和公共汇总事实层。明细粒度事实层将业务过程作为建模驱动,基于每个具体的业务过程特点,构建最细粒度的明细层事实表,将明细层事实表的某些重要维度属性字段进行适当冗余,也就是宽表
15、化处理。公共汇总粒度事实层将分析的主题对象作为建模驱动,基于上层应用和产品的指标需求,构建公共粒度的汇总指标事实表,并采用宽表化手段物理化模型。在公共层的基础上,还有应用数据(app1icationdataservice,ADS)层,存放数据产品个性化的指标数据,计算CDM中间层针对业务的数据产出。通常情况下,越靠近数据源的层的数据加工难度越大。CDM层要求数据设计和数据加工严谨,而ADS层对数据的要求会随着业务的建设和需求变化更加灵活和随意。这种层层隔离的设计既保障了数据的严谨性,又保障了业务的灵活性,同时也给复杂数据的处理留足了空间。所有可售卖和调用的数据都会放在ADS层进行统一管理。2.
16、1. 2数据资产价值评估整体框架数据资产的价值受到多种因素的影响,涉及广泛的知识和技术领域。通过对数据全生命周期的透明化分析和管理,针对不同阶段的数据生产到消费过程,可以使用各种技术来衡量相关的要素影响。在数据管理领域,学术界和产业界的研究人员提出了不同的数据生命周期理论。阿里巴巴基于多年在大数据领域的实践,从“混通晒、存管用”逐步演进到“汇通管用”。其中,数据的全生命周期透明化管理对数据资产运营和数据资产价值发挥着重要的作用,数据的“汇通管用”全生命周期如图2所示。络知数据阪餐保障,全帏路I1i控林彩竹网,业务模型管即Z*数他模M管理标准管网Er1过程管理数抠开发看h算法开发、各级领导运雄人员敷箫汇聚评估.评数据治理成果评估