基于数据全生命周期的数据资产价值评估方法及应用.docx

上传人:lao****ou 文档编号:937954 上传时间:2024-07-31 格式:DOCX 页数:16 大小:222.72KB
下载 相关 举报
基于数据全生命周期的数据资产价值评估方法及应用.docx_第1页
第1页 / 共16页
基于数据全生命周期的数据资产价值评估方法及应用.docx_第2页
第2页 / 共16页
基于数据全生命周期的数据资产价值评估方法及应用.docx_第3页
第3页 / 共16页
基于数据全生命周期的数据资产价值评估方法及应用.docx_第4页
第4页 / 共16页
基于数据全生命周期的数据资产价值评估方法及应用.docx_第5页
第5页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于数据全生命周期的数据资产价值评估方法及应用.docx》由会员分享,可在线阅读,更多相关《基于数据全生命周期的数据资产价值评估方法及应用.docx(16页珍藏版)》请在第一文库网上搜索。

1、基于数据全生命周期的数据资产价值评估方法及应用引言“十四五”数字经济发展规划中指出,数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态1。数据要素是数字经济深化发展的核心引擎,需要有序开展数据确权、定价和交易活动,并探索建设与数据要素价值和贡献相适应的收入分配机制。数据资产价值评估是实现数据流通和应用的重要基础,数字经济的发展迫切需要人们对评估数据资产这一课题进行深入研究。在国家大力推动数字经济发展的同时,企业也在积极响应并开展大规模的数字化转型。目前,科技

2、的高速发展使数据在工业生产中的体量日益增大,同时各种技术也日新月异。不论是内部管理方面,还是外部交易方面,企业都需要一套合理的数据资产价值评估方法。数据资产的合理估值对内可以衡量企业数字化建设进程和数据运营效果,对外可以提升数据资产的流动性,如数据交易,给企业提供新的收益来源。从公司价值层面来说,数据资产价值将在企业的会计3张报表中展现或在附录中披露,这将直接影响未来企业的市场估值。目前,世界级科技公司基于大量用户数据进行挖掘和分析以创造商业盈利。然而,数据资产价值的衡量仍缺乏实际的解决方案。广为人知的IBM大数据4V特性意味着大数据的价值评估一定是一个难题。尽管各种关于大数据的研究、挖掘、分

3、析、实践和应用等热门技术都已经取得了显著的成果,但是客观且科学的数据资产价值评估体系和数据交易研究仍处于初期。只有经过科学管理,并且能够被运营转化为应用价值的数据才能算作真正的数据资产。在价值评估方法论方面,传统领域包括无套利定价、收益最大化定价、公平和真实定价。同时,也有一些涉及机器学习的动态数据定价、在线定价以及联合和协作学习中的定价方法2。综合目前的数据估值发展研究,总结得出,同时考虑数据的经济因素(如数据成本、市场收益等)和非经济因素(如数据质量、时效性等)是更可行且可操作的方案。迄今为止,数据资产价值评估问题尚未有成熟的解决案例和类似计算器的数据资产价值评估操作系统。本文基于国内互联

4、网行业通用的数据技术,设计并开发了一套数据资产评估模型,旨在解决这个问题。一、研究现状数据资产价值评估属于交叉学科,涉及计算机科学、经济学、市场营销学以及新兴的数据科学等多个领域。由于数据具有多面性并且价值评估的目的不同,其原理和侧重点也有一定差异。近年来,随着信息和数字化时代的发展,该领域的研究逐渐受到重视。姚建国等人3研究了基于燧的数据价值衡量与定价方法,仅依赖数据交易平台收集到的数据集的浏览点击次数和获得该数据集支付的成本费用信息来对数据进行定价。信息焙定价法充分考虑了数据资产的稀缺性4,但该方法缺乏对数据的本质的讨论,没有考虑到实际数据源获取和加工等问题的复杂性。2019年,中国资产评

5、估协会制定了资产评估专家指引第9号一一数据资产评估5,阐述了成本法、收益法和市场法3种方法。成本法适用于对个人数据的隐私补偿定价6;收益法主要用传统金融学模型对未来现金流和收益做折算,直接量化数据效用,体现买方市场增收;市场法主要基于有效率的交易价格(类似二级市场的股票)的供需关系进行定价。对于难以量化的数据资产来说,市场法(如拍卖和交易)是最公正的方法。然而现实情况是数据交易所的机制并不是对所有的企业都适用的,并且尚未进行规模化发展。闭珊珊等人7基于成本法提出了一种数据资产评估的CIME模型,即成本费用、固有价值、市场供求和环境约束4个因素分别对应4种简单的方法:成本评估、层次分析法(ana

6、1ytichierarchyprocess,AHP)评估、市场法评估和收益法评估。但其更侧重于对系统框架的构建和工具的设计,并没有对方案的算法和实现技术进行进一步的精细化设计,同时缺乏落地的结果的合理性检验。熊巧琴等人8总结了数据资产的特性、流通方式、交易方式以及不同的数据估值方法和局限性,同时对数据产品作为交易对象和区块链技术如何完善交易体系进行了讨论。但是其仅从理论和研究现状方面进行了总结以及客观评价,并没有给出具体可以进行实际操作的解法。与经典的金融领域中的资产抽象的资产估值问题不同,BabaiOff等人9认为数据资产具有协同性,即不同的数据集组合可以带来不同的价值;Kerber10指出

7、数据资产具有先验不确定性,即如果买方了解该数据资产的详细信息,则数据带来的效用价值难以确定。Den1ChCnkO等人11认为数据只有满足了6个重要属性,才可以进行价值评估,分别为独立、可靠、可复用、可互换、可操作、可衡量(sovereign,trusted,reusab1e,exchangeab1e,actionab1e,measurab1e),即STREAM原则,这为未来的数据交易提供了一些标准和参考。Pei等人2对数据资产评估背后的动机、基础原理和相关方法进行了总结,但该文章仅从理论层面进行探讨,缺乏实际案例。而在信息经济学12中,资产估值工作被分为3个阶段:质量衡量、价值衡量和经济效益衡

8、量。资产价值衡量指标如图1所示。其中,质量衡量指标比较可靠,而价值衡量指标和经济效益衡量指标则更多是理论指导,不太具备实际参考价值。图1资产价值衡量指标现有大多数研究还停留在理论层面,仅对数据的价值评估因素进行描述,如从数据使用者、数据生产者、数据管理者等视角进行分析,或者根据某个学科专业,在该学科的背景下解释数据资产价值问题。然而,数据资产价值问题涵盖的领域非常广泛,目前还没有一套完整的数据资产价值评估方案,能够全面考虑数据从生产到消费的价值链,并能够在实际生产实践中落地,取得明显的效果和成果。本文结合数据的生产和使用路径,基于数据全生命周期的框架,提出了一个具有实际应用意义的企业数据资产价

9、值评估解决方案。该方案使数据从采集阶段便可进入价值评估系统中,同时重点考虑数据存储和加工的价值转化过程,让资产价值从数据源沿着数据仓库加工链路流动到数据实际应用层。数据资产价值可以从单张表的维度进行计算、查询和监控,使企业可以在内部对运营情况进行量化评估,在外部为数据在交易市场上流通提供价值参考。本文的创新性体现在3个方面:首先,从数据加工角度结合数据仓库的理论和大数据的特征,提出了数据成本和数据血缘的成本继承思想,并通过图算法解决其中相关路径问题,开创性地对单表数据资产进行价值评估;其次,设计了非经济因素和专家打分机制,将行业相关性重点且灵活地反映在关键指标上,使用期望回报率代表数据的本身效

10、能和使用价值。最后,本文提供了实证结果验证,并研发了数据资产价值计算器产品,有利于方案后续效果评估数据的积累和更多行业的覆盖性应用。二、数据资产价值评估理论框架和方法2.1 数据资产价值评估理论框架2.1.1 基本概念界定在数据资产价值评估中,需要明确数据交易范围、数据隐私和数据归属这几个基本假设。具体而言,在数据交易方面,需要交易已经被清洗和分析过的应用层数据,而底层数据尚未被处理;在数据隐私方面,数据需要存储在数据管理系统中,并采取适当的权限保护措施,以避免因共享而导致的数据泄露;在数据归属方面,交易双方需要确保数据的归属权,并确保使用方向数据表归属方付费。数据的全生命周期是指数据采集、传

11、输、存储加工,以及数据后续使用的从生产到消费的全周期。该方法沿着该链路讨论各个环节的重要影响因子。数据规范加工和生产是数据资产价值评估的基石。在数据成本分摊计算中,依照数仓维度建模准则,数据加工方法如下。数据仓库由数据仓库之父比尔恩门(Bi111nmon)于1990年提出。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据系统。范式建模是一种基于特定范式的建模方法,从数据源到公司级数据仓库再到部门级数据集市,可以减少数据冗余,提高数据的一致性和稳定性。维度建模采用的是从数据集市、数据仓库到分散的异构数据源自下而上的建模方式。维度建模允许将维度信息适度冗余到事实表中,以提高易用性和

12、查询效率。目前,传统行业(如银行等)普遍使用范式建模,而互联网公司则普遍采用维度建模。在维度建模基础上发展了OneData建模规范:将公共数据划分为操作型数据仓储(operationa1datastore,ODS)和通用数据模型(commondatamode1,CDM)两层。ODS主要完成基础数据引入开放数据处理服务(OPendataPrOCeSSingService,ODPS)(一种阿里云自主研发的分布式处理服务),CDM主要完成公共数据加工与整合,建立一致性的维度,构建明细事实表和公共汇总事实层。明细粒度事实层将业务过程作为建模驱动,基于每个具体的业务过程特点,构建最细粒度的明细层事实表,

13、将明细层事实表的某些重要维度属性字段进行适当冗余,也就是宽表化处理。公共汇总粒度事实层将分析的主题对象作为建模驱动,基于上层应用和产品的指标需求,构建公共粒度的汇总指标事实表,并采用宽表化手段物理化模型。在公共层的基础上,还有应用数据(app1icationdataservicc,ADS)层,存放数据产品个性化的指标数据,计算CDM中间层针对业务的数据产出。通常情况下,越靠近数据源的层的数据加工难度越大。CDM层要求数据设计和数据加工严谨,而ADS层对数据的要求会随着业务的建设和需求变化更加灵活和随意。这种层层隔离的设计既保障了数据的严谨性,又保障了业务的灵活性,同时也给复杂数据的处理留足了空

14、间。所有可售卖和调用的数据都会放在ADS层进行统一管理。2.1.2 数据资产价值评估整体框架数据资产的价值受到多种因素的影响,涉及广泛的知识和技术领域。通过对数据全生命周期的透明化分析和管理,针对不同阶段的数据生产到消费过程,可以使用各种技术来衡量相关的要素影响。在数据管理领域,学术界和产业界的研究人员提出了不同的数据生命周期理论。阿里巴巴基于多年在大数据领域的实践,从“混通晒、存管用”13逐步演进到“汇通管用”14。其中,数据的全生命周期透明化管理对数据资产运营和数据资产价值发挥着重要的作用,数据的“汇通管用”全生命周期如图2所示。图2数据的“汇通管用”全生命周期数据的“汇通管用”4个阶段被

15、用于数据资产的管理和应用。在这4个阶段中,“汇”代表汇聚异构数据的全过程,“通”代表数据治理的完备和连贯,“管”指全量数据资产的管理,“用”则强调数据应用服务的作用。基于这4个阶段相关的因素,进一步拆解构成数据资产价值评估模型,如图3所示。 “汇”:包含数据成本的采集和追踪,包括对数据成本的录入和维护模块。 “通”:基于数据仓库理论的数据血缘继承成本分摊模块。 “管”:从非经济因素如数据质量管理要素和数据应用要素的角度来评价数据资产的价值。 “用”:考虑公司整体情况和所处行业,给出对应的数据资产行业回报率。整体数据资产价值评估流程如下。首先,对数据生产成本进行全面梳理和归纳,参考资产评估专家文

16、件,对数据的各项成本归纳。本文将数据成本总结为建设成本、机器成本、知识发现、软件成本、运维成本。其次,追踪数据成本,将可收集到的成本全部分摊给数据资产表的根节点。通过数据的血缘传递关系,沿着数据加工血缘传播数据成本。然后,基于已有数据管理评分维度的总结,本文建立了数据管理评分体系,包括数据质量要素和数据使用要素。数据管理因素主要解释数据研发后的运维和运营情况。本文采用数据质量评价指标和数据应用评价指标,并通过层次分析法对数据的非经济因素进行评价,从而得到单张数据资产表的数据管理分数。最后,通过分析公司的经营情况得出整体的行业回报率,并将数据管理分数拟合成每张表的数据资产回报率。企业的整体资产回报率与所处行业以及该行业的数字化建设能力相关。目前缺乏相关数据或有效的交易市场,因此,本文用企业期望值代替。3个模块:数据源接入、数据ET1建

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服