《医院关键业绩指标的核心——数据仓库.docx》由会员分享,可在线阅读,更多相关《医院关键业绩指标的核心——数据仓库.docx(4页珍藏版)》请在第一文库网上搜索。
1、医院关触绩指标的核心一数据仓库目录刖舌11 .在线联机分析12 .数据挖掘与数据分析2刖百数据仓库是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为决策需要而产生的“后浪”,它并不是所谓的“大型数据库”。数据仓库是为了充分利用已有的数据资源,帮助用户更好地理解信息,发现模式和趋势,从中挖掘出信息和知识,更好地进行辅助决策。医院数据仓库系统是数据仓库技术在医学领域的具体实现,其用户主要是医院的医生、护士和管理人员,是对临床数据的开发与利用。医院数据仓库系统的建立对于医院管理、临床治疗和医学研究等相关领域都有着巨大的推动力。1 .在线联机分析在线联机分析(OLAP)应用是在数据仓库技术的基
2、础之上利用数据分析技术对数据进行不同维度的切片处理分析,可得到医院经营情况、收益、投资和汇报等医院绩效评估依据。利用业界标准的具有商业应用价值的统计算法对跨越整个医院的数据进行统计分析,形成对医院现状的统计特征,从而使高层管理者能够从更宏观的角度把握医院的经营状况。如现有资源使用情况统计分析、现有服务情况统计分析、供应商/合作伙伴给医院带来的利润统计分析以及医护人员的作业情况比较等。从功能上讲,经营分析应用涵盖病人账户情况分析、业务发展分析、收益情况分析、市场竞争分析、服务质量分析、营销管理分析、大客户分析、新业务与现有业务分析、合作服务方分析等方面的主题。OALP应用的主要效益体现在:通过汇
3、集医院内外的数据,以及合理运用智能分析工具,使医院决策层、管理层能更方便、更及时地获取关键的管理和业务信息;利用信息挖掘商业价值,辅助决策层对企业的全面监控;通过对内外部数据的分析和利用,为战略制订、业务拓展、自主定价和运营体系的改善提供决策支持。目前数据仓库在医学领域的应用主要集中在以下几个方面:1)疾病辅助诊断:采用数据仓库和数据挖掘技术对病人资料数据库中大量历史数据进行处理,挖掘出有价值的诊断关联规则,这样根据病人的年龄,性别、辅助检查结果和生理生化指标等就可以作出诊断结论,从而排除了人为因素的干扰,具有较强的客观性。2)疾病辅助治疗:建立医学专病的临床治疗方案数据仓库,将各种治疗方案所
4、有病例的检查指标、诊断和治疗过程以及疗效进行存储与分析,在积累到一定病例后,就有可能对治疗方案的各种影响因素进行评估,有利于改进治疗方案。3)药品管理:将各种药品的数据进行整理,对其成分、用法、主治和副作用等信息进行处理,建药品管理将各种药品的数据进行整理,对其成分、用法、主治和副作用等信息进行处理,建立统一的药品管理数据仓库,对于各种药物的利用和研究都有很大的意义。4)药品开发:在新药的研究开发中,采用数据仓库和数据挖掘技术,在关键环节先导化合物的发掘方面寻找同药效学相关的有效化学物质基础,确定药效基团,指导新药的研究与开发,从而缩短新药的研究开发周期,降低研发费用。2 .数据挖掘与数据分析
5、随着信息技术的高速发展,各个领域所积累的数据呈指数级增长,数据的丰富带来了对强有力的数据分析工具的需求。如何从信息的汪洋大海中自动并高效地提取所需的有用知识,提高信息利用率,成为迫切需要解决的问题。如何将底层的数据转变成一一种知识就需新的方法来处理这些海量的数据。于是人们结合统计学、数据库和机器学习等技术,提出数据挖掘技术来解决这一难题。数据仓库和数据挖掘都是决策支持技术,但两者的辅助决策方式不同。数据仓库是在数据库的基础上发展起来的,它将传统数据库中大量的、详细的和不同格式的数据按照决策需求进行集成和重新组织,从而可以为不同需求的用户提供统一的数据源。数据挖掘是通过知识的关联,挖掘现有数据中
6、隐含的信息,给用户提供更为深入和丰富的信息,可以让用户在决策分析中使用。数据挖掘于1989年第11届国际联合人工智能学术会议上首次提出,其又称知识抽取(information extraction)、信息发现(information discovery)、知识发现(knowledge discovery)、智能数据分析(intelli-gent data analysis)、信息收获(information harvesting)等。在人工智能领域习惯称之为知识发现(knowledgediscovery in database, KDD)01)数据挖掘的定义:数据挖掘就是从大量的、不完全的、有
7、噪声的、模糊的和随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的并且最终可理解的信息和知识的过程。这个定义包括几层含义:数据源必须是真实的、大量的和含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解和可运用;发现的知识支持特定的被发现的问题。它涉及多学科的集成,包括数据库技术、统计、机器学习、高性能算法和模式识别等诸多内容。2)数据挖掘的功能:数据挖掘的功能主要由两部分组成:描述型(descriptive)和预测型(predic-tive)。描述型的任务是指描述数据库中数据的某些特性。预测型的任务是指从现有数据中进行总结并且推断后续数据的变化状况。主要有以下功能:(
8、1)分类(cassification):就是通过分析样本客户数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他客户的记录进行分类。在使用上,既可以用此模型分析已有的数据,也可以用它来预测未来的数据。(2)预测(prediction):利用历史数据建立模型,再运用最新的数据作为输入值,获得未来变化的趋势或评价给定样本可能具有的属性值或值的范围。如根据已有的蛋白质结构知识对新发现或合成的蛋白质预测其规律等。(3)聚类(clustering):即“物以类聚”。它是分类的逆向方法。聚类把没有分类的记录在不知道应分成几类的情况下,按照数据内在的差异性大小合理
9、地划分成几类,并确定每个记录所属类别。(4)关联(asociation):是从大量的数据中发现项集之间的有趣的联系、相关关系或因果结构,以及项集的频繁模式。(5)时间序列(sequential):又称趋势分析,它是从相当长时间的发展中发现规律和趋势。和关联分析相似,但侧重点在于分析数据间的前后因果关系。(6)偏差分析(deviation):又称比较分析,它是对偏差和极端特例的描述,由于揭示事物偏离常规的异常现象,如标准类外的特例,数据聚类外的离群值等。数据分析常用技术可分为统计分析、决策分析和数据挖掘三大类,在数据挖掘技术日益发展的同时: 许多数据挖掘的软件工具也逐渐问世,主要分为通用的和针对
10、特定领域的数据挖掘工具两大类。(1)通用数据挖掘工具:不区分具体数据的含义,处理常见的数据类型。如SPSS公司的Clemen-tine、SAS软件包BM公司Almaden研究中心开发的QUEST系统、SGI公司的MineSet系统、加拿大SimonFraser大学开发的DBMiner系统、开源的 WEKA (Waikato Environment for Knowledge Analysis), 以及 Google 新近发布的 Google Corelate 等。(2)针对特定领域的数据挖掘工具:在设计算法时充分考虑到数据和需求的特殊性。如澳大利亚的Track公司开发的医院管理信息挖掘工具SpeedMiner,通过对医院特定的数据进行汇总和分析,给医院管理层提供决策帮助。第4页共4页