《医院临床运营和科研大数据平台的基础架构方案.docx》由会员分享,可在线阅读,更多相关《医院临床运营和科研大数据平台的基础架构方案.docx(29页珍藏版)》请在第一文库网上搜索。
1、医院临床、运营和科研大数据平台的基础架构方案应用需求决定平台架构,平台架构决定基础架构。三甲医院大数据应用场景主要分成临床、运营、科研三大类,分别对应临床数据中心(CDR),运营数据中心(ODR)和科研数据中心(RDR),临床数据以电子病历为核心,目前随着结构化电子病历的普及,纯文本的数据越来越少,N1P的技术依然适合,运营数据则大多数为结构化数据,科研数据则在临床数据的基础上有更多的多媒体数据(多数为影像数据)、实验数据和随访数据。大数据平台基础架构设计需要支撑上述需求的实现,计算能力、存储能力和安全是基础架构建设的三个重要方面。计算能力主要在数据采集、预处理、实时计算和分析阶段进行支持。存
2、储能力则是支持分析数据所需要存储资源和存储空间的支持。三甲医院大数据平台大多数基于HadoOP等分布式平台,采用内存数据库或图数据库进行数据存储。为帮助三甲医院用户更好地建设大数据平台基础架构,twt社区上个星期组织了“三甲医院如何建设支持临床、运营和科研大数据平台的基础架构?”线上同行交流活动,特别邀请到自三甲医院的专家、戴尔科技医疗行业专家与医院同行一起交流分享,现将从四个角度出发的交流内容总结如下,供更多同行参考,包括:基于临床、运营和科研大数据平台的内容和要求角度、基于医院大数据平台建设的技术架构角度、基于大数据平台建设标准和目标角度、基于大数据的存储规划角度,以及交流达成的共识总结。
3、交流达成的共识总结通过本场医院同行的交流活动达成了一些交流共识如下,仅供参考:(1)从大数据平台建设内容方面来说,医院大数据平台围绕临床、运营以及科研等三个主要层面进行,新技术,新手段也都需要围绕这三个方面,因此,CDR.ODR.RDR的建设应该说是囊括了医院信息化大数据平台的主要内容。(2)从技术架构角度来说,基于分布式存储的架构平台似乎成为主流,但是目前正在逐步从分布式过渡到云,主要以医院的私有云+公有云的混合模式出现。(3)从建设标准和目标角度,大数据平台应具有异构数据的标准化,数据处理流程,分析过程标准化的功能,同时,数据可视化也应是目标之一。(4)从数据存存储选型角度,混合SSD和传
4、统SATA的存储器搭建SAN网络是一种路线,分布式存储的效果主要体现在不少医院早些年建成的基于Hadoop架构。从科研平台未来的发展看,采用支持HaCIc)OP的分布式存储,实现计算与存储的分离,是未来的一个趋势。一、基于临床、运营和科研大数据平台的内容和要求角度1、三甲医院大数据平台如何建设,才能满足具有多模态,异构化,海量化的临床、运营以及科研数据的整合?【问题描述】众所周知,三级医院经过十几年、几十年的信息化建设,已经建设成为具有临床数据支撑,科研支撑,以及运营支撑的全方位信息化应用的场景,但是随着大数据分析广泛应用,海量数据的整合挖掘及再利用也提上日程,部分医院走在了前列,但是在开展的
5、过程中遇到了不少问题,比如,数据的模式的多样性造成了对数据使用的难点。医疗数据中包含了文本,图像,视频等,还有不同模式的数据。如何将这些数据整合利用,以便发挥数据的最大利用价值成为目前医疗大数据平台的研究方向之一?zyp8365广东省中医院高级工程师:数据的多模态、异构化、海量化必然导致其支撑架构的多样性。哪些数据适合关系型数据库,哪些数据适合分布式数据库,存储的选择亦是如此,也要结合数据类型,数据的重要性、时效性要求以及业务的实际要求等因素综合考虑。数据的整合利用离不开如下几个方面的工作:1、大数据平台需求与多元化采集数据源的梳理;2、数据的标准化规范化治理;3、数据的主题化的汇聚;4、数据
6、的知识化社会化的应用。spgoa11和祐国际医院信息管理部部长:可以考虑先建立数据湖,把数据整合后,再按主题做筛选和清洗。unter123戴尔科技医疗行业解决方案架构师:医疗数据的来源和类型都非常的丰富,一般来讲至少包含了HIS、EMR.1IS.RIS、人事系统、随访系统、手麻、护理等等各个业务平台,数据类型包含结构化数据、非结构化文本、图片、甚至有的会包括一些多媒体数据,而这些数据的复制、导入都有各自的方式。所以在大数据平台的建设中,除了数据量的考量,还需要充分考虑到对多样化数据的集成问题,需要支持丰富的数据访问接口,以减少对数据集成带来的困难。同时在使用这些数据时,首先需要遵循国内、国际的
7、相关标准,进行数据治理和标准化,然后将标准化后的数据按照不同场景进行计算整合,提供给业务使用。2、信息部门该如何规划CDR、ODR.RDR的裸金层?【问题描述】当前建设CDR、ODR.RDR数据中心是医疗圈热门的话题,信息部门该如何规划CDR、ODR.RDR的裸金层,一次把基础架构搭建立起来,避免重复建设?zyp8365广东省中医院高级工程师:目前,CDR.ODR.RDR的定位和作用医疗圈是有共识的,但是其建设方式、模式及数据交互方式尚处于百花齐放的阶段。不同的公司有各自的解决方案,不同的医院和机构也根据自己实际业务的需求和特点进行着有针对性的建设,所以我理解因为其建设的非标准化特性,希望有一
8、种规划、或者一种模式把基础架构搭建起来,然后后续不再变动,不再调整,从而避免重复建设,这种本身是与信息化技术与发展的日新月异的特性和特点相违背的。当下,数字中国日益提上日程、物联网、5G的快速应用、区块链、数字李生、人工智能等新技术与医疗的融合也将日益紧密,数据中台的讨论也不绝于耳。所以CDR、ODR.RDR这种适合当下的数据层架构和方法论是否适合未来3-5年的技术发展尚不可知,所以其基础架构的不确定性也更加不能形成定论。目前就CDR、ODR、RDR的建设而言,个人觉得,应该把握几个建设原则:(1)分类原则。不管技术如何发展,架构如何调整,数据的分类应该是不会有太大的调整。结构化、半结构化、非
9、结构化,其适宜的存储架构是有明确的规范和要求的,数据的重要性与否,数据的响应时效要求,数据容灾要求,这些都是数据分类的具体指标,也为我们底层架构的建设提供指引,避免低需高配和高需低配的情况出现,保证需求和配置的相适宜;所以针对不同数据类型和数据要求,要有与之相适应的存储底层,故数据中心的裸金层也是存在多种架构存在的。(2)可扩展原则。CDR、ODR和RDR,在建设初期,因为需求的不明确、中心数据的磨合、与各业务系统的交互和上层应用的梳理等原因,前期数据体量不会太大,随着业务的推进,技术、流程和方法的日趋成熟,需求也会处于井喷期,其数据增长也会指数型增长,原来的架构应该要充分考虑其可扩展性,以及
10、扩展后保证数据性能、数据时效响应等方面不会下降。Hunter123戴尔科技医疗行业解决方案架构师:没有一蹴而就的系统,也没有一招鲜吃遍天的技术;针对临床数据中心(CDR),运营数据中心(ODR)和科研数据中心(RDR)不同的特点可以用不同的技术方法来满足要求;CDRODR更多是结构化数据,数据量相对较小,可以采用关系型数据库+SAN存储的模式;如戴尔科技PoWerStOre企业级全闪存存储;RDR涉及海量数据同时对算力要求非常高,可通过医疗数据湖+HPC高性能计算集群来满足业务要求;数据湖建设要考量海量数据复制迁移(多项目使用是否要拷贝多份)、生命周期管理(性能容量要求和建设成本的矛盾);戴尔
11、科技PoWerSCaIe+ECS数据湖方案可以实现整合应用、消除孤岛、提高效率、降低成本,并且有丰富的三甲医院案例,可联系我们当地技术支持人员做进一步沟通交流;3、医疗大数据方面如何解决数据孤岛和数据安全问题?【问题描述】在医疗数据收集方面存在很多检查设备,例如:纤支镜等单设备无法提取数据的问题。大数据处理过程中,如何保障数据的安全,以及隐私隐私问题?zyp8365广东省中医院高级工程师:目前,的确存在很多单体设备的数据提取、存储的问题,尤其是对一些专有设备如纤支镜、脑电图等,这些数据的采集要相应的设备厂家能开放相应的数据接口,目前很多这些设备的厂家基本都会有自己开发的系统,也有一些厂家会开发
12、相应的系统,对市面上的比较高占有率的产品类型进行数据的提取开发。所以建议在采购该类设备的时候,一定要注意关注数据提取这块,数据接口是否开放?通过特定数据线抑或是网络传输?是否要专有信息系统抑或是市面上有可以统一汇集提取的软件?这些都要考虑并且也要写入采购合同中。大数据处理要严格执行等保2.O的相关要求,数据的处理可以通过堡垒机等安全措施进行操作,另外可以通过脱敏设备对敏感数据进行脱敏,并且形成相应的规范流程便于操作。数据安全要重视设备的投入、人员的管理、技术的提升,也要关注架构的合理、流程的规范、举措的到位。spgoa11和祐国际医院信息管理部部长:检查设备数据传输问题还是设备本身是否支持数据
13、输出接口,这个需要联合设备科在购买设备的时候就要把数据传输接口需求写入招标文件。大数据处理过程中的数据安全也应该基于三级等保2.0的要求严格执行,隐私问题还要增加动态脱敏、数据库防火墙等设备HUnterI23戴尔科技医疗行业解决方案架构师:大数据最终为具体应用服务,数据的价值需要在具体应用场景才能最大化;数据采集作为大数据应用的第一步,是大数据平台的基础;针对没有应用场景需求的设备,可暂缓数据采集;同时在未来的设备选型中,明确数据采集接口的要求,为后续大数据应用打下基础,等保2.0有完善的安全体系要求,就数据安全而言,戴尔科技有完善的数据备份,数据容灾,数据中勒索病毒后快速恢复,数据避风港等解
14、决方案。详情可以咨询戴尔当地的销售和售前同事。大数据隐私保护,可通过数据脱敏及防泄密等安全手段进行防护;4、关于科研大数据平台底层基础架构【问题描述】科研大数据平台现在发展方向主要有四个方向:影像,大样本分析,多模杰,真实世界研究,目前以真实世界研究居多,但是趋势是往多模态方向发展,这就要求传统的文本,结构化数据处理外,还需要结合影像图片,甚至是超声之类的视频,对于这类数据处理,底层基础架构如何支撑?zyp8365广东省中医院高级工程师:存储层面可以考虑分布式存储、对象存储等方式;数据层面可以考虑分布式数据库、图数据库等方式。UnterI23戴尔科技医疗行业解决方案架构师:科研数据类型越来越多
15、样化,应用软件对底层基础架构的接口也越来越多样化,从传统的NAS(SMB/NFS等)协议,到对象存储S3以及HDFS(HadoOP分布式文件系统);这就需要底层存储架构架构满足丰富的非结构化文件接口要求,同时满足同一份数据被不同方式调用,避免数据重复存储,造成资源浪费;同时科研数据体量大,底层存储要具备高扩展性,只有真正意义上的分布式存储可满足要求;同时科研平台对算力的要求也特别高,需要一套匹配的高性能计算集群(HPC)才能真正发挥数据的价值;计算存储分离的架构,也更方便后续灵活扩展算力或者存储资源,灵活响应科研需求;5、三甲医院科研大数据平台应该具备哪些主要功能?【问题描述】结合现今人工智能
16、,数据科学的流行,三甲医院对科研的发展愈加的重视,对于一个能够完美支撑三甲医院科研的数据平台是非常必要的,但是从业务和建设者角度来看,临床科研的需求和计算机专业从业者之间对于技术平台的理解还有一定的差异,那么科研平台应该具有什么样的功能,才能满足或推动临床科研的进一步发展十分重要,这也是具备信息技术的从业人员需要搞清楚的问题。zyp8365广东省中医院高级工程师:科研平台作为医院科研领域重要的业务平台,要结合科研业务的特点进行功能的设计。因为科研业务的复杂性和多样性,所以也就导致科研平台的功能是十分复杂、十分多样的成体系的存在。但是几个大的功能科研平台还是应该具备的:1、数据的查询和提取功能。科研业务的重要对象就是对数据的分析,针对某一科研项目需求,能从平台中查询并提取出研究所需要的数据,这个应该是平台必备的功能;2、科研信息图谱的查询。