《临床研究大数据平台及专病数据库系统建设方案.docx》由会员分享,可在线阅读,更多相关《临床研究大数据平台及专病数据库系统建设方案.docx(48页珍藏版)》请在第一文库网上搜索。
1、临床研究大数据平台及专病数据库系统建设方案科研水平作为新形势下衡量一个医院核心竞争力和未来发展能力的重要参考指标,在整个医院的发展过程中有着举足轻重的重要作用,但由于缺乏统一的高质量数据中心和大数据治理工具,数据综合查询需要直接访问各个子系统数据库,成本高、效率低,导致宝贵的数据很难有效利用,更无法起到对临床质量、运营管理决策、科研分析等支持的作用,因此,我院拟对医院现存底层业务系统数据进行彻底的摸查和全方位的深入规范处理,开展全院临床研究大数据平台及专病数据库系统项目建设,重新构建全新的、符合医院未来发展和全方位大数据应用的全院临床数据标准数据模型,并在此过程中基于优势病种开展科研级的深度清
2、洗和治理,为全院和重点专科的用户提供更加统一的、完整的、高效的临床科研级别的高质量数据源,同时在上述基础上构建全院级的临床科研一体化标准规范和应用体系,全方位助力全院整体临床科研、大数据分析和挖掘能力的提升,进一步强化医院职能部门对数据的管理能力,助力提升医院整体的数据管理水平和数据应用水平,改善临床科研工作效率,为医院整体的精细化管理提供更有力的数据支撑。序具体技术(参数)要求号数数据1、支持具备从多种不同的数据源(ORAC1E、据采集SQ1SERVERMySQ1VIEW、消息队列、WebService)集引擎中进行指定规则的数据提取作业;成2、支持具备数据转换功能,在数据提取的过程中模块将
3、不同数据源、不同数据类型的数据进行转换;3、支持具备数据装载功能,平台默认以IOOO条缓存数据为限,每达到限制数量后执行一次数据装载,并可根据单条数据量大小来修改单次装载量,支持动态配置;4、支持全量数据/增量数据采集同步;5、指定时间间隔或指定时间点进行自动采集;6、支持对数据采集过程实施监控预警;7、如采集任务异常中断,支持一定时效内的自动重启恢复,如多次重启失败,则支持记录同步状态,提交给数据监控预警并生成后端日志文件保存。数据预处理1、支持在数据采集过程中对数据中的作废标识进行处理;2、支持在数据采集过程中对数据中的重复数据做去重处理;3、支持在数据采集过程中对数据中脏数据(空值、异常
4、值等)进行统一清洗;4、支持数据回收站功能,用于存储作废数据、重复数据和垃圾数据。医疗标准1、支持查看全部数据元列表,包含系统默认数据元和自定义数据元,可以查看数据元名称、所属业务域、数数数据处理方式、数据格式、属性等;据据2、支持编辑数据元的各项属性,包括数据元的名称、标元描述,支持编辑数据元值域的表现形式和允许值,支准管持引用字典并设置可用值域值;规理3、支持归一数据元发送至数据归一工具进行归一;范4、支持后结构化数据元发送至数据元标注中心进行标管注;理5、支持在保存数据元时对数据元的完整性、合法性进行验证,并对有重复的数据元或相似的数据元进行提醒;6、支持对数据元的状态进行编辑,能够根据
5、数据元的状态设置数据元的可编辑内容;7、支持对数据元设置启用与停用状态,当启用时数据元可被数据集引用,当停用时则不可被引用;8、支持数据元每次编辑并审核通过后纳入至新版本;9、支持数据元发布新版本,及时同步有引用该数据元的数据集最新版本数据元;10、支持通过数据元业务域、数据元数据处理方式、数据元名称、数据元状态筛选查询数据元。自1、支持从已有的数值类型数据元创建计算类型数据定元,支持选择多个变量进行四则运算,并可自由设定义计算公式;数2、支持创建录入类型数据元,并支持设定其数据类型,据允许值等属性;元3、支持自定义归一数据元,并选择相应数据来源字段,通过归一工具完成归一操作,并支持归一数据元
6、在不同数据集为不同归一内容;4、自定义数据元保存时对数据元进行预处理,包含数据元比对、相似数据元提示、合法性检查;5、自定义数据元可纳入至不同的数据集。数1、支持设置数据元的来源系统、来源表名、来源字段据以及流向表名和字段,并支持设置多个来源;元2、支持相同数据元在不同数据集拥有不同的来源;血3、支持展示数据元全生命周期链路,包含数据元创建、缘数据元编辑、数据元销毁节点;关4、支持展示数据元处理明细,包含数据流入节点、数系据流转节点、数据流出节点;5、支持展示数据元版本变更,可直观查看不同版本对比。数1、支持根据创建数据集,并支持选定相应的数据元概据念及其属性;集2、支持创建全院级别数据集、专
7、病级别数据集、主题管级别数据集,其中全院级别可关联医院,专病级别可理关联专病库,主题级别可关联业务域;3、支持通过EXCe1表批量导入数据集,并支持对导入的数据元进行预处理,包含数据元比对、相似数据元提示、合法性检查等;4、支持对导入的数据元无法匹配标准数据元进行提醒;5、支持通过数据元池中选择数据元添加至数据集中;6、支持数据集分配成员权限,分为创建者、编辑者、查看者权限,对于无权限的成员无法查看以及操作该数据集;临科1、利用病人基本病历信息(姓名、性别、出生年月、床研身份证号、电话号码、住址、出生地等),进行相似度数主计算,将确定为同一病人的病人信息进行合并;据索2、支持在EMPI构建的过
8、程中对身份证号码、地址等治理引引标准化数据进行标准化处理和归一,提高数据整洁度,确保EMP1的可用性和真实性;3、支持实现与医院现有患者EMP1的整合。擎数据归1、支持创建词库,并支持词库层级管理,可设定为全院词库或是专病词库,专病词库可继承全院词库的词;2、支持维护词的上位节点、下位节点和同义词;3、支持通过EXCe1导入医院内的检验、检查、药品、诊断等字典丰富词库中的内容;4、支持对词打标签,用于区分相同词在不同位置时语义有差异;5、支持展示归一数据元在不同数据集所归一映射的同义词;6、标注过程中所标注的词语会纳入至待审核的词语列表中,审核通过后即可纳入至词库中;7、支持归一数据元通过自然
9、语义分析自动与词库中配对进行归一映射,并支持对自动归一结果进行修改;8、支持同个归一数据元在不同数据集有不同的归一映射规则;9、支持归一数据元手工选择词库中的词进行归一映射。数1、支持准确性分析,对具有规范性的字段进行准确性据校验,例如身份证号码,通过正则校验,或者本来应质该填写数值类型的,查看是否存在其他类型。控2、支持完整性分析,包括数据是否完整,内容是否齐全等数据完整性校验3、支持一致性分析,包括判断数据字典值域是否一致等数据一致性校验4、支持及时性分析,能够判断数据的时间逻辑性是否合乎常理的数据及时性校验5、支持关联性分析,实现对数据结构中的各表关联字段进行校验,比如索引表和明细表之间
10、是否正确关联等6、支持在完成数据准确性、完整性、一致性、及时性和关联性五大维度的数据分析后,输出整体数据质量分析报告。科数1、支持查看数据来源情况,包含数据来源系统总数、研据数据来源系统表总数、数据来源系统表字段总数;数治2、支持查看数据来源情况概览统计数据下钻查看数据据理明细,其中数据来源系统明细包含系统厂家,系统名中概称,数据采集时间范围;心览3、数据来源系统表明细包含来源系统名称,来源系统厂家,表名;4、数据来源系统表字段包含表名,字段名,字段说明;5、支持查看原始数据处理情况,包含数据抽取总数、数据作废处理总数、数据重复处理总数、数据清洗处理总数;6、支持查看数据元处理情况,包含数据元
11、总数并按照处理方式分类展示,数据元结果总数并按照处理方式分类展示;7、支持查看数据元血缘关系查看,包含数据元流入节点、清洗节点、流转节点和流出节点。数1、支持查看从业务系统抽取数据至数据湖历史抽数结据果,包含各业务域数据增量统计,增量总行数统计,抽抽数时间统计,抽数状态统计;取2、支持查看从数据湖抽取数据至ES历史抽数结果,分包含各业务域数据增量统计,增量总行数统计,抽数析时间统计,抽数状态统计;3、支持对抽数行为进行分类,包含定时抽数,数据变更抽数,人为抽数;4、支持对抽数异常状态人工再次重启抽数。原1、支持准确性、完整性、一致性、及时性、关联性等始多个维度对原始数据质量进行分析,并展示根据
12、规则数所涉及的字段所占通过率;据2、支持展示质控字段规则不通过所在行明细,包含来质源系统、来源系统表名、来源系统表名的具体字段名量:以及该条数据的自增ID或主键值;分3、支持展示所有质控规则名称以及规则说明;析5权资1、支持管理所有模块的菜单、页面、按钮和接口,包限源括新增,修改,删除;安管2、支持对专病库中的功能菜单、业务域、科室进行资全理源配置。管组1、支持对医院基本信息维护;理织2、支持对医院科室基本信息维护,并支持科室多级层管级结构关系,科室可维护多个子科室;理3、支持对医院的专病库基本信息维护;4、支持对用户基本信息维护,并支持设置用户账号有效时长;5、支持对用户分配角色,并支持用户
13、拥有多个角色。权限管理1、支持自定义角色,并支持对角色的功能权限进行配置,包含可访问页面、可使用按钮以及可使用的接口;2、支持对用户的数据权限进行配置,包含科室来源、业务域是否可见、数据元是否可见是否脱敏等进行设置。审批流程配置1、支持对各个审批流程的审批者和审批方式进行设置管理,并支持设定多个审批节点;2、支持会签和或签两种审方式,其中会签方式支持在同一审批节点所有审批者均审批通过方可进入下个节点,或签方式支持在同一审批节点任意审批者审批通过即可进入下个节点;3、支持按角色添加审批者或按指定用户添加审批者,并支持批量添加审批者;4、支持对跨科室数据审批默认分配至对应科室负责人进行审批,并且支
14、持多个科室时分别给各个科室指定角色生成审批记录。密码1、支持对用户密码格式要求设置,包含是否要有大写英文字母,是否要有小写英文字母,是否要有数字,安是否要有特殊字符以及最短长度设置;全管理2、支持对用于密码时效性设置,包含限制密码在设置时间范围内失效要求重置密码,以及限制新密码与旧密码是否可重复;3、支持设置用户输入密码时重试约束,包含限定时间范围内连续输错多少次则锁定多少分钟;4、支持设置新用户的初始密码。6智检1、支持以患者人口学信息、就诊信息、诊断信息、费能索用信息、一般检验、微生物检验、检查报告、医嘱记科首录、门急诊病历、住院病历、入院记录、出院记录、研检索页病案手术、会诊记录、抢救记录等医疗场景构建检索业务域。2、支持通过输入任意文字内容进行检索域数据元模糊搜索,定位并展示与检索内容具有相关性的数据元所在业务域,方便用户快捷点选开