《粮库智能化升级改造项目运行维护系统建设方案.docx》由会员分享,可在线阅读,更多相关《粮库智能化升级改造项目运行维护系统建设方案.docx(21页珍藏版)》请在第一文库网上搜索。
1、粮库智能化升级改造项目运行维护系统建设方案在“运行维护”阶段中,已建成的系统一方面将不断发挥其效用,为粮食局、涉粮企业和市民公众提供服务;另一方面,它也会根据业务的变化而不断地得到完善、更新。而这一点也正是应用软件系统日常维护的重心。如果忽视了维护工作,将可能导致应用系统的缺陷无法得到及时修正、系统功能无法紧跟业务变化而得到及时更新等诸多问题的出现,最终将直接影响系统的效用。1.1.1 运维管理体系建设的目标提供对业务应用的全面监控,反映信息系统资源的健康状况和可用性,使所有应用运行处于良好的运行状态;及时掌握各种资源现状和运行信息,为信息分析、系统优化、决策提供支持,实现管理信息和经验的共享
2、;完善运维管控流程和制度,使得运维工作形成合力,提高整体运维水平,保障业务的稳定、高效、持续运行。1.1.2 建设的必要性通过建立科学合理的运维管理体系,可系统地将组织架构、管理流程、管控制度、绩效考核、运维成本核算以及技术平台贯穿融合,有效解决了目前大多数信息系统运维工作中所面临的沟通不畅、效率低下、服务质量无法保障、被动维护等问题,改变各自为政、分散运维的状况,增强为业务应用服务的意识,更好地实现建设服务型政府的目标。运维管理体系建立的意义在于:第一,提升信息化的效益。“三分建设,七分管理”,信息化80%的效益体现在运行维护阶段。IT运维管理体系的建设,将进一步规范运维管理工作,降低IT运
3、维成本,通过“用好信息系统”,更加有效地支持业务和提供公共服务,进一步推进业务工作公开、透明。第二,降低信息化的风险。通过开发与运维职责分离,对权限进行合理分配,避免“篡改数据、内外勾结”等风险发生,规避了系统性风险;通过规范化的操作,减少人为错误引发的风险;通过主动监控和趋势分析,预防事故的发生;通过对重大变更的审批和授权,减少了因变更不善导致的风险;通过制定应急预案,减少重大故障的影响。“IT运维”将不再是“黑箱”,将变得可管可控,降低了信息化带来的风险。第三,支持领导宏观决策。建设的IT运维管理系统,能够记录并分析运维过程中发生的各种故障及其解决方案,通过报表工具,展示全局视图,让领导了
4、解运维工作各方面情况,支持领导宏观决策。第四,提升信息化科学管理水平。面向业务,以业务需求和目标为出发点,制定IT运维管理的愿景、目标和策略,建立科学的IT运维管理机制和治理型组织结构,理顺组织机构和职责划分,规范IT运维管理过程中各个参与要素(人、流程、工具)的管理制度与工作流程,建立绩效考核评价体系,规范运维费用,实现精细化管理和提升信息化科学管理水平。第五,主动监控和预防故障发生。应用先进、实用、高效的IT运维管理工具,可以实时监控各系统的运行状态。当系统超过设定阀值自动报警时,通过系统间的关联分析,维护人员可以主动发现并解决故障;并通过趋势分析,寻找潜在故障,防患于未然,改变“被动维护
5、”的局面,更加有效地防范故障和提高工作效率,有效地支持业务工作的顺利开展。第六,提升专业维护队伍的专业化水平。实行建设与运维的专业分工,通过在中心层面的资源整合,不断积累知识库,加强业务部门间、维护人员间的沟通和协作,传承和共享成功经验,提升维护队伍的专业化水平,促进信息化工作向专业化方向发展。1.1.3 体系结构运行维护体系包括运行维护组织、运行维护内容、运行维护流程、运行维护技术支持平台、运行维护制度等几个方面的内容,它们既相互依存又相互制约,可以同步建设,也可以随着应用的开展而逐步完善。1.1.3.1 运行维护机构可靠的运维工作是系统实现建设目标、发挥效用的重要保障,为了避免“重建设、轻
6、应用”的弊端,加强运维体系的建设,成立由主要领导担任组长的信息化工作领导小组,下设领导小组办公室、日常工作办、网络安全组、计算存储组、应用管理组、终端维护组,具体如下文所述:(1)网络安全组网络安全组负责网络的维护工作,保障网络的畅通;负责信息化安全体系的管理维护、保障网络的安全。(2)计算存储组计算存储组负责服务器、存储等核心硬件设备的管理维护,保障设备正常运转,负责核心数据的存储、备份、管理。(3)应用管理组应用管理组负责应用系统、数据库、中间件的运行维护,保障系统的良好、稳定的运行。(4)终端维护组终端维护组负责对工作人员的IT技术支持,及时响应工作人员请求,保障每个终端用户正常使用网络
7、、PC、应用系统及视频会议系统。1.1.3.2 运行维护内容运行维护内容包括网络管理、系统(主机系统、数据库系统、中间件系统)和应用管理、安全管理、存储备份管理、故障管理、技术支持管理等。(1)网络管理内容网络管理主要实现网络的配置管理、性能管理和可靠性管理。网络管理主要基于网络管理平台和设备管理软件实现。网络配置主要对网络拓扑结构和网络设备参数进行配置,网络性能管理主要通过对被管理设备的监控和轮询,获取有关网络运行的信息及统计数据,并在所收集的数据的基础上,提供网络的性能统计;网络可靠性管理主要对网络的运行状况进行监控和检查,及时察觉可能的故障,从而保证网络的正常运行。(2)系统和应用管理内
8、容系统管理主要实现对系统(主机系统、数据库系统、中间件系统)的配置管理、性能管理和可靠性管理。配置管理包括对系统资源的发现、提供、配置和控制;性能及可靠性管理主要对各系统的关键参数或重要资源进行监控和检查,了解系统运行情况,及时察觉系统可能的故障,从而保证系统的正常运行,提高系统可靠性。应用管理实现对各应用系统的性能管理、可靠性管理、版本管理和数据管理。性能管理包括对应用系统性能的监控和优化;可靠性管理包括及时监控应用系统运行情况,及时发现潜在的问题,保证正常运行;版本管理包括对应用系统的版本/补丁的管理、发布及升级,配合相关部门进行应用系统的相关测试、试运行和推广;数据管理包括按照有关规定及
9、工作流程对后台数据必要的修改。(3)安全管理内容安全管理对象包括网络安全、系统(主机系统、数据库系统、中间件系统)和应用安全、存储备份安全。管理内容可分为安全管理制度的制定和落实、安全设备的配置以及管理与监控、安全管理故障的处理等。(4)存储备份管理内容存储备份系统运行维护管理的主要内容是备份策略管理、备份软件管理、备份数据管理及存储硬件管理。备份策略的选择,要统筹考虑需备份的总数据量、线路带宽、数据吞吐量、时间窗口以及对恢复时间的要求等因素,根据不同业务对数据备份的时间窗口和灾难恢复的要求,选择不同的备份方式,亦可将几种备份方式组合应用,以得到最佳的备份效果。数据管理包括数据的备份、异地转储
10、、数据的归档和数据的识读等。存储硬件管理包括存储网络设备(如光纤交换机等)、存储设备及其相应的管理软件、备份设备及其备份软件的日常维护及故障处理、存储设备容量管理。(5)故障管理内容故障管理包括网络、系统和应用、安全、存储备份的故障发现、故障分类、故障转发、故障诊断、故障处理、故障及处理记录和统计等过程。(6)技术支持管理内容技术支持管理包括对运行维护技术支持平台中的技术支持手段和工具、技术支持人员等的管理。1.1.3.3 运行维护流程为保证运行维护体系的高效、协调运行,应依据管理环节、管理内容、管理要求制定统一的运行维护工作流程,实现运行维护工作的标准化、规范化。运行维护流程包含的环节有:日
11、常运行维护、用户的运维请求、故障处理、问题跟qrI1zKo(1)日常运行维护运行维护人员根据岗位职责和运行管理制度,利用技术支持平台提供的技术手段和工具,进行网络、主机、数据库、中间件及各应用系统的日常维护、状态监控和安全管理,定期产生运行维护报告,若发现故障,及时将故障转入故障处理流程。(2)运维请求用户可以通过电话、电子邮件等多种方式将运维请求提交。技术人员负责解答相关的运维问题,不能解答的转入故障处理流程。(3)故障处理流程对电话讲解、邮件答复不能解决的问题会转入故障处理流程,由专业技术人员到现场进行故障处理。(4)问题跟踪该环节与故障处理流程环节同步,对故障处理环节中问题的处理过程进行
12、记录,技术人员记录故障情况以及对故障处理的详细内容,以供其他支持人员参考。1.1.3.4 运行维护制度为确保运行维护工作正常、有序、高质地进行,必须针对运行维护的管理流程和内容,制定相应的运行维护管理制度,实现各项工作的规范化管理。运行维护管理制度可分为:网络管理制度、系统和应用管理制度、安全管理制度、存储备份管理制度、故障管理制度、人员管理制度和质量考核制度等。(1)网络管理制度:包括网络的准入管理制度、网络的配置管理制度、网络的运行/监控管理制度等。(2)系统和应用管理制度包括对主机、数据库、中间件、应用系统的配置管理制度、运行/监控管理制度、数据管理制度等。(3)安全管理制度包括网络、主
13、机、数据库、中间件、应用软件、数据的安全管理制度及安全事故应急处理制度。(4)存储备份管理制度包括备份数据的管理制度和备份设备的管理制度。(5)故障管理制度包括对故障处理过程的管理制度、故障处理流程的变更管理制度、故障信息利用的管理制度及重大故障的应急管理制度等。(6)人员管理制度包括对运行维护人员的能级管理制度、奖惩制度、考核制度、外部人力资源使用的管理制度等。(7)质量考核制度制定相关制度,对以上各类制度的执行情况进行考核。1.1.3.5 数据运维内容系统要正常运转,必须对系统内的用户和数据库进行有效的管理,保持数据库的完整性、一致性和安全性,保证操作规则的修改与执行结果一致。系统数据运行
14、维护包括三方面的内容:(1)数据库管理包括数据质量检查、审计和报告数据库的使用和状态、查看、修改、删除、复制、分割和分发、数据库备份和恢复、存储管理、系统参数配置(如更新频度等)。(2)元数据库管理元数据提供了到信息系统资源的路标。对元数据库的管理,应当提供对元数据的单点控制,并确保元数据的变化反映它所描述的数据或操作规则的变化。包括管理和更新元数据、元数据库的备份和恢复等。(3)用户管理由于共享数据库中包括不同密级的信息和不同类型的操作,需要对用户进行分类,授予不同的访问权限。包括用户和分组管理、权限管理。用户需要与一期平台用户管理进行对接,由一期平台统一开发。1.1.4 运维管理设计为了确
15、保系统长期稳定运行,除了要求系统采用的软硬件产品稳定性外,对系统相关的运维管理制度和工作是必不可少的重要基础。1.1.4.1 监控管理本项目建设内容包括:对通信线路、主机、网络设备和应用软件的运行状况、网络流量、用户行为等进行监测和报警,形成记录并妥善保存;(2)组织相关人员定期对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并采取必要的应对措施;(3)建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项进行集中管理。1.1.4.2 网络安全管理本项目建设内容包括:(1)指定专人对网络进行管理,负责运行日志、网络监控记录的日常维护和报警信息分析和处理工作;(2)
16、建立网络安全管理制度,对网络安全配置、日志保存时间、安全策略、升级与打补丁、口令更新周期等方面作出规定;(3)根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的重要文件进行备份;(4)定期对网络系统进行漏洞扫描,对发现的网络系统安全漏洞进行及时的修补;(5)实现设备的最小服务配置,并对配置文件进行定期离线备份;(6)保证所有与外部系统的连接均得到授权和批准;(7)依据安全策略允许或者拒绝便携式和移动式设备的网络接入;(8)定期检查违反规定拨号上网或其他违反网络安全策略的行为。1.1.4.3 系统安全管理本项目建设内容包括:(1)根据业务需求和系统安全分析确定系统的访问控制策略;(2)