《软件开发模板-系统运维指南.docx》由会员分享,可在线阅读,更多相关《软件开发模板-系统运维指南.docx(57页珍藏版)》请在第一文库网上搜索。
1、软件开发模板现场软件系统日常运维指南1. 概述1.1、 目的软件系统日常运行维护的目标,主要是通过常驻运行维护人员和后台支撑团队,提供常态、规范和专业的巡检、故障应急抢修服务来保证系统可靠稳定运行。本指南主要是为了系统运维目标的实现,提供规章制度的保证,规定了运维对象和范围,确保巡检和抢修活动有操作要求、流程可依,并指导读者如何进行现场软件系统日常运维,如何制定软件系统日常运维手册,确保软件系统在预定的环境中使用。12、适用范围本用于公司负责所有建设项目的系统试运行、正式运行和软件质保阶段,以及公司负责的所有维护项目的合同期。13、内容本指南主要涵盖了对软件系统资料整理、日常运维工作(巡检)和
2、系统故障处置等方面的要求。同时,指南也从实际出发,对运维活动给出了团队组成、规模以及排班的建议。14、参考文档2. 项目软件系统运维流程项目软件系统运维整体主要流程如下:项目软件系统运维流程项目经理软件项目经理巡检执行人牵头安排相关人员制定项目软件系统运维方案整理项目资料协调相关人员配合软件项目经理制定方案3. 主要角色和职责3.1、 角色及职责在制定软件系统日常运维手册、实施系统日常运维和故障处置的过程中,所涉及的角色和职责如下:角色职责项目经理1 .协调相关人员,包括设备厂商技术人员。2 .确定巡检执行人。软件项目经理1 .安排相关人员共同制定项目软件系统现场维护手册;2 .负责制定项目系
3、统功能巡检手册的制定;3 .负责对巡检执行人进行培训;集成工程师1负责整理项目集成相关资料;2 .负责项目网络运行环境、主机与存储环境巡检手册的制定;3 .协助软件项目经理对巡检执行人进行培训;数据库管理员1 .负责整理项目数据库系统相关资料;2 .负责项目数据库系统环境巡检手册的制定;3 .协助软件项目经理制定关键业务表巡检手册;4 .协助软件项目经理对巡检执行人进行培训;交通工程小组1.协助软件项目经理制定系统功能巡检手册;设备厂商1.协助集成工程师、数据库管理员制定巡检手册;巡检执行人1 .确认项目软件系统现场维护手册的所有内容可操作;2 .根据项目软件系统现场维护手册执行日常维护工作;
4、3.2、 巡检执行人应具备的条件熟练使用WindoWS系统,会查询与查看系统日志;能熟练运用sq1语句;熟悉ORAC1E、SQ1SERVER、MYSQ1等常用数据库的使用;熟悉Web1Ogic、ApacheTomcatJBOSS等常用中间件的使用;熟悉1inUX基本操作,能够部署软件、系统等操作;4. 项目资料要求4.1、 网络环境网络环境项目资料应包括:设备的IP分配表(外场,主机,网络设备)设备ip地址分配表参考格式如下:序号设备id设备类型(必填)安装位置(必填)IP地址(必填)掩码(必填)网关(必填)MAC连通情况(必填)接入交换机ip其他属性1己连通/未连通2设备id:设备的唯一标不
5、设备类型:如线圈车检器、电子警察、车牌识别、防火墙、网闸、交换机、服务器、数据库等安装位置:设备安装的位置,如路口名、断面名、桩号;内场设备应表明安装的机房、机柜号;应便于运维人员识别。ip地址:设备配置的ip地址掩码:设备配置的子网掩码网关:设备配置的网关地址MAC:设备的MAc地址连通情况:设备的实际连通情况,需根据情况及时更新接入交换机ip:设备接入的交换机ip其他属性:上述未尽描述的其他属性网络设备配置信息表序号设备id设备类型(必填)配置策略配厘文件存放位置1端口:tcp/udp/单向访问/双向访问2设备id:设备的唯一标示设备类型:如防火墙、网闸、交换机等设备互联的拓扑图及相应的设
6、计说明;如果比较复杂的话,可以考虑提交逻辑拓扑及物理拓扑如果网络系统和外系统有互联关系,请说明外系统互联的要求及相应约束(IP分配、安全策略要求、路由策略要求等)如果设计中存在冗余链路的设计,请说明采用的冗余技术及策略要求如有其他非常规的网络技术运用(负载均衡、VPDN、AAA、策略路由、路由图等)请提供专文说明其他未尽事宜需要一事一议4.2、 主机及存储关于主机及存储项目资料应包括:设备基本信息表设备基本信息表参考格式如下:序号设备id系统用户名及密码(必填)操作系统版本(必填)CPU(必填)内存(必填)本地硬盘容量(必填)阵列容量(必填)使用网口其他连接12设备id:设备的唯一标示系统用户
7、名及密码:巡检管理访问的系统用户名及密码操作系统版本:设备安装的操作系统版本,包括补丁版本;CPU:设备的CPU配置内存:设备的内存配置本地硬盘容量:主机本地硬盘的配置阵列容量:服务器被分配的存储阵列的容量使用网口:接入系统使用的网口号,设备上也应做好标示,当网线脱落时,应能帮助运维人员找到正确的接入口。其他连接:与其他设备连接的端口描述如光纤口等。4.3、 数据库系统环境数据库基本信息表序号项目内容备注1数据库系统软件版本2字符集3数据库服务名4数据库IP/端口5最大连接数6设计的最大存储空间数据库存储说明表空间信息;序号表空间名表空间增长策略表空间最大设计容量用途12数据表存储说明表如下:
8、序号表名存储分区分区策略索引策略设计最大记录数12用户信息序号用户名用户描述类型12数据库字典包含表、视图、作业、存储过程4.4、 应用软件环境项目需整理应用软件部署情况,参考格式如下:应用软件静态属性表服务器ip程序名可执行文件名应用软件类别安装地址功能描述192.168.32.21视频事件交换软件数据交互/通信软件/计算处理/展示软件/管理软件/统计软件服务器ip:软件部署的服务器ip地址程序名称:软件中文名称可执行文件名:应用软件可执行程序文件名应用软件类别:按照应用软件的用途分为数据交互、通信软件、计算处理、展示软件、管理软件和统计软件。安装地点:软件安装的目录位置。功能描述:软件实现
9、的功能。应用软件运行属性表:服务器ip程序名称应用软件输入应用软件输出运行周期中间件日志位置配置文件及重要属性192.168.32.21视频事件交换软件服务器ip:软件部署的服务器ip地址程序名:软件名称应用软件类别:按照应用软件的用途分为数据交互、通信软件、计算处理、展示软件、管理软件和统计软件。应用软件输入:是指软件的数据来源,如数据库的某业务表,则列明表名。应用软件输出:是指软件正常运行情况下的输出形式,如数据库的某业务表或者Xm1文件等。运行周期:软件运行的周期。中间件:软件运行所需要的中间件名、版本、安装位置等;日志位置:软件日志存放位置及名称,该日志为软件异常时,需要巡检人员作为附
10、件一起上报的日志。配置文件及重要属性:软件运行相关配置文件的存放位置,及重要属性,如数据库连接串的相关描述;4.5、 支撑软件arcgis基本信息序号项目内容备注1gis软件版本2sde库连接名3数据库连接名4本地文件夹连接图层信息序号图层名图层描述安装位置1234.6、 界面功能界面功能描述表:访问地址:访问地址:巡检用户名及密码菜单名功能描述功能操作及操作结果访问地址:界面访问的地址,或者巡检界面安装地址巡检用户名及密码:巡检用户使用的用户名及密码菜单名:功能菜单访问名,如为多级菜单则用“二分割,如“信息发布“情报板人工发布”功能描述:菜单功能的描述信息功能操作及操作结果:巡检人员进行界面
11、功能日常巡检时应做的操作步骤及应看到的结果描述5. 巡检对象和基本要求根据系统的不同等级,实行不同的巡检周期。系统级别级别定义巡检周期A类系统业务实时性较高,或者受众用户多,易产生社会不良效应。如采处发系统、集成指挥平台平台;每日至少一次B类系统业务实时性较高,但受众用户有限,系统故障时,影响有限范围,如卡口系统;每两日一次C类系统业务实时性较低,受众用户也有限,系统故障时,只要能恢复故障时的业务即可,例如电警系统;每周一次A类系统,应实行每日巡检,每日上午9-10时和下午16-17时,应根各根据巡检流程对关键业务进行完整巡检,其他时间可不定期进行项目基本巡检,发现问题应及时解决。B类系统,应
12、实行每两日一次巡检,应根各根据巡检流程对关键业务进行完整巡检,其他时间可不定期进行项目基本巡检,发现问题应及时解决。C类系统,应实行每周一次巡检,应根各根据巡检流程对关键业务进行完整巡检,其他时间可不定期进行项目基本巡检,发现问题应及时解决。定期维护:系统涉及的服务器每月应进行一次系统健康检查,检查服务器和数据库运行状态,清理磁盘空间、无用的交换文件备份、垃圾文件和过期的日志文件,相关设备之间连接状态,备份系统日志、操作系统日志和必要的业务数据并做好相关维护记录。以上周期均可根据项目实际情况进行调整。5.1、 支撑运行环境支撑运行环境主要是指支撑软件运行的各种外部系统、硬件或环境。主要的运行支
13、撑环境包括网络、主机系统、数据库和存储。5. 1.K网络环境从支撑软件系统运行的角度,对网络环境日常巡检的基本要求主要是确保主干网网络连通性和网络服务质量(QoS)。巡检内容:巡检项巡检方法参考值频率连通性检查采用Ping命令进行,建议至少对每个目标点做两组重复测量,每组测量次数不要少于200个。专网:丢包率应为0、时延应不超过IOms互联网:丢包率应接近0,时延不超过300ms,但应比较稳定无线链路(GSM、HSDPA等):丢包率最高不要超过5%,时延不超过300ms每天路由路径检查采用Tracert/traceroute命令检查,检查实际路由路径与设计路由路径是否一致。应一致。每月网络设备的CPU、内存负荷运用命令/管理界面(不同的厂商不一样)对网络设备的运行时CPU、内存负荷进行检查。CPU5分钟利用率和内存利用率都应小于45%,45%-49%建议较快处理(建议4天内响应),250%急需处理(建议2天内响应)每天以上内容的巡检结果需填写到巡检记录表单RPOO1,RP005o5.1.1.1,连通性检查在自建有线网络的情况下,Ping丢包率应为0,建议至少对每个目标点做两组重复测量,每组测量次数不要少于200个;Ping