《云平台存储下的日常运行与维护实践.docx》由会员分享,可在线阅读,更多相关《云平台存储下的日常运行与维护实践.docx(8页珍藏版)》请在第一文库网上搜索。
1、云平台存储下的日常运行与维护实践运维体系由运维制度、运维流程、运维组织、运维队伍、运维技术平台以及运行维护对象六部分组成,涉及制度、人、技术、对象四类因素。制度是规范运维管理工作的基本保障,也是流程建立的基础。运维服务组织中的相关人员遵照制度要求和标准化的流程,采用先进的运维管理平台对各类运维对象进行规范化的运行管理和技术操作。云环境下的日常运行与维护也不例外,它能否与传统环境共用一套运维体系成为企业用户关注重点之一。云平台存储下的日常运行与维护和传统环境的存储运维能否沿用同一套体系?社区专家主张邓毓江西农信运维技术经理:本议题由某农商银行架构师胡海光、光大科技云计算工程师赵霞两位专家对云平台
2、存储下的日常运行与维护的关键点进行主张,这些主张在经过本人、某金融机构架构师李威、利安人寿资深工程师陈萍春等复议后,最终形成了一定的共识供同行参考。胡海光某农商银行架构师:随着企业云化速度的加快,业务需求的不断迭代更新,敏捷化智能化的进一步推动,在企业业务快速发展的过程中,云平台存储的有效性和稳定性越显重要。随着云计算技术的逐渐成熟和快速发展,特别是数字化转型的持续推进,企业的云化速度大幅提升,同时在各类业务分布式改造和业务场景化的推动下,业务逐渐扁平化、耦合化及云化。在此背景下企业通过自建或采购的形式来建设和部署云平台,以企业内部各业务系统的实际情况为出发点,结合架构及业务部门的规划意见,按
3、计划和步骤有序推动各类业务有效健康上云。而对于云平台而言,存储是其非常重要的一个组成部分,关系着云平台数据的全生命周期管理,是云平台有效运行的数据保障,因此云平台存储的运维工作显得非常重要。而运维工作的顺利开展是靠运维制度和体系去支撑和保障的,合理良好的制度和体系则能为运维工作提供科学的指导和全面的流程管理。现就云平台存储的运维体系进行简要说明。相比于云平台存储的运维体系而言,传统环境存储的运维体系在运行多年的积累下日益成熟,形成了一整套完善成熟稳定的运维体系,期间积累了较多的运维经验,也总结了一定的教训。传统环境存储的运维体系现状主要体现在以下方面:1)运维制度方面,针对传统存储的日常运维规
4、范以制度的形式,明确和规定运维的流程和相关事项,如存储管理办法和数据备份管理办法等;2)运维架构方面,针对传统存储主要为集中式存储,专业化维护程度较高,通过设定专门的存储运维岗位负责存储的日常管理和维护;3)运维范围方面,相对于专业的存储运维岗,运维范围主要集中在存储及光交管理方面,配合系统及数据等岗位进行相应的系统及数据管理;4)运维技能方面,主要体现在存储及光交相关的技术技能上,并向上拓展系统相关的操作管理等。而云化的快速发展和推进,导致部分传统业务逐渐转向分布式和云化,配合相关的云化技术进行分布式改造,迁移至云平台上,导致传统架构的范围不断缩小。再次传统架构存储数据库在互联网业务多并发的
5、情况下,存在着一定的水平横向扩展的制约性,导致在业务快速推进的过程中无法满足业务的快速发展和快速迭代。同时云平台存储大都采用分布式存储,结合分布式存储(含块、对象及文件等)的多样性和快速扩展性,相比传统存储的稳定性和局限性,虽存储的底层原理大体都相通,但两者在存储管理相关的技能方面存在着一定的不同。云平台存储以分布式存储为依托,以分布式技术打造的具备块存储、对象存储及文件存储为一身的多种存储形式的存储,用以满足云化业务的各类存储需求。相比传统存储而言,云平台存储在架构上略有区别,传统存储以集中式存储为主,云平台存储以分布式存储为主,当然两者也有一定的交集,但场景较为少见。因此对于云平台存储的运
6、维工作而言,可以在一定程度上参考传统存储的运维体系,制定出云平台存储的运维体系,主要可以体现在以下方面:1)运维制度方面,相比传统存储管理的流程和相关事项,云平台存储管理的相关制度通常融入和结合到云平台管理的整体制度和流程中,较少以一个组件来颁布相应的制度;2)运维架构方面,对云平台存储运维而言,存储只是云平台的一个部分,很少针对云平台存储设定相应的岗位,通常以云平台运维这大方面设定岗位来进行相应的运维;3)运维范围方面,相对于传统的存储运维岗,云平台存储运维只是较小的一块,还需掌握云平台其它组件(如计算虚拟化、云管及网络虚拟化等)的运维管理;4)运维技能方面,不光要掌握有关云平台存储侧的相关
7、技能,还需掌握云平台其它组件的相关技能和知识点。以上相比于传统存储,云平台存储作为云平台其中一个重要组件,起到数据基石的作用。目前相比传统存储虽然还存在着一定的不足,但随着技术的不断发展和成熟,在可靠性和稳定性方面日趋成熟,同时也在多样性和扩展性方面精益求精。就传统存储和云平台存储对于运维人员而言,都是运维的本职工作,因事关生产都需尽心维护。两者在运维体系方面差别也不大,就运维体系的整体目标而言,两者是一样的,都是管理和维护好存储。在流程体系方面,两者都是通过运维流程进行相应的操作和管理,这点较为类同;在标准体系方面,两者在存储管理方面的标准就数据的管理(备份及保留时间等)而言大体一样;在技术
8、体系方面,两者略有不同,不同产品不同技术路线对应的技术体系方面存在着一定的差别,但对于存储的底层原理来说都是相通的。基于此两者的运维体系既不是简单的复用,也不是方向上的南辕北辙;更多的是少有差异多为互补。只有这样,在思想上清晰认识两者的差异,才能在运维上更好地管理和维护存储产品,在云化的道路向着数字化转型的目标不断前行。赵陵光大科技云计算工程师:随着私有云及存储资源服务理念的日益广泛深入,如何做好存储资源服务的规划、建设、交付和运行维护,就成为企业IT服务治理的关键因素之一。当前IT发展风云变幻,容器、云原生及DeVOPS等各种云基础设施与服务管理频频升级,适应了数字化时代的业务创新发展,云平
9、台存储作为云基础设施架构的重要组件,也有了长足的进步,其性能、弹性扩展能力、高可用能力及易用性等多方面的提升显而易见,满足了大规模关键应用的支撑要求。随着私有云及存储资源服务理念的日益广泛深入,如何做好存储资源服务的规划、建设、交付和运行维护,就成为企业IT服务治理的关键因素之一。在长期的建设过程中,大部分信息化企业均已构建了符合ITI1规范的运维体系制度,先进的企业甚至在DevOps理念的指导下有了扩展和创新,升级了存储运维服务的敏捷性,搭建了存储资源管理及存储自动化运维等工具平台,可以满足存储资源在云环境下的运维。因此,在云平台存储的日常运行和维护中,可以和传统的存储运维沿用同一套运维服务
10、管理体系。经我们分析认为,云平台存储和传统存储运维服务管理体系都是由制度建设、团队建设、规划设计、运维服务管理四部分组成(如图1)O1 图1:云平台存储运维体系建议2 .制度建设运维服务治理是指依据存储的运维管理环节、管理内容、管理要求制定统一的运维工作制度和流程,实现运维工作的标准化和规划范,并在实践中不断优化,提升管理能力。3 .团队建设存储运维的团队建设是指根据运维服务工作的内容和流程确定的部署规划、资源交付、运行保障等各项工作的岗位设置及职责分工,并按照相应岗位的要求配备所需不同层次的人员,组成专业高效协作的运维队伍。4 .规划设计规划设计管理是指根据企业业务特征和需求,明确存储的产品
11、选型、部署方案和实施规范,然后根据IT应用系统的实际需求,进行云平台存储资源池的容量和性能分级规划建设,为IT应用系统的运行质量提供基础存储服务能力保障。4,运维服务运维技术服务平台包含实施运维技术服务的各种手段及工具,通过技术手段固化标准化的流程,积累和管理运维知识,并主动地开展运维工作。运维服务的主要内容包括:存储服务目录、事件/变更管理、故障/性能、运行分析和DevOps自动化运维工具建设等内容。但是,云平台存储不同于传统存储,它天然融合于云平台,在系统架构、部署模式和管理维护方式等方面都具有不同于传统存储的特征,在运维体系建设的具体落地措施中产生了新的要求。因此,其对应的团队建设、规划
12、设计和运维服务方面,需要有一些针对性的改变,以适应云平台存储的运维要求,实现数字化转型时代更为高效的存储服务保障能力,主要包括以下三个方面:1)运维工作重心调整和岗位能力提升存储运维岗一般包括:产品技术岗和运维服务岗,分别负责产品的规划实施和资源交付运维。传统存储时代,产品技术相对封闭,重心在运维服务岗,由于云平台存储的产品技术相对更加开放,简洁的运维服务方式,使得云平台存储的运维工作转向产品技术岗,重心向前移动,在前期即需要面向IT应用系统需求,根据云平台存储的交付方式、资源池、高可用等产品特性进行规划和部署实施。在云平台存储与云的天然融合,对应的运维人员需要掌握除存储产品本身以外,还需要了
13、解云平台的整体技术实现,乃至面向业务的各类型存储资源需求的交付管理等,需要我们在培训、招聘等时加强岗位技能的综合能力建设。2)面向业务的存储资源池规划方法升级传统存储的单体容量较小,同类物理存储资源池一般有多个存储组成,其容量、性能和系统应用分配规划一般基于单体存储进行,而云平台存储的统一物理资源池、整体性能分级分层和几乎无需按应用分配规划的灵活能力,需要我们调整工作方法,在规划和设计时,对资源池的容量和性能分级做统筹的考虑,采用全局规划的方式,做好云平台存储资源服务。3)敏捷运维服务能力提升传统存储保守的管理控制台管理方式和接口开放水平,限制了对存储资源池的自动化调度和软件定义能力,而云平台
14、存储和与云天然融合和开放的AP1能力,具备更方便的统一资源管理和统计分析能力,支持方便开发智能化的运维工具,实现统一容量管理能力、灵活的资源交付能力和快速的性能和故障分析能力。综上所述,云平台存储下的日常运行与维护和传统环境的存储运维可以沿用同一套体系,针对云平台存储的特征进行优化和调整,就可以以更好的运维团队,更合理的规划部署,更敏捷的存储服务,为业务快速创新发展做好保驾护航。结束语云平台存储和传统存储的底层原理是相通的,存储运维可以沿用同一套运维体系,但基于此两者的运维体系既不是简单的复用,也不是方向上的南辕北辙,更多是的少有差异多为互补,需针对云平台存储的特征进行专项优化和调整。-全文完-