《企业数据备份策略规划设计最佳实践.docx》由会员分享,可在线阅读,更多相关《企业数据备份策略规划设计最佳实践.docx(17页珍藏版)》请在第一文库网上搜索。
1、企业数据备份策略规划设计最佳实践1. 备份相关的基有出知识21. 1.什么备份21.2. 手工备份和自动化备份31.3. 备份和恢复41.4. 备份结构61.5. 备份分类81. 6. RTO 与 RPO91.7. 备份设备91.8. 备份的数据类型112.数据备份策略设计112. 1. 备份对象的确定122. 2. 备份方式122.7. 备份计划122.5. 备份窗口142.6. 数据保留142.8. 多份拷贝162.9. 介质和备份设备162. 10.元数据备份17企业IT系统里最核心的就是数据,如何保证数据安全是每个企业重点关注的领域。数据安全是一个比较大的技术范畴,本文仅针对数据备份,
2、谈谈如何在企业中做到合理的数据备份和有效的数据恢复。1 .备份相关的基础知识1.1. 什么备份首先先了解一下什么是数据备份,数据备份顾名思义,就是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。在日常生活中,我们经常需要为自己家的房门多配儿把钥匙,为自己的爱车准备一个备胎,这些都是备份思想的体现。数据备份作为存储领域的一个重要组成部分,其在存储系统中的地位和作用都是不容忽视的。对一个完整的IT系统而言,备份工作是其中必不可少的组成部分。其意义不仅在于防范意外事件的破坏,而且还是历史数据保存归档的最佳方式。换言之,即便系统正常工作,没有任何数据丢失或破坏发生
3、,备份工作仍然具有非常大的意义,为我们进行历史数据查询、统计和分析: 以及重要信息归档保存提供了可能。简单的说,一份数据备份的作用,不仅仅像房门的备用钥匙一样,当原来的钥匙丢失或损坏了,才能派上用场。有时候,数据备份的作用,更像是我们为了留住美好时光而拍摄的照片,把暂时的状态永久的保存了下来,供我们分析和研究。当然我们不可能凭借一张儿时的照片就回到从前,在这一点上,数据备份就更显神奇,一个存储系统乃至整个网络系统,完全可以回到过去的某个时间状态,或者重新“克隆” 一个指定时间状态的系统,只要在这个时间点上,我们有一个完整的系统数据备份。还有一个需要澄清的问题,数据备份更多的是指数据从在线状态,
4、剥离到离线状态的过程,这与服务器高可用集群技术以及远程灾备技术,在本质上有所区别。虽然从目的上讲,这些技术都是为了消除或减弱意外事件给系统带来的影响,但是,由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。集群和灾备技术的目的,是为了保证业务的连续性,也就是说,当意外发生时,系统所提供的服务和功能不会因此而间断,能够重续运行。对数据而言,集群和灾备技术是保护系统的在线状态,保证数据可以随时被访问。而相对来说,备份技术的目的,是将整个系统的数据或状态保存下来,这种方式不仅可以挽回硬件设备坏损带来的损失,也可以挽回逻辑错误和人为恶意破坏的损失。然而,一般来说,数据备份技术并不保证系统的实时可
5、用性。也就是说,一旦意外发生,备份技术只保证数据可以恢复,但是恢复过程需要一定的时间,在此期间,系统是不可用的。在具有一定规模的系统中,备份技术、集群技术和灾备技术互相不可替代,并且稳定和谐的配合工作,共同保证着系统的正常运转。1.2. 手工备份和自动化备份相比于系统、数据库管理人员手工备份,自动备份软件有如下的优势:稳定性备份的主要作用是为系统提供一个数据保护的方法,于是备份本身的稳定性和可靠性就变成了最重要的一个方面。相比与手工备份,自动备份软件更能保证备份的稳定可靠,能提供方法确保不会在恢复时才发现备份是不成功的。全面性在复杂的计算机网络环境中,可能会包括了各种操作平台,如各种厂家的UN
6、IX、Linux、Windows等,并安装了各种应用系统,如数据库、文件系统等。备份软件可以全面支持这些平台、软件。自动化很多公司由于工作性质,对何时备份、用多长时间备份都有一定的限制。在下班时间系统负荷轻,适于备份。可是这会增加系统管理员的负担,由于精神状态等原因,还会给备份安全带来潜在的隐患。自动备份软件能提供定时的自动备份,并利用磁带库等技术进行自动换带。在自动备份过程中,还有H志记录功能,并在出现异常情况时自动报警。高性能随着业务的不断发展,数据越来越多,更新越来越快,在休息时间来不及备份如此多的内容,在工作时间备份又会影响系统性能。备份软件在备份时,可以尽量考虑到提高数据备份的速度,
7、如利用多个磁带机并行操作的方法、利用合成备份的方法等等。操作简单,集中管理备份软件提供集中管理功能,能够对特别重要数据做多份拷贝,并能记录跟踪每次备份的不同版本,这样就可以按照需要恢复不同的数据。数据备份应用于不同领域,进行数据备份的操作人员也处于不同的层次。备份软件提供了一个直观的、操作简单的图形化用户界面,缩短操作人员的学习时间,减轻操作人员的工作压力,使备份、恢复工作得以轻松地设置和完成。实时性有些关键性的任务是要24小时不停机运行的,在备份的时候,有一些文件可能仍然处于打开的状态。那么在进行备份的时候,要采取措施,实时地查看文件大小、进行事务跟踪,以保证正确地备份系统中的所有文件。而这
8、些仅凭借手工备份是很难做到的。能更迅速、准确的恢复数据备份软件精确的知道每次备份发生的时间和内容以及存放地点,能够迅速找到并恢复数据。同时,也可以采用多种技术如从快照恢复、多流恢复等方法提高恢复速度。备份软件也能提供更小颗粒的恢复功能。1.3. 备份和恢复数据备份的根本目的,是重新利用,这也就是说,备份工作的核心是恢复,一个无法恢复的备份,对任何系统来说都是毫无意义的。在实际情况中,厂商或集成商更多的是向用户吹嘘,自己的产品在备份过程中如何的巧妙。然而,作为最终用户,一定需要清醒的认识到,能够安全、方便而又高效的恢复数据,才是备份系统的真正生命所在。也许很多人会以为,既然备份系统已经把需要的数
9、据备份下来了,恢复应该不成什么问题。这就大错而特错了,事实上,无论是在金融电信行业的数据中心,还是在普通的桌面级系统中,备份数据无法恢复,从而导致数据丢失的例子实在太多了。众所周知,建造大楼时一定会配备消防系统,但是,并非有了消防系统就能高枕无忧。人们经常获悉,有的楼房突遭火灾时,消防系统却无故瘫痪了,或者消防栓里没有水,或者消防通道被堵塞,以致火势蔓延,造成巨大的生命财产损失。因此,并非所有的消防系统,在遭遇火灾时都能起作用。一样的道理,数据备份设施之于IT系统,就相当于消防系统之于楼房,它是保护IT系统的最后一道防线。即使配备了数据备份设施,并不表明在IT系统遇到问题时一定能将丢失的数据成
10、功恢复。为了进一步阐明恢复的重要性,让我们再来对比一下备份和恢复操作的区别。首先、备份是计划内的工作,而恢复则是计划外的工作。对于IT技术人员来说,备份是按照既定的备份策略,每隔一定时间,按部就班地操作即可。而恢复则是只有当发生数据丢失时,或者要查找历史数据时,才会进行的操作。通常情况下,实施恢复操作时,往往都是十万火急,越快越好,同时还希望恢复后的数据可用。由于备份对系统环境的影响比较大,所以备份的工作往往是在特定的时间内完成的,也即所谓的“备份窗口”,这时生产系统通常不工作。而恢复,因为是计划外的工作,对生产系统肯定会产生影响。下面以电子邮件数据的备份和恢复为例,来说明恢复对系统的影响。假
11、定您对电子邮件系统的备份策略是每晚八点定时备份到磁带,备份完成后磁带里就会保存有昨天晚上八点之前收到的所有电子邮件。当然,收发电子邮件是一个连续的动作,晚上八点后,邮箱仍然在不停地收邮件。假设到了今天中午12点,您发现某一个重要的邮件不小心被删掉了,如果这个邮件是昨天晚上八点前收到的,那么您还是有可能从磁带里恢复该邮件。这时就要启动恢复操作了。如果备份软件能够实现邮件一级的恢复(恢复颗粒是单个邮件)的话,您只要能找到那封丢失的邮件,直接将它恢复到邮箱就可以了,恢复的过程对整个邮件系统没有任何影响;但是,如果您的备份软件只能做到邮箱级的恢复(恢复颗粒是一个邮箱),那么如果您想恢复该邮件的话,就不
12、得不把整个邮箱恢复到昨晚八时的状态,造成的后果就是昨天晚上八点到今天上午12点收进的邮件会全部被覆盖。可见,如果从备份的角度来说,两者没什么区别;但是从恢复的角度来讲,两者差别很大。第二、备份是大批量的数据移动过程,往往需要将所有数据或所有增量数据全部拷贝到备份设备,而恢复往往是少量的数据移动过程,只需将需要恢复的数据从备份设备拷贝回主服务器。现在市场上流行的很多备份软件,基本上都是在上世纪80年代设计的,那时的数据量相对较小(几十兆到几百兆)。当进行备份操作的时候,备份软件会把所需要备份的数据文件打包成一个备份集(backup set),然后将它拷贝至备份设备中,并且针对该备份集形成相对应的
13、索引,但一般不会对备份集里的内容建立详细的索引。那么当需要恢复该备份集中的某一个文件时,备份软件就必须从备份集中搜索到该文件,然后进行恢复。这在只有几百兆数据量的IT环境下完全可行,然而来到我们目前所处的海量数据的时代,由于数据量已经高达几十甚至几百TB,如果继续沿用这种方式,势必产生许多问题:从浩如烟淼的备份数据里,找到并恢复您需要的那一个,难度无异于大海捞针!例如,有的用户去电信公司要求查询自己的历史话单(如两年前的某一个月的通话记录),今天,很多电信公司无法满足用户的这一需求,因为很多情况下明知该历史话单一定存在于原先的备份介质中,但由于数据量实在太大,几乎没有可操作性。这种情况下,备份
14、虽然是成功的,但是恢复的成功率却很低。早年的调查就揭示了数据恢复的真相,即恢复作业的平均成功率只有70%左右。当考虑数据保护时,应着眼于“恢复”,需着重考虑以下几点:1 .确保数据能够恢复2 .恢复速度要尽量快3,恢复操作对系统的影响要尽可能小4 .能够恢复到用户指定的时间点5,恢复的数据是可以使用的当然,恢复是在备份的基础上进行的,如果备份失败,恢复肯定不会成功。为了确保能达到恢复的目的,对备份操作有以下几点基本要求:1.提高备份成功率备份过程中,当备份介质、备份设备和网络出现问题时,备份作业就会中断,要提高备份的成功率,备份系统就应具有容错机制。如果是备份介质或备份设备出现问题,可以将备份
15、自动切换到其他的备份介质、设备或路径上,并能确保从中断处继续备份操作。另外,“备份的断点续传”也很重要,当网络发生阻塞时,备份也会中断;一旦网络恢复正常,备份能从中断处自动重启并继续进行。5 .精细的备份数据索引当用户希望恢复数据时,绝大多数情况下并不需要恢复整个系统,而只要恢复部分数据,甚至只是一个文件或邮件。索引做得足够精细,有利于在恢复时能快速查找并定位所需要恢复的数据,实现小颗粒恢复,同时将对系统的影响降到最小,恢复速度大幅提高。6 .能产生多个数据副本为了防止备份数据意外损坏,产生多个备份副本是必要的,也很有效。产生数据副本的方法有两种:同步和异步。同步的方法是,在备份时,同时把备份数据写入到两个不同的介质中;异步的做法是,先把备份数据写入一个介质,然后再利用空闲时段,将备份数据复制到其他介质上。当然也可以通过网络将其复制到异地,达到数据容灾的目的。7 .离场保护如果数据备份是为了恢复而进行的,就应该考虑到万一数据中心遭遇灾难时,怎样进行恢复。