您的位置:新葡亰496net > 服务器网络 > 你需要知道这五点,数据中心灾难恢复规划模板

你需要知道这五点,数据中心灾难恢复规划模板

发布时间:2019-11-05 00:51编辑:服务器网络浏览(143)

    如何让数据中心资产的审计更加高效?,数据中心资产审计

    每个人都有自己的职责,但当其负责的工作不能拖延或推迟,否则将影响到企业的业务发展时,那么该如何应对?这是一个令人头痛的问题。这适用于数据中心内的大多数任务。这些设施的关键业务性质意味着几乎所有的活动都需要尽快解决。

    根据波洛蒙研究所的一项调查研究,现在数据中心每次中断平均成本为552040英镑。而这个数字说明了即使是重复或耗时的工作也不能中断业务的原因。

    图片 1

    数据中心工作人员对数据中心可靠运营是否比较自信,还是担心吊胆地生怕出现问题导致数据中心宕机?即使企业对数据中心资产的审计每年一次或每半年一次,这个流程将会耗费数据中心工作人员的大量的资源、时间、精力。如果企业通过人力收集数据,那么工作人员必须单调重复地记录每一个机架资产的数据,核查最近一次审计之后是否移动过机架设备等事项。而对于这些变动都必须采取措施和行动,并尽快处理。因此,工作人员需要准确记录,以防止未来审计中的任何错误。但这么做可能让那些经验丰富的员工沦为数据中心资产的统计记录人员,而这些人应该专注于从事为数据中心增值的关键工程任务。

    如果在审计过程中发生人为错误,则会产生一定的后果。工作人员不得不花费时间查找遗失资产。而新项目的IT资源可能会受到影响,从而导致财务效率低下和供应问题。

    企业最关心的是错误的或过时的审计所产生的监管影响,特别是如果监管机构对企业进行的审计进行调查和监督,如有失误,可能会对该企业进行经济处罚。

    在企业需要解决方案之前先要满足需求

    随着技术的快速发展,组织需要不断评估其数据中心,以提供敏捷应用,并保持市场竞争力,还需要不断优化可用资源,有效管理成本,并尽可能降低总体拥有成本。

    调查机构IDC公司进行的调查显示,随着服务器使用时间日益增长,每台服务器的年度成本将增加148%,服务器性能下降39%,计划外停机时间增加62%。如果对服务器资产没有进行定期准确的审计,则业务的损失可能会远远超过部署新设备的成本。

    如果企业的数据中心资产管理超出了本地IT团队的能力,例如利用多个数据中心站点,主机托管服务和边缘设施的混合生态系统,那么IT团队跟踪和维护面临的挑战就会越来越大。

    如今,产业随着新兴技术的出现也正在发生改变。物联网(IoT)和实时资产管理系统将直接影响着数据中心的审计,通过这些技术正在将这个过程从人们担心的问题转变为节约成本并提高效率。

    毕竟,理想的数据中心审计应该提供清晰的操作,了解可以对现有流程和设备进行改进的方法以及确保合规的方法。

    对于IT团队来说,审计不应该像现在这样令人望而生畏,而是要让数据中心团队提供高效的服务,从而使业务和客户长期受益。

    企业首先应该了解如果现有的做法保持不变,那么这样的审计成本有多高。企业的许多成本被隐藏起来。从企业的资产调节和更换,到人工录入库存数据的生产力和劳动力,隐藏着许多成本,如果对此没有记录,就会增加企业的大量成本。

    企业通过部署实时资产的管理,将审计流程转变为实时连续清单,可以显著节约成本。数据中心资产的实时资产可视性也有很大的好处。企业了解资产在哪里,并随时都可以降低监控和报告设施的工作量,而这是一种可以让数据中心工作人员感到满意的方法。

    为了更好地进行监管,对数据中心资产的审核是必要的。不过,这种费时费力的内部审计可能会成为过去,而更多的是在需要的时候生成实时报告。

    每个人都有自己的职责,但当其负责的工作不能拖延或推迟,否则将影响到企业...

    最近的几次数据中心停电造成非常最严重的停电事故。例如,美国达美航空公司数据中心的电力中断,造成该航空公司1.5亿美元的损失,美国"超级碗"的赛场断电,让主办方尴尬不已。而停电可能会随时影响任何人。

    数据中心关闭清单有助于IT团队在插拔硬件,并在丢失有价值的信息之前专注数据备份,测试和系统验证。

    近来,不少公司因为数据中心的电力中断而备受困扰,比如美国达美航空公司数据中心的电力中断,造成高达1.5亿美元的经济损失。又比如美国“超级碗”赛场断电,耽误赛事日程。

    在制定数据中心灾难恢复规划和业务连续性计划时,请记住,你正在保护对信息技术与通信设施所做的重大投资。根据中断事故程度的不同,数据中心的整体完整性有可能完全不受影响,又或者会被彻底破坏。

    然而,数据中心运营商所面临的困难是确定停电的根本原因,因为电力中断的原因比较复杂,例如,服务器负载过重,导致系统崩溃;当地电力供应商的供应问题,工作人员误操作的人为因素等。

    尽管政策和流程对于现代IT至关重要,但数据中心管理员通常因为中断事件而措手不及,没有关闭需要关闭的设备。这种需求可能像暴风雨即将来临一样剧烈,或者仅仅是一次普通的市政电网升级。但是,企业准备和响应设施关闭的方式可以避免灾难带来的损失。

    在运维过程中,数据中心面临着诸多的挑战,比如数据中心的运营费用,这就要求建立数据中心之前,进行预算和规划,又比如能源成本上升采用云主机托管,能源成本上涨可以通过使用新技术缓解,例如虚拟化和云主机托管,可以大大降低能源成本。

    灾难恢复(DR)规划需要灵活性和扩展性,解决各种可能出现的中断情况。业务连续性(BC)计划亦是如此。两者还需要定期测试,以确保技术、流程和人员在灾难发生时能够彼此协同,尽可能减少业务中断。

    以下是数据中心运营商应该关注的五个最重要的问题,以确保不会发生数据中心停电事故。

    经过精心设计和测试的数据中心关闭程序在业务连续性规划中起着至关重要的作用。它定义了迁移或关闭应用程序,保护有价值的数据,关闭物理系统的最佳过程,然后在事件或故障之后重新启动它们。以下考虑在一个基本的关闭文档中找到的主要元素。

    再比如维护和冷却要求,数据中心设施和组件需要在适合的温度下全天不间断的工作,这就需要完善的冷却系统,以保持所需的温度。

    本数据中心灾难恢复规划指南重点介绍了制定灾难恢复规划的最佳实践。我们从成功的数据中心灾难恢复规划中,找到最关键的因素,即应当参与流程规划的人员以及从何处着手开始。

    图片 2

    图片 3

    其实,数据中心还面临着沟通融合、基础设施要求、缺乏资源、服务器效率、数据中心安全、网络阻塞等挑战,在这其中,数据中心挑战也占据着重要的位置,那么是什么原因导致断电,操作员的误操作、停电,也有可能是服务器负载过重,导致系统崩溃。

    图片 4

    (1)可以随着快速发展的电力系统迁移吗?

    验证和更新系统文档

    图片 5

    业务连续性计划和灾难恢复规划有何区别?

    数据中心的不同阶段,对电力需求也在变化。服务器或交换机的添加都可能对电力的需求产生重大影响。因此,能够分析数据中心一段时间内对电力的需求是非常重要的,以便更容易地进行长期预测。

    每个数据中心关机过程都是最终重新启动的前提,所以适当的准备是确保一旦中断时间结束后重新启动成功的关键。创建一个全面的(或至少是现有的)文档集,可以捕获每个系统的卷,操作系统和应用程序配置,特别注意重新启动期间可能或意外更改的任何内容。创建此文档有无数工具,大多数现代配置管理和执行工具可以捕获和报告系统状态。不要忘记捕获或记录任何网络设备或存储阵列的配置。

    虽然数据中心断电是非常严重的问题,但是我们还是希望有相关的解决方案。

    业务连续性计划确保人们在原来的工作环境无法使用时,能有另一处场所可供选择。业务连续性计划需要列出基本的业务职能,明确指出必须不中断地运作的系统和流程,同时说明如何维护这些系统和流程。它应该充分考虑到任何可能会出现的业务中断。

    (2)电源链是否受到威胁?

    管理依赖关系

    在这里,我们需要确定几个问题。

    灾难恢复规划则是一个广义的术语,描述企业和组织内中断的IT系统、网络和其它关键资产恢复的过程。在规划任何灾难的恢复时,拥有灾难恢复站点是极为重要的因素。

    越来越多的数据中心连接到网络,除了机架中包含的终端和访问点之外,很多渠道可能会成为破坏网路犯罪行为的破坏途径。

    组织和数据中心设施之间的实际依赖性差异很大,因此IT规划人员需要确定包括网络设备,存储阵列,DNS服务器,备份服务器和调度程序在内的启动顺序。一旦所有必需的服务器,存储,网络和关键服务(如DNS)重新联机,启动顺序就可以重新启动应用程序(如数据库),然后是依赖的应用程序(如企业销售系统)。然后,启动依赖于这些应用程序的任何流程,例如企业的店面网站。

    1. 跟随数据中心的变化,电力系统进行升级

    公司可以建立自己的内部站点,自行管理,亦可以通过云托管服务提供商建立外部站点。需要快速恢复数据的企业往往会选择内部的站点,这通常是另一个可以快速恢复业务运营的数据中心。不过,云端灾难恢复方案不断改进,响应时间日益缩短,已经可以满足间隔更短恢复时间的目标。

    此外,网络违规行为甚至不需要通过电线和电缆来实施。狡猾的犯罪分子可能会进入某个数据中心,破坏内部的电力供应。但是,不仅仅是外部的恶意人员所造成的危害,也要警惕数据中心内部工作人员的行为。有些知识和经验不足的工作人员在与接口进行交互的过程中犯错,也会造成不可估量的伤害。

    在准备过程中,还可以识别和了解数据中心内各种各样的依赖关系。记录依赖关系允许IT人员以适当的顺序重新启动系统,服务和应用程序,以避免中断和启动时间的损失。例如,工作人员不想在启动依赖的存储阵列之前启动服务器。

    可以说数据中心的不同阶段,对电力需求也在不停的变化,比如增加服务器或者交换机都有可能对电力产生巨大的需求,所以及时掌握数据中心在这一时间段对电力的需求,变得十分重要。此外,还需要对数据中心的供电进行合理的评估,以免数据中心超载,供电不足造成停电的状况。

    外部容灾站点的使用可以有各种不同的程度。热的容灾站点可以在主数据中心遭遇灾害事件后,作为功能齐全的数据中心独立运行使用。较热的站点是指配置了设备,但缺乏数据的站点。当灾难发生后,企业需要添加客户数据(通常包含了软硬件层面)。相对的,冷站点只有IT基础架构,但是在灾难发生前不配置任何设备。冷站点适用于可以等待较长时间才恢复运行的企业和组织,或者只针对特定的工作负载。

    为了防止出现这种情况,运维文档和流程控制至关重要。采用更多的硬件不是防止灾难性停电的最佳选择,事实上,添加额外的硬件实际上可能使控制情况更加糟糕。

    执行并验证备份

    2. 知道所有互连设备和系统的一切情况

    一个企业或组织可能会使用到多种不同类型的站点,将其最关键的应用程序和数据放在热站点上,不重要的系统置于较热或冷站点。

    (3)灾难恢复计划是什么?记录文档了吗?

    备份是任何数据中心内的一个重要过程,但在计划的设备中断之前,固态备份工作至关重要。在关机开始之前完成,并验证任何定期安排的备份,并手动备份在关闭之前未定期备份或具有长时间恢复点目标的任何系统。

    对于数据中心运营至关重要的是,需要电力链记录在一起,从进入建筑物的电力,再通过UPS、PDU/提供给所有的机架设备。

    相比而言,数据中心灾难恢复规划侧重于特定的数据中心设施及其基础架构,包括位置、建筑、安全性、电源与环境系统。

    在不影响业务环境的情况下进行断电测试,实际上是采用虚拟开关设备,这将允许数据中心运营商可以应对最坏的情况,并实施恢复服务。

    传统的备份方法可能寻求捕获每个服务器的操作系统状态以及单独的数据备份,例如SAN上的数据。虚拟化数据中心可以选择更新的最新虚拟机感知备份,例如快照和远程复制。没有一个适当备份的方法或措施,这个流程和底层工具必须适合企业自己的数据中心和业务需求,但关键是要确保所有的备份都被备份,并测试这些备份验证它们是否完整和可恢复。

    这意味着数据中心运营需要知道哪些与电力相关的设备,以及设备各自的相互依赖关系。这可以让数据中心运营了解某些设备故障或脱机维护时的潜在影响。此外,还应该了解每个电源链设备的状态。

    第一步:操作风险评估

    数据中心工作人员总是假设他们的电源供应链和电源备份系统是万无一失的,但是如果没有故障安全测试,会认为面临什么样的结果?

    如果准备时间有限,请专注于关键任务备份。但是,任何未备份的系统或数据都将为应用程序和业务带来风险。

    可以通过采用数据中心基础架构管理(DCIM)实现对电源管理。DCIM使数据中心运营能够以最高的效率运行数据中心,同时允许所有相关人员改进整体运营情况,并识别漏洞,从而保持电源链的安全。

    准备数据中心灾难恢复规划的一项关键活动就是对建筑物或设施进行操作风险评估,分析关键的运营项目,如建筑物位置,包括进出线路;与燃料储存位置的距离;与公路、铁路线和机场的距离;发电设施,包括商业电力和备用电力系统;电源保护,包括接地和联结、避雷器、线路调节器、浪涌抑制器;HVAC(供热、通风与空调);关键系统,包括服务器、VoIP系统;网络基础架构,包括电缆、连接器、路由器、同轴电缆与光纤电路;安全性,包括物理访问与信息安全;工作区域,包括办公室、会议室、隔间、家具、照明;消防,包括火警探测器、烟雾探测器、灭火器、FM-200灭火系统;建筑地板和墙体,包括防火墙、活动地板;以及公共设施,包括水、电力、排水与通讯。

    电源故障模拟使数据中心运营商可能找到缺乏冗余的设施,并发现单点故障。但是,这需要文档进行记录。

    检查和验证系统硬件

    部署的DCIM还可以让数据中心运营全面了解自己的产品,通过共享实时数据和易于理解的图表,消除IT和设施之间的通信孤岛。

    在规划数据中心运营风险评估的过程中,假如公司采取租赁模式,需要与IT和楼宇管理部门协调;如果自己拥有该建筑物,协调等部门则变为设施管理部门。在开始之前,请与这些组织检查评估的目标。

    因此,数据中心运营商在灾难性的电源故障之前,建立断电测试机制并记录其恢复过程。

    准备数据中心关闭清单的第三步是检查硬件状态,并识别任何硬件故障。现代系统管理工具可以生成电子邮件或邮件系统的错误报告,将事件记录到日志文件中,甚至可以在全面实时仪表板上跟踪事件。但并非所有事件都能立即处理。例如,RAID6组的RAID5中的磁盘可能会失败,并重写到另一个备用磁盘,但技术人员可能需要一段时间才能更换和重建故障磁盘。在可能将虚拟机工作负载迁移或重新启动到其他可用系统的服务器上也会出现类似的问题,但是由于尚未处理,故障系统可能仍然存在问题。

    图片 6

    如果你有风险评估清单的话,与IT管理、楼宇管理及设施管理团队一同加以回顾,确保其涵盖了所有的基础内容。可能的话,询问IT和设施团队是否有做过任何评估,或存有任何文档,这或许会为你节省不少时间,当然前提是数据的时效性在一年之内。

    (4)可以实时监控操作吗?

    对错误日志和仪表板的审查也不会解决这些问题,但它会在关闭之前发现任何问题,提醒IT人员这些问题不是由停机时间或重新启动引起的。IT人员可以作出明智的决定,以便在停机之前解决悬而未决的事件,或至少确保没有解决的问题不会影响重新启动。

    3. 确保电源系统没有受到攻击或威胁

    在评估中遵循下列操作:

    数据中心运营商必须知道哪些设备现在在哪里,使用了多少电能。对于不断增加基础架构的数据中心来说,这往往会很困难,因为这可能会对电源容量和电源分配产生巨大的影响。

    以正确的顺序关闭系统

    数据中心是通过网络进行连接,当然除了基架中包含的终端和访问点之外,很多渠道可能会成为破坏数据中心的途径,所以保护这些渠道免受破坏,成为数据中心建设需要考虑的问题。

    1. 数据中心灾难恢复规划的开发小组应与内部技术团队、应用团队与网络管理成员等各种IT团队会面沟通,从而确保所有定期使用的数据中心设施的成员都将其纳入容灾规划流程当中。

    注意所有移动部件的唯一有效方法是单一视图。这种整体视图具有实时监控和警报的功能,使数据中心运营商能够减轻风险,并进行更改以避免灾难发生。

    一般来说,成功的数据中心关闭程序从IT环境的外围开始,再向内运行。组织可以首先注销和关闭终端用户,应用程序,如Web服务器,Exchange等服务,然后关闭数据库和中间件。在此之后,在虚拟化环境中可以关闭虚拟实例(如虚拟机或虚拟机),其次是VMware vCenter或Microsoft System Center等管理工具。只有IT团队才能关闭物理服务器。一旦服务器关闭,IT团队就可以关闭存储和网络设备。IT团队再关闭不间断的电源系统,显示器,配电单元和其他辅助设备,最后结束关机。

    在这里,网络攻击成为一种可能性,很多黑客可能不直接破坏供电系统,而是通过网络进入到数据中心,以达到破坏数据中心供电的目的。

    2. 列出内部和外部数据中心资产、第三方供应商与资源,以及所有的利益相关方。

    (5)知道所有互连设备和系统的一切情况吗?

    恢复和验证系统

    此外,我们不应该只防止通过网络手段对数据中心进行破坏的黑客,还应该防止内部人员的破坏,有些工作人员因为自身经验不足,一个小小的错误,有可能导致数据中心供电的中断。

    3. 收集所有相关的基础架构文件,例如建筑平面图、楼层图、系统架构图,网络拓扑图以及设备的配置。

    对于数据中心运营至关重要的是,需要电力链记录在一起,从进入建筑物的电力,再通过UPS、PDU/提供给所有的机架设备。这意味着数据中心运营需要知道哪些与电力相关的设备,以及设备各自的相互依赖关系。这可以让数据中心运营了解某些设备故障或脱机维护时的潜在影响。此外,还应该了解每个电源链设备的状态。

    当计划的中断结束后,IT团队可以实施重新启动过程。在理想情况下,重新启动将与关机顺序完全相反,但并不总是如此。重新启动通常需要小心谨慎,以便将电力重新分配到设施中,并防止可能断路器跳闸,以及和损坏设备的巨大浪涌。每个主要步骤还需要进行一些验证或测试,以确保设备或软件在执行下一个启动步骤之前正常运行。

    所以,为了防止通过以上手段进行破坏的行为,建立运维文档和流程控制变得十分重要。在这里,采用更多的硬件不是防止灾难性停电的最佳选择,不妨采用软件层面的管理,来的更加稳妥一些。

    4. 如果已有,那么先获取到一份现有数据中心灾难恢复规划的副本。假如没有的话,请遵循以下步骤:

    可以通过采用数据中心基础架构管理(DCIM)实现对电源管理。DCIM使数据中心运营能够以最高的效率运行数据中心,同时允许所有相关人员改进整体运营情况,并识别漏洞,从而保持电源链的安全。

    例如,在尝试启动任何存储阵列之前,打开网络设备并确认其已正确引导。一旦存储阵列打开,请检查是否有任何故障磁盘,有问题的磁盘组和其他可能的问题。

    4. 不妨多模拟故障安全测试,做好完整的灾难恢复计划

    a. 与管理层合作,找出数据中心面临的最严重的威胁,如火灾、人为错误、断电、系统故障,或是安全漏洞。

    部署的DCIM还可以让数据中心运营全面了解自己的产品,通过共享实时数据和易于理解的图表,消除IT和设施之间的通信孤岛。

    【编辑推荐】

    数据中心在运营过程中,难免会出一些故障,所谓有备而无患,在真正出bug的状况下,之前遇到过或者曾经模拟了出错的场景,才更有经验去应对故障。在这里,我们建议在不影响业务环境的情况下对数据中心进行断电测试,使用虚拟的开关设备,将允许数据中心运营商可以应对最坏的情况,并对其进行恢复。

    b. 与管理层合作,找出数据中心内最严重的漏洞,例如过时的备份电源系统。

    由于数据中心停电的原因很多,尝试用人工方法和电子表格来跟上基础设施的所有变化是费力的,并引起不可预见的风险。因此,必须采取适当可行的方法和措施进行管理。

    你需要知道这五点,数据中心灾难恢复规划模板与指南。数据中心工作人员总是假设他们的电源供应链和电源备份系统是万无一失的,但是如果没有故障安全测试,会认为面临什么样的结果?电源故障模拟使数据中心运营商可能找到缺乏冗余的设施,并发现单点故障。但是,这需要文档进行记录。因此,数据中心运营商在灾难性的电源故障之前,建立断电测试机制并记录其恢复过程。

    c. 回顾历史上数据中心发生过的宕机和中断事件,以及我们是如何加以处置的。

    【编辑推荐】

    5. 数据中心建设应该实时监控操作

    d.  明确在数据中心无法使用时,管理层可接受的最长中断时间。

    对数据中心进行实时监控操作,是以防万一的做法,所以数据中心运营商必须知道设备都被放在哪里,以及使用了多少电能。虽然对于不断增加基础架构的数据中心来说,这很困难,也有可能对电池容量和电源分配产生巨大的影响,但是注意所有移动部件的唯一方法就是单一视图,这种整体视图具有实时监控和警报的功能,使数据中心运营商能够减轻风险,并进行更改以避免灾难发生。

    e. 确定当前应对数据中心中断的流程。

    写在最后,数据中心一旦断电,造成的经济损失不可估量,倒不如从笔者上述的方法做起,对数据中心每个环节进行防护,这样才能更好地对数据中心进行运维。

    f. 确定上述流程的最后一次测试是在什么时候。

    【编辑推荐】

    g. 明确数据中心内的应急小组,了解他们在应对紧急情况下的受训水平。

    h. 辨识数据中心供应商的应急响应能力,特别是那些在过去有合作历史的,查看他们是否仍然可以提供服务、服务的成本以及当前的服务合同状态。

    你需要知道这五点,数据中心灾难恢复规划模板与指南。将数据中心运营评估的结果编制成差距分析报告,确定目前已经完成的工作和需要加以改善的部分,并就如何达到目标水平及预期投资提出建议。

    作为分析过程的一部分,检查数据中心业务中断的影响。假如数据中心的运营发生中断,关键的业务流程将会产生怎样的影响?数据中心发生中断后,对公司的形象、声誉以及竞争地位会有哪些影响?

    除了辨识出对业务的影响之外,从评估中还可以找到有待改进之处,发现这些可能受到中断影响的情况(例如,需要更换的陈旧柴油发电机组),有助于灾难恢复规划的制定。

    制定数据中心的灾难恢复规划

    一旦完成了数据中心分析,明确出潜在的运营风险,就要按照严重性、潜在的损害和发生的可能性排列风险情景的优先顺序,从而将规划的响应活动作有针对性的排序。

    图片 7

    使用国家标准与技术研究所SP 800-34标准“信息技术系统应急计划指南”中提到的结构,我们可以将这些活动扩展至下列结构化顺序的活动:

    1. 数据中心规划的开发团队应当和内部的技术团队、设施部门、公用事业服务提供商以及相关的供应商会面,确定活动的范围,包括内部和外部的威胁、内部和外部的资产、第三方资源和如何联系其他办事处/客户/供应商。务必向高级管理层汇报这些会议,让他们得到及时通知。

    2. 收集所有相关的基础架构文件,例如建筑楼层图、建筑工地图、公共设施布置图、HVAC图、网络架构图以及设备配置。

    1. 获取现有IT灾难恢复规划的副本。假如没有的话,请依次执行以下步骤:

    a. 与管理层合作确定数据中心基础架构所面临的最严重的威胁,例如火灾、人为错误、电力损失、洪水泛滥、系统故障、恶劣天气等。

    b. 确定管理层认为是数据中心最严重的漏洞,例如缺乏备份能力、有所欠缺的建筑安全性,又或者是数据中心靠近经常泛水患的平原。

    c. 回顾历史上数据中心发生过的宕机和中断事件,以及我们是如何加以处置的。

    d. 确定管理层视为最重要的数据中心资产,例如服务器集群、存储系统、网络基础架构、人员配置。

    e. 当出现数据中心资产不可用时,管理层可以接受的最长中断时间。

    f. 确定当前用于响应关键数据中心故障的操作流程。

    g. 确定这些流程最后一次进行测试的时间以验证其相关性。

    h. 找到所有关键数据中心中断的应急响应小组。确定他们的受训水平,尤其是在紧急的情况下。

    i. 确定供应商的应急响应能力:是否曾经有合作过;如果是的话,是否还能提供相应服务;公司要为这些服务支付的金额;数据中心维护合同的状态;如果有的话,服务水平协议是怎样的。

    4. 将所有评估结果编制成差距分析报告,确定目前的工作与有待改善的部分,并就如何达到所需的数据中心准备水平以及投资计划提出建议。

    1. 管理层审查报告并就提议的行动达成一致。

    6. 准备数据中心灾难恢复规划,解决所需的关键设施(包括硬件和软件、数据存储、网络)。

    1. 测试规划与系统恢复设施,验证其正常运作。

    2. 更新数据中心灾难恢复规划文档,记录更改项目。

    3. 安排数据中心灾难恢复功能的下一次检查/审核。

    重要的数据中心灾难恢复规划提醒

    在构建数据中心灾难恢复规划时,请牢记以下准则:

    1. 得到高级管理人员的支持,以便你的计划得到资助。

    2.重视数据中心灾难恢复规划的过程:规划并不一定要长达数十页;但是要包含正确、最新且精准的信息。

    3.考虑在流程中引入行业标准,包括NIST SP 800-34、ISO / IEC 24762:2008和BS 25777:2008。这些标准为你的规划提供了有用的结构化模板,以及有待解决问题的指导。假如计划需要经过审计,这点会显得尤为重要。

    4.收集和组织精准的信息,保持规划过程的简单性。

    5.与IT和设施等关键部门共同审查结果,从而确保假设的正确性。

    数据中心容灾规划有助于保护大多数企业和组织的重大投资。虽然有些公司通过建设第二个数据中心或在第三方环境中租用特定空间来解决数据中心的恢复问题,但对数据中心运营和风险的细致评估仍是灾难恢复规划的一个重要起点。

    【编辑推荐】

    本文由新葡亰496net发布于服务器网络,转载请注明出处:你需要知道这五点,数据中心灾难恢复规划模板

    关键词: