基于复制技术的虚拟机容灾方案

现在各个大企业的计算虚拟化程度都很高了,因此,很多关键的业务,如oracle数据库都跑在虚拟机上,特别是vmware虚拟机上。但是,虚拟机上的数据保护,和物理机还是有很多的不同。物理机时代很多传统的方法,用在虚拟机场景并不是特别合适。
既然是关键业务,肯定是采用复制技术才能实现rpo比较小的容灾保护,传统的每天晚上备份一次的方式,肯定是无法满足关键业务的rpo需求的。下面我就来讲讲各种基于复制技术的虚拟机容灾方案。
同城双活:vsan延展集群
基于同步复制技术的容灾技术很多,比如传统存储的双活或者分布式sds的延展集群,除了vmware vsan外,很多存储厂商特别是sds厂商也提供类似的双活方案。
虽然现在双活方案的门槛下降了很多,但是,对于大部分的企业来说,实施方面还是有颇多的限制。以vmware的vsan为例,它要求两个站点的时延在5ms范围内,一般不能超过100公里,而且,需要万兆的网络条件。如果这些你都可以满足,还需要有一个第三站点做仲裁。而且,站点两边的存储必须是同构的。
双活方案由于数据是完全实时同步的,因此,并不能防止逻辑故障和勒索病毒攻击,需要在目标端采用快照技术做辅助保护,方案才比较完整。
因此,延展集群或者其他的双活方案,虽然好处很多,比如可以做得rpo=0,数据零丢失,但是由于对环境要求比较苛刻,规划和部署也相对复杂,并不是特别普及的虚拟机容灾方案。
快照复制:srm+vr
第二种虚拟机容灾方案就是基于快照复制技术了。vmware本身的site recovery manager+vsphere replication就是这样的解决方案,当然,srm也支持存储的复制。
由于基于虚拟机的快照技术,因此,rpo无法做到秒级,一般都是分钟级。现在srm+vr新版本可以做到最小的rpo是5分钟,对于关键业务来说,丢失的数据量还是有些多。
另外,vsphere replication功能需要特别的许可,需要vsphereessentials plus kit或者更高版本才能支持。
srm+vr由于rpo太大,而且需要特别许可,加上规划部署相对复杂,在国内其实采用并不多。其实,很多备份软件,如veeam,也可以做得rpo为15分钟的虚拟机容灾保护。
秒级rpo的真cdp:zerto
最后,我要介绍rpo介于同城双活和快照复制之间的真cdp方案。
在最新的gartner报告《hype cycle for storage and data protection technologies, 2020》中,gartner把cdp定位为高优先级的数据保护技术,将会在未来的2-5年达到部署的高峰。从曲线来看,可能明年就离开这个技术成熟度曲线了,因为cdp技术已经足够成熟,就像固态阵列一样。
gartner定义:cdp(连续数据保护)是一种连续或几乎连续地捕获更改并将其传输到应用程序,文件和/或数据块的方法。根据解决方案体系结构,将实时更改记入日志或复制到本地或远程存储目标。此功能提供了用于更精细的恢复点目标的选项,并用于备份/恢复,灾难恢复和数据迁移用例。可以将某些cdp解决方案配置为连续捕获更改(真cdp)或按计划的时间捕获更改(近cdp)。
从gartner的定义来看,基于快照的复制,也算cdp的一种,叫near-cdp(近cdp)。但是,near-cdp的rpo一般是分钟级别,而ture-cdp(真cdp)一般可以做得秒级,用来保护关键业务更合适。
gartner在cdp技术里面,列出了几个典型的cdp厂商,其中,专注于虚拟机的真cdp厂商只有zerto。因此,我们就以zerto为代表来介绍虚拟机的真cdp保护方案。
zerto的名字来源于zero rto的意思,意思rto接近于零,就是强调业务连续性。zerto是一家以色列软件公司,专注于云容灾(私有云/混合云/公有云),特别是虚拟机的cdp容灾保护功能,提供秒级rpo,分钟级rto。在中国上海有本地400技术支持中心。
zerto是一家以色列公司,由ziv和oded kedem创立,他们还创立了kashya,该公司被emc收购,现在是dell emc recoverpoint产品的基础。2006年5月9日,emc以1.53亿美元的价格收购了kashya。emc其实在2005年10月就发布了一个名为recoverpoint的产品,该产品改编自mendocino software的一个名为recovery one的产品。因此收购后kashya产品命名为kdx5000,而不是叫recoverpoint。基于kashya技术的emc recoverpoint产品于2007年才发布。
从历史我们就可以看出,zerto的创始人其实是ture-cdp技术的鼻祖,只是新公司只聚焦在虚拟机环境而已。
zerto的cdp工作原理理解起来也不复杂,纯软件,基于hypervisor进行复制,因此无需在虚拟机里安装代理,部署特别简单。由于不用虚拟机的快照,因此不会对应用的性能造成影响,对下层存储也没有要求。带宽要求也比较低,大于5mbps即可以部署。
zerto还支持虚拟保护组,这个功能有点类似存储的卷快照一致性组。对于比较复杂的业务,可能由多个虚拟机上的应用组成,这些虚拟机的数据需要保持在一致的状态,这个时候虚拟保护组可以确保这些虚拟机的状态是一致的。
当然,既然是真cdp方案,zerto可以做得秒级的rpo,可以恢复到30天内任意时间点,有效防止逻辑错误和勒索病毒的危害。
容灾方案,仅仅做好数据复制是不够的,还需要能够方便进行容灾演练和切换。zerto可以实现自动化的灾备恢复或演练,使用特别简单。
市场上容灾产品很多,但是大部分安装部署都比较复杂,使用起来学习成本也很高。zerto这块尤其做得好,gartner的分析师在《swot: zerto, worldwide》报告中称赞zerto说“该产品以快速安装和设置时间以及使用方便为基础,具有很强的差异化。”
总结一下zerto相比其他产品,做得比较好的有以下几点:
基于软件的复制容灾——与存储无关,支持异构存储,支持超融合的容灾 如 nutanix,vsan,smartx等
基于io的复制,与快照无关,对生产性能无影响,rpo可以到秒级,rto到分钟级.
支持虚拟化异构——不同版本的vmware复制,vmware容灾到hyper-v,或hyper-v到vmware,或vmware/hyper-v到aws/azure/阿里神龙/腾讯黑石
丰富的恢复演练,开发测试功能——在不影响生产和容灾复制的情况下进行恢复演练和开发测试
引入虚拟组概念——可保证同一应用的多台虚拟机数据一致性(多台虚拟机恢复至同一时刻点)
cdp功能,可以恢复30日内任意时间点数据
安装使用简单
最后,我想说,zerto也不是什么多好,也有不好的地方,比如价格相比备份软件还是比较贵的。不过,考虑到zerto支持秒级rpo,而且支持恢复到30天任意时间点,满足绝大部分关键业务的保护需求,这是备份软件做不到的。而且,zerto是按照保护的虚拟机个数报价的,一个企业,关键的虚拟机不会太多,可以只针对关键的虚拟机采用zerto这种cdp来进行保护,而普通虚拟机采用备份软件来保护即可。加上有了zerto,无需再采购数据库的复制软件,这么算下来就不觉得贵了。


EDA/IP产业进入快速发展阶段
挖人才、夺市场、苦研发,谷歌真能追上苹果“步伐”!
移动机器人的新应用,建筑地面裂缝检测
基于OP97A的V/I转换电路
国产工控机在智能交通领域的应用:以高速公路联合监控为例
基于复制技术的虚拟机容灾方案
小程序后端开发要降低维护成本,该如何选择合适的云服务器?
vivo要逆天,就屏幕指纹识别这件事,比iPhone8还快了一步
BMW在Build 2016发布首款物联网软件
Uber退出中国市场 却在全球为中国用户提供海外服务
国产存储芯片的发展以及重要性
索尼 PS4 /5 都支持 Apple TV 等流媒体应用
长虹声纹识别人工智能电视引领客厅经济
MAX1917应用电路图(输入2.5V 输出1.25V 7A
智能音箱HomePod升级iTunes 推动“苹果音乐”的重要落地
新冠疫情下莫仕加大产能为客户提供急需医疗产品
工厂空气质量监测站的特点是什么?
案例分享:手工焊接导致IC和外围元器件受损
三星Note10真机曝光 屏占比相当之高
光伏逆变器PCS并网测试方式