發新話題
打印

[轉貼]VMware vCenter 高可用性 HA 详解

[轉貼]VMware vCenter 高可用性 HA 详解

http://www.storageonline.com.cn/virtualtech/vmware/vcenter-ha/

VMware HA 简介

HA的全称是High Availability(高可用性)。VMware HA群集一般具有一个包括两个或者两个以上ESX主机的逻辑队列。在一个HA群集中,每一台VMware ESX服务器配有一个HA代理,持续不断地检测群集中其他主的心跳信号。假如某台ESX主机在连续三个时间间隔后都还没有发出心跳信号,那么该主机就被默认为发生了故障或者与网络的连接出现了问题。 

在这种情况下,原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。反之,如果一台主机无法接收到来自群集的其他主机的心跳信号,那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。如果真的出现了问题,那么就会中断在这台主机上所有正在运行的虚拟机,并启动预先设定好的备用主机。 

此外,VMware HA的另一个显著的特点是能够对一个群集中的多台ESX服务器(多达四台)上进行故障转移。对于一次VMware HA故障转移,客户端操作系统认为只是一次因硬件的崩溃而进行的重启,并不会觉察到是一次有序的关机。因此,这样的修复并不会改变操作系统的状态。此外,虚拟机中任何正在进行的业务也不会丢失。即使备用ESX服务器主机的硬件设备跟原ESX服务器主机的硬件设备有所不同,客户端操作系统也不会检测到这种不同。所以,VMware HA的故障转移对于客户来说可以算是完全透明的,几乎不会出现任何停机的危险。

1. VMware HA 提供快速中断恢复

VMware HA 利用配置为群集的多台 ESX/ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。 
VMware HA 通过以下两种方式保护应用程序可用性:

  • 通过在群集内的其他主机上自动重新启动虚拟机,防止服务器故障。
  • 通过持续监控虚拟机并在检测到故障时对其进行重新设置,防止应用程序故障。

与其他群集解决方案不同,VMware HA 提供基础架构并使用该基础架构保护所有工作负载:

  • 不需要在应用程序或虚拟机内安装任何特殊软件。所有工作负载均受 VMware HA 保护。配置 VMware HA之后,不需要执行操作即可保护新虚拟机。它们会自动受到保护。
  • VMware HA 与 VMware Distributed Resource Scheduler (DRS) 结合使用,不仅可以防止故障发生,而且可以在群集内的主机之间提供负载平衡。

与传统的故障切换解决方案相比,VMware HA 具有多个优势:

  1. 最小化设置 设置 VMware HA 群集之后,群集内的所有虚拟机无需额外配置即可获得故障切换支持。
  2. 减少了硬件成本和设置 虚拟机可充当应用程序的移动容器,可在主机之间移动。管理员会避免在多台计算机上进行重复配置。使用 VMware HA 时,必须拥有足够的资源来对要通过VMware HA 保护的主机数进行故障切换。但是,vCenter Server 系统会自动管理资源并配置群集。
  3. 提高了应用程序的可用性 虚拟机内运行的任何应用程序的可用性变得更高。虚拟机可以从硬件故障中恢复,提高了在引导周期内启动的所有应用程序的可用性,而且没有额外的计算需求,即使该应用程序本身不是群集应用程序也一样。通过监控和响应 VMwareTools 检测信号并重置未响应的虚拟机,还可防止客户机操作系统崩溃。
  4. DRS 和 VMotion 集成 如果主机发生了故障,并且在其他主机上重新启动了虚拟机,则 DRS 会提出迁移建议或迁移虚拟机以平衡资源分配。如果迁移的源主机和目标主机中的一台或者两台发生故障,则 VMware HA 会帮助从该故障中恢复。

2. 创建 VMware 群集

VMware HA 在 ESX/ESXi 主机群集的环境中运行。必须创建一个群集,然后用主机填充该群集,并在建立故障切换保护之前配置 VMware HA 设置。创建 VMware HA 群集时,必须配置许多可决定功能如何运行的设置。在此之前,首先确定群集的节点。它们是为支持虚拟机而提供资源,而且将由 VMware HA 用于故障切换保护的 ESX/ESXi 主机。然后应当确定如何互相连接这些节点,以及如何将这些节点连接到虚拟机数据所驻留的共享存储器。在建立好网络架构后,可以将主机添加到群集并完成 VMware HA 配置。参考《VMware vSphere 集群及 DRS 详解 

3. VMware HA 的工作方式

VMware HA 可以将虚拟机及其所驻留的主机集中在群集内,从而为虚拟机提供高可用性。群集中的主机均会受到监控,如果发生故障,故障主机上的虚拟机将在备用主机上重新启动。

VMware vCenter 高可用性 HA

3.1 VMware HA 群集中的首选主机和辅助主机

在将主机添加到 VMware HA 群集时,代理将上载到主机,并配置为与群集内的其他代理通信。添加到群集的前五台主机将指定为首选主机,随后的所有主机将指定为辅助主机。首选主机维护和复制所有群集状况,并用于启动故障切换操作。如果从群集内移除某台首选主机,则 VMware HA 会将另一台主机提升为首选状态。 
加入群集的任何主机必须与现有首选主机通信以完成其配置(当您正在将第一台主机添加到群集时除外)。必须至少有一台首选主机运行正常,以便 VMware HA 正确进行操作。如果所有首选主机均不可用(不响应),则无法为 VMware HA 成功配置任何主机。如果活动首选主机发生故障,则另一台首选主机会将其替换。

3.2 故障检测和主机网络隔离

代理会相互通信,并监控群集内各台主机的活跃度。默认情况下,此操作通过每秒交换一次检测信号来完成。如果15 秒过去后仍未收到检测信号,而且 ping 不到该主机,则系统会声明该主机发生故障。如果主机发生故障,则将对该主机上运行的虚拟机进行故障切换,即在具有最多可用未预留的容量(CPU 和内存)的备用主机上重新启动。

主机网络隔离在主机仍在运行但已经无法再与群集内的其他主机通信时发生。在默认设置中,如果主机停止接收群集内所有其他主机的检测信号的时间超过 12 秒钟,则将尝试 ping 其隔离地址。如果仍然失败,主机将声明自己已与网络隔离。 
如果在 15 秒或更长时间内隔离主机的网络连接仍未恢复,则群集内的其他主机将认为该主机发生了故障,并会尝试故障切换其虚拟机。但是,如果隔离主机保留对共享存储器的访问权限,则它也会保留虚拟机文件上的磁盘锁。为避免潜在数据损坏,VMFS 磁盘锁定会阻止对虚拟机磁盘文件同时进行写操作,并尝试故障切换隔离主机的虚拟机故障。默认情况下,隔离主机会保持其虚拟机为启动状态,但您可以更改主机对“虚拟机关机”或“关闭虚拟机”的隔离响应。参见虚拟机选项

3.3 虚拟机选项

虚拟机重新启动优先级

虚拟机重新启动优先级确定主机发生故障后虚拟机的重新启动相对顺序。这些虚拟机在新主机上按顺序重新启动,首先启动优先级最高的虚拟机,然后是那些低优先级的虚拟机,直到重新启动所有虚拟机或者没有更多的可用群集资源为止。如果主机故障数目或重新启动的虚拟机数目超过了接入控制所允许的数目,则系统可能会等到有更多资源可用时再重新启动优先级较低的虚拟机。VMware 建议为提供最重要服务的虚拟机分配较高的重新启动优先级。

主机隔离响应

主机隔离响应确定当 VMware HA 群集内的主机失去其服务控制台网络(在 ESXi 中为 VMkernel 网络)连接但仍在运行时将发生的情况。主机隔离响应要求启用“主机监控状态”。如果“主机监控状态”处于禁用状态,则主机隔离响应将同样被挂起。当某个主机停止接收所有其他主机的检测信号而且通过 ping 操作无法获得其隔离地址时,可以确定该主机已被隔离。发生这种情况时,主机会执行其隔离响应。响应包括:保持启动、关闭电源和关机。还可以为各个虚拟机自定义此属性。要使用“关机”设置,必须在虚拟机的客户机操作系统中安装 VMware Tools。将虚拟机关机的优点在于可以保留其状况。此操作优于关闭操作,关闭操作不会将最近的更改刷新到磁盘中,也不会提交事务。在关机完成时,已关机的虚拟机需要更长时间进行故障切换。未在 300 秒内或在高级属性 das.isolationShutdownTimeout 中指定的秒数内关机的虚拟机将被关闭。 
注意   创建 VMware HA 群集后,可以替代特定虚拟机的“重新启动优先级”和“隔离响应”的默认群集设置。此替代操作对于用于特殊任务的虚拟机很有帮助。例如,可能需要先启动提供基础架构服务(如 DNS 或 DHCP)的虚拟机,再启动群集内的其他虚拟机。

3.4 结合使用 VMware HA 和 DRS

结合使用 VMware HA 和 Distributed Resource Scheduler (DRS) 可将自动故障切换与负载平衡结合起来。这种结合可在 VMware HA 将虚拟机移至其他主机后更快再平衡虚拟机。 
VMware HA 执行故障切换并在其他主机上重新启动虚拟机时,首要任务就是使所有的虚拟机立即可用。重新启动虚拟机后,启动这些虚拟机的主机可能会负载过重,而其他主机则相对负载较轻。VMware HA 将使用 CPU和内存预留来确定故障切换,而实际使用情况可能会更高。 
在结合使用 DRS 和 VMware HA 并且启用了接入控制的群集内,可能不会从正在进入维护模式的主机上撤出虚拟机。这是由于预留用于维护故障切换级别的资源造成的。必须使用 VMotion 将虚拟机手动迁出主机。有关 DRS 的详细信息,请参见《VMware vSphere 集群及 DRS 详解》。

4. 创建 VMware HA 群集

前提条件

  1. 所有虚拟机及其配置文件必须驻留在共享存储器上。
  2. VMware HA 群集内的每台主机必须分配了主机名称,并且具有与每个虚拟网卡相关联的静态 IP 地址。
  3. 主机必须配置为具有虚拟机网络的访问权限。
  4. VMware 建议为 VMware HA 设置冗余网络连接。

步骤

1. 为群集启用 VMware HA:

VMware vCenter 高可用性 HA

这里有些具体设置:

VMware vCenter 高可用性 HA

设置完成后,群集的属性多了个HA:

VMware vCenter 高可用性 HA

5. 测试VMware HA

当前两台HOST各有一虚拟机在运行:

VMware vCenter 高可用性 HA

重启其中一台host:

VMware vCenter 高可用性 HA

该host上的VM迁移到了另外一host上:

VMware vCenter 高可用性 HA

TOP

發新話題