如何管理多个虚拟机的可用性(一)

  • 来源:
  • 更新日期:2018-05-22

摘要:有三种情况可能会导致虚拟机受影响:计划外硬件维护、意外停机、计划内维护。

 有三种情况可能会导致虚拟机受影响:计划外硬件维护、意外停机、计划内维护。

2-1605301J034Q1.jpg

1.当虚拟机平台预测硬件或者与物理计算机关联的任何平台组件即将发生故障时就会发生计划外硬件维护事件。当预测到故障时平台会发出计划外硬件维护事件以便减少对托管在该硬件上的虚拟机的影响。
虚拟机使用实时迁移技术将虚拟机从故障硬件迁移到健康的物理计算机。实时迁移是一项 VM 保留操作只能短时间暂停虚拟机。将会保留内存、打开的文件以及网络连接但事件前后的性能可能会降低。在无法使用实时迁移的情况下VM 会出现意外停机如下所述。
2.意外停机很少发生在虚拟机所在硬件或物理基础结构出现某类故障的情况。 此类故障可能包括:本地网络故障、本地磁盘故障、或者其他机架级别的故障。 检测到此类故障时虚拟机平台会自动将虚拟机迁移到同一数据中心内的正常物理机(进行修复)。在修复过程中虚拟机会经历停机(重启)在某些情况下会丢失临时驱动器始终会保留附加的 OS 和数据磁盘。
在发生会影响整个数据中心甚至整个区域的服务中断或灾难时(这种情况很少见)虚拟机也可能会停机。针对这种情况会提供了保护选项包括可用性区域和配对区域。
3.计划内维护事件是指由 21Vianet 对底层 Azure平台进行定期更新以改进虚拟机运行时所在的平台基础结构的总体可靠性、性能和安全性。大多数此类更新在执行时不会影响虚拟机或云服务。虽然虚拟机平台会尝试在所有可能的情况下都使用 VM 保留维护,但在罕见情况下这些更新需要重启虚拟机否则无法将所需更新应用到底层基础结构。在这种情况下可以在合适的时间窗口为 VM 启动维护通过“维护-重新部署”操作来执行虚拟机计划内维护。