CloudSimple 维护和更新

私有云环境设计为没有单一故障点。

  • ESXi 群集配置了 vSphere 高可用性(HA)。 群集的大小设置为至少有一个备用节点,以便复原。
  • 冗余主存储由 vSAN 提供,这至少需要三个节点才能针对单个故障提供保护。 vSAN 可配置为更大的群集提供更高的复原能力。
  • vCenter、PSC 和 NSX Manager VM 配置了 RAID-10 存储,以防止存储故障。 VM 受 vSphere HA 的节点/网络故障保护。
  • ESXi 主机具有冗余的风扇和 NIC。
  • TOR 和汇聚交换机以 HA 对的形式配置,以提供冗余能力。

CloudSimple 持续监视以下 VM 的运行时间和可用性,并提供可用性 SLA:

  • ESXi 主机
  • vCenter
  • PSC
  • NSX 管理器

CloudSimple 还会持续监视以下故障:

  • 硬盘
  • 物理 NIC 端口
  • 服务器
  • 球迷
  • 力量
  • 开关
  • 交换机端口

如果磁盘或节点发生故障,则新节点会自动添加到受影响的 VMware 群集,使其立即恢复运行状况。

CloudSimple 在私有云中备份、维护和更新这些 VMware 元素:

  • ESXi
  • vCenter 平台服务
  • 控制器
  • vSAN
  • NSX

备份和恢复

CloudSimple 备份包括:

  • vCenter、PSC 和 DVS 规则的夜间增量备份。
  • 用于在应用层备份组件的 vCenter 原生 API。
  • 在更新或升级 VMware 管理软件之前自动备份。
  • 在将数据通过 TLS1.2 加密通道传输到 Azure 之前,源上的 vCenter 数据加密。 数据存储在跨区域复制的 Azure Blob 中。

可以通过打开 支持请求来请求还原。

维护

CloudSimple 执行多种类型的计划内维护。

后端/内部维护

此维护通常涉及重新配置物理资产或安装软件修补程序。 它不会影响所服务资产的正常消耗。 由于冗余 NIC 将转到每个物理机架,正常的网络流量和私有云作不会受到影响。 只有在组织希望在维护间隔内使用完整冗余带宽时,才会注意到性能影响。

CloudSimple 门户维护

更新 CloudSimple 控制平面或基础结构时,需要一些有限的服务停机时间。 目前,维护间隔可以每月一次。 频率预计会随着时间的推移而下降。 CloudSimple 通过提供通知来进行门户维护,并尽可能缩短间隔时间。 在门户维护间隔期间,以下服务将继续正常运行,没有任何影响:

  • VMware 管理平台和应用程序
  • vCenter 访问权限
  • 所有网络和存储
  • 所有 Azure 流量

VMware 基础结构维护

有时,有必要更改 VMware 基础结构的配置。 目前,这些间隔可能每隔 1-2 个月发生一次,但频率预计会随时间推移而下降。 这种维护通常无需中断 CloudSimple 服务的正常使用即可完成。 在 VMware 维护间隔期间,以下服务将继续正常运行,没有任何影响:

  • VMware 管理平台和应用程序
  • vCenter 访问权限
  • 所有网络和存储
  • 所有 Azure 流量

更新和升级

CloudSimple 负责私有云中 VMware 软件(ESXi、vCenter、PSC 和 NSX)的生命周期管理。

软件更新包括:

  • 修补程序。 VMware 发布的安全修补程序或 bug 修复。
  • 更新。 VMware 堆栈组件的次要版本更改。
  • 升级。 VMware 堆栈组件的主要版本更改。

CloudSimple 在 VMware 发布关键安全修补程序后会立即开始测试。

在部署下一个计划更新之前,将实施记录的 VMware 解决方法,而不是安装相应的修补程序。

后续步骤

使用 Veeam 备份工作负荷 VM