关于高可用性(旧版)

重要

Defender for IoT 现在建议使用 Microsoft 云服务或现有 IT 基础结构进行集中监视和传感器管理,计划于 2025 年 1 月 1 日 停用本地管理控制台

有关详细信息,请参阅 部署混合或物理隔离的 OT 传感器管理

通过在本地管理控制台上配置 高可用性,提高 Microsoft Defender for IoT 部署的弹性能力。 高可用性部署可确保托管传感器持续向活动的本地管理控制台报告。

此部署是使用包含主要设备和辅助设备的本地管理控制台对实现的。

注释

本文档中,主体本地管理控制台称为主要管理控制台,代理称为辅助服务器。

先决条件

在执行本文中的过程之前,请验证是否满足以下先决条件:

  • 请确保在主设备和辅助设备上都安装了一个 本地管理控制台

    • 主要和辅助本地管理控制台设备必须运行相同的硬件模型和软件版本。
    • 必须作为 特权用户访问主要和辅助本地管理控制台,以便运行 CLI 命令。 有关详细信息,请参阅 用于 OT 监视的本地用户和角色
  • 确保主本地管理控制台已完全 配置,包括至少两个 已连接的 OT 网络传感器,并在控制台 UI 中可见,以及计划的备份或 VLAN 设置。 配对后,所有设置都会自动应用于辅助设备。

  • 确保 SSL/TLS 证书符合所需的条件。 有关详细信息,请参阅 本地资源的 SSL/TLS 证书要求

  • 确保在主要和辅助本地管理控制台上,组织安全策略授予你对以下服务的访问权限。 这些服务还允许传感器与辅助本地管理控制台之间的连接:

    港口 服务 说明
    443 或 TCP HTTPS 授予对本地管理控制台 Web 控制台的访问权限。
    22 或 TCP SSH 同步主要和辅助本地管理控制台设备之间的数据
    123 或 UDP NTP (网络时间协议) 本地管理控制台的 NTP 时间同步。验证主动和被动设备是否使用同一时区定义。

创建主对和辅助对

重要

仅在指示的位置运行 sudo 命令。 如果未指示,请不要使用 sudo 运行。

  1. 请给主要和次要本地管理控制台设备通电。

  2. 在次要设备上,使用以下步骤将连接字符串复制到剪贴板:

    1. 登录到辅助本地管理控制台,然后选择 系统设置

    2. 传感器设置 - 连接字符串 区域中,在 复制连接字符串下,选择 按钮以查看完整的连接字符串。

    3. 连接字符串由 IP 地址和令牌组成。 IP 地址位于冒号之前,令牌位于冒号之后。 单独复制 IP 地址和令牌。 例如,如果您的连接字符串是 172.10.246.232:a2c4gv9de23f56n078a44e12gf2ce77f,请分别复制 IP 地址 172.10.246.232 和令牌 a2c4gv9de23f56n078a44e12gf2ce77f

      显示复制连接字符串的每个部分的屏幕截图,以在以下命令中使用。

  3. 在主设备上,使用以下步骤通过 CLI 将次设备连接到主设备:

    1. 通过 SSH 登录到主要本地管理控制台以访问 CLI,然后运行:

      sudo cyberx-management-trusted-hosts-add -ip <Secondary IP> -token <Secondary token>
      

      其中,<Secondary IP> 是辅助设备的 IP 地址,<Secondary token> 是连接字符串中冒号后的第二部分,这是您之前复制到剪贴板的。

      例如:

      sudo cyberx-management-trusted-hosts-add -ip 172.10.246.232 -token a2c4gv9de23f56n078a44e12gf2ce77f

      验证 IP 地址、将 SSL/TLS 证书下载到主设备,连接到主设备的所有传感器都连接到辅助设备。

    2. 在主要设备上应用更改。 运行:

      sudo cyberx-management-trusted-hosts-apply
      
    3. 验证是否已在主设备上正确安装证书。 运行:

      cyberx-management-trusted-hosts-list
      
  4. 允许主设备与辅助设备备份和还原过程之间的连接:

    • 主设备上运行:

      cyberx-management-deploy-ssh-key <secondary appliance IP address>
      
    • 辅助设备,通过 SSH 登录以访问 CLI,然后运行:

      cyberx-management-deploy-ssh-key <primary appliance IP address>
      
  5. 验证是否已在辅助设备上应用更改。 在次要设备上运行:

    cyberx-management-trusted-hosts-list
    

跟踪高可用性活动

可将核心应用程序日志导出到 Defender for IoT 支持团队,以处理任何高可用性问题。

访问核心日志

  1. 登录到本地管理控制台,然后选择“系统设置”>导出。 有关导出要发送到支持团队的日志的详细信息,请参阅 从本地管理控制台导出日志,以便排查问题。

为本地管理控制台更新以实现高可用性

若要更新已配置高可用性的本地管理控制台,需要:

  1. 断开主要设备和辅助设备的高可用性。
  2. 将设备更新到新版本。
  3. 将高可用性重新配置回到这两个设备上。

按以下顺序执行更新。 在开始新步骤之前,请确保每个步骤都已完成。

要更新配置了高可用性的本地管理控制台

  1. 断开主要设备和辅助设备的高可用性:

    在主节点

    1. 获取当前连接的设备的列表。 运行:

      cyberx-management-trusted-hosts-list
      
    2. 找到与辅助设备关联的域,并将其复制到剪贴板。 例如:

      显示与辅助设备关联的域的屏幕截图。

    3. 从受信任的主机列表中删除辅助域。 运行:

      sudo cyberx-management-trusted-hosts-remove -d [Secondary domain]
      
    4. 验证证书是否已正确安装。 运行:

      sudo cyberx-management-trusted-hosts-apply
      

    次要项上的

    1. 获取当前连接的设备的列表。 运行:

      cyberx-management-trusted-hosts-list
      
    2. 找到与主设备关联的域,并将其复制到剪贴板。

    3. 从受信任的主机列表中删除主域。 运行:

      sudo cyberx-management-trusted-hosts-remove -d [Primary domain]
      
    4. 验证证书是否已正确安装。 运行:

      sudo cyberx-management-trusted-hosts-apply
      
  2. 将主要设备和辅助设备更新为新版本。 有关详细信息,请参阅 更新本地管理控制台

  3. 在主要设备和辅助设备上再次设置高可用性。 有关详细信息,请参阅 创建主对和辅助对

故障转移过程

设置高可用性后,OT 传感器会自动连接到辅助本地管理控制台(如果无法连接到主主机)。 如果不到一半的 OT 传感器当前与辅助计算机通信,则主计算机和辅助计算机同时支持系统。 如果超过一半的 OT 传感器正在与辅助计算机通信,辅助计算机将接管所有 OT 传感器通信。 从主计算机故障转移到辅助计算机大约需要三分钟。

发生故障转移时,主要本地化管理控制台会冻结,您可以使用相同的登录凭据登录到次要管理控制台。

在故障转移期间,传感器将继续尝试与主设备通信。 当超过一半的托管传感器成功与主服务器通信时,将还原主服务器。 还原主服务器时,辅助控制台上会显示以下消息:

在主机恢复时出现在辅助控制台上的信息的屏幕截图。

重定向后重新登录到主设备。

处理过期的激活文件

只能在主本地管理控制台上更新激活文件。

在辅助计算机上激活文件过期之前,将其定义为主计算机,以便可以更新许可证。

有关详细信息,请参阅 上传新的激活文件

后续步骤

有关详细信息,请参阅 激活和设置本地管理控制台