你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure 上 Citrix 的管理基线注意事项
管理和监视对于 Azure 上 Citrix DaaS(桌面即服务)的任何部署都至关重要。 若要实现卓越运营和成功,应在考虑管理和监视的情况下正确设计 Citrix DaaS 环境。
Citrix 设计注意事项
Microsoft 和 Citrix 都提供一组用于监视环境的核心工具和服务。 本文列出了一些工具,并建议监视哪些工具。
Microsoft 工具和服务包括 Azure Monitor、Azure 顾问、Azure 服务运行状况、Microsoft Sentinel 和 Azure 网络观察程序。 Citrix 工具和服务包括 Citrix Monitor、Citrix Analytics 和 Citrix 托管服务。 这些服务中的大多数都包含在订阅中,但有些费用会额外。
有关用于 Citrix DaaS 的 Microsoft 工具的信息,请访问 Citrix Tech Zone。 有关 Citrix 工具的详细信息,请参阅 适用于 Azure 的 Citrix DaaS 和 Citrix 应用程序交付管理。
Citrix 设计建议
指标和警报阈值
对于 Citrix 部署,请专注于 Citrix 虚拟机的来宾 OS 指标。 服务器性能指标不佳通常表示用户即将遇到性能问题,或者他们已拥有。 例如,当用户会话的最大输入延迟达到预定义值时,我们知道用户遇到延迟。 可以将操作组配置为向 Citrix 管理员发送电子邮件,以提醒他们出现问题,以便他们可以主动干预。
本文介绍了要监视的性能计数器,并建议适用于 Citrix 部署的警报阈值。 建议的警报阈值可能会提前通知性能问题。 调整值和时间段以满足你的需求。
所有 Citrix 服务器
下面是用于监视部署中所有 Citrix 服务器的 perfmon 计数器列表:
- 处理器%处理器时间
- 此计数器是处理器处于活动状态的时间量。
- 当平均值在 15 分钟内大于 80% 时发出警报。
- 使用任务管理器或 Citrix Monitor 来确定哪些进程消耗了最多的 CPU。 确定 CPU 使用率过高的原因。
- 如果所有进程都消耗了预期的 CPU 时间级别,则需要增加服务器或传递组的容量。
- 系统\处理器队列长度
- 此计数器是等待处理的处理器队列中的线程数。
- 当计数器在 5 分钟间隔内内核数大于 5 倍时发出警报。
- 使用任务管理器或 Citrix Monitor 来确定哪些进程消耗了最多的 CPU。
- 如果所有进程都消耗了预期的 CPU 级别,则是时候增加服务器或传递组的容量了。
- 内存\可用字节数
- 此计数器是未分配给进程或缓存的内存量。
- 当可用 RAM 量低于 5 分钟总 RAM 的 20% 时发出警报。
- 使用任务管理器或 Citrix Monitor 来确定哪些进程消耗了最多的 RAM。 确定任何可能降低 RAM 消耗级别的配置更改。 将此指标与内存页数/秒和分页文件 %usage 计数器一起使用。
- 如果所有进程都消耗了预期的内存量,则是时候增加服务器或传递组的容量了。
- Memory\Pages/sec
- 此计数器是每秒从磁盘交换到 RAM 的页数。
- 当每秒页面始终超过 10 时发出警报。
- 使用任务管理器查找导致页面交换的应用程序。 调查可能的替代配置。 将此指标与内存可用字节数和分页文件%使用情况计数器一起使用。
- 如果可能,请增加主机可用的 RAM 量。 如果这不是一个选项,请尝试将应用程序隔离到一组专用服务器。
- 分页文件%使用情况
- 此计数器是正在使用的当前页文件的百分比。
- 当页面文件使用情况在 60 分钟内大于 80% 时发出警报。
- 使用任务管理器查找导致页面文件使用的应用程序。 调查可能的替代配置。 将此指标用于内存可用字节数和内存页/秒计数器。
- 如果可能,请增加主机可用的 RAM 量。
- LogicalDisk%Disk Time (_total)
- 此计数器表示逻辑磁盘处于活动状态的时间量。
- 当 15 分钟内的磁盘时间百分比大于 90% 时发出警报。
- 使用任务管理器或 Citrix Monitor 查找导致磁盘使用率较高的应用程序。 调查可能导致磁盘使用率过高的原因。 将此指标与其他逻辑和物理磁盘指标配合使用。
- 如果所有活动看起来正常,请查找将应用程序移动到具有更高性能磁盘子系统的磁盘的方法。
- LogicalDisk\Current disk queue length
- 此计数器表示等待逻辑磁盘处理请求的事务数。
- 当当前磁盘队列大于 3 15 分钟时发出警报。
- 使用任务管理器或 Citrix Monitor 查找导致磁盘使用率较高的应用程序。 调查可能导致磁盘使用率过高的原因。 将此指标与其他逻辑和物理磁盘指标配合使用。
- 如果所有活动看起来正常,请查找将应用程序移动到具有更高性能磁盘子系统的磁盘的方法。
- PhysicalDisk%Disk Time (_total)
- 此计数器表示物理磁盘处于活动状态的时间量。
- 当 15 分钟内的磁盘时间百分比大于 90% 时发出警报。
- 使用任务管理器或 Citrix Monitor 查找导致磁盘使用率较高的应用程序。 调查可能导致磁盘使用率过高的原因。 将此指标与其他逻辑和物理磁盘指标配合使用。
- 如果所有活动看起来正常,请查找将应用程序移动到具有更高性能磁盘子系统的磁盘的方法。
- PhysicalDisk\Current 磁盘队列长度
- 此计数器表示等待物理磁盘处理其磁盘请求的事务数。
- 当当前磁盘队列大于 3 15 分钟时发出警报。
- 使用任务管理器或 Citrix Monitor 查找导致磁盘使用率较高的应用程序。 调查可能导致磁盘使用率过高的原因。 将此指标与其他逻辑和物理磁盘指标配合使用。
- 如果所有活动看起来正常,请查找将应用程序移动到具有更高性能磁盘子系统的磁盘的方法。
- 网络接口\字节总数/秒
- 此计数器显示网络适配器正在处理网络的数据包的速率。
- 当每秒字节总数大于 5 分钟 NIC 容量的 80% 时发出警报。
- 使用任务管理器查找导致网络使用率较高的应用程序。 尝试确定可能导致网络利用率过高的原因。 将此指标与其他逻辑和物理网络指标配合使用。
- 如果所有活动看起来正常,请寻找一种方法来增加网络带宽或增加传送组的容量。
- 每个会话的用户输入延迟\最大输入延迟
- 此指标提供会话的最大输入延迟(以毫秒为单位)。 该指标测量用户提供鼠标或键盘输入的时间,直到系统处理输入为止。
- 当会话的输入延迟超过 1000 毫秒 2 分钟时发出警报。
- 使用任务管理器或 Citrix Monitor 查找导致 CPU、磁盘或网络使用率较高的应用程序。
- 如果活动看起来正常,最佳方法是将容量增加到交付组。
有关使用 Citrix 组件的更多建议,请参阅: Azure 的基线指标和警报。
一般建议
下面是使用这些工具时要考虑的一些常规建议和做法。
- 从 Azure Monitor 更轻松地跟踪虚拟机的性能监视器指标和网络。 Azure Monitor 指标比 Citrix Monitor 提供的指标更精细。 将 Azure Monitor 用于性能指标,以更好地控制收集的指标。
- 将监视数据保留期设置为尽可能短的时间,以满足业务需求。 大多数监视数据仅在短时间内有用。 通过长期存储监视数据来节省成本。 创建自动化作业以清理存储帐户中的过时数据。
- Azure 包括指标、日志、服务中断、计划内维护、每月成本和安全性的警报。 使用警报可以节省生命。 本文提供有关为 Citrix 部署创建的警报的许多建议。 实现环境中最有意义的实现。 通过短信和电子邮件发送关键警报,以确保它们能够快速执行。 在每个季度设置日历上的提醒以更新警报通知列表。
- 对指标的监视和警报附带每月成本。 明智地选择要跟踪的指标。如果不打算在触发警报时采取措施,请考虑指标是否具有值。
- 为 Citrix 资源组设置自定义仪表板,并启用指向关键服务(如 Microsoft Sentinel、服务运行状况、流量分析和顾问)的链接。 在仪表板中,包括显示 ExpressRoute 或 VPN 连接性能、云连接器和 Citrix VDA 主机的性能的图表。 若要保护敏感信息,请限制仪表板仅访问需要这些信息的人员。
- 排查问题时,请查看多个数据源,以帮助将症状与根本原因相关联。 例如,如果平均登录持续时间较高,可以查看 Azure 中的指标以确定资源约束是否存在。
- 启用流量分析和 NSG 日志是查看流量是否源自意外位置的最佳方式。 可以使用此信息简化网络通信。 使用此信息创建阻止来自这些意外位置的入站流量的 Azure 策略。
后续步骤
查看特定于 Azure 上 Citrix 部署的安全与合规性的关键设计注意事项和建议。