你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure NetApp 文件的指标

Azure NetApp 文件提供有关已分配的存储、实际存储使用情况、卷、IOPS 和延迟的指标。 通过分析这些指标,可以更好地了解 NetApp 帐户的使用模式和卷性能。

定义

了解与 Azure NetApp 文件中的性能和容量相关的术语对于理解可用指标至关重要:

  • 容量池:容量池是 Azure NetApp 文件中容量的计费方式。 容量池包含卷。
  • 卷配额:预配到 Azure NetApp 文件卷的容量。 卷配额与自动服务质量 (QoS) 直接相关,会影响卷性能。 有关详细信息,请参阅容量池的 QoS 类型
  • 吞吐量:Azure NetApp 文件和客户端之间通过线路传输的数据量(读取/写入/其他)。 Azure NetApp 文件中的吞吐量以每秒字节数为单位。
  • 延迟:延迟是指存储操作在存储内完成的时间量,即从到达存储到处理完毕并准备发送回客户端的时间量。 Azure NetApp 文件的延迟以毫秒 (ms) 为单位。

关于存储性能操作指标

Azure NetApp 文件中的操作定义为在客户端/服务器对话期间发生的操作。 例如,当客户端请求从 Azure NetApp 文件读取文件时,客户端和服务器之间会发送和接收读取操作和其他操作。

在监视 Azure NetApp 文件卷时,读取和写入操作不言自明。 指标中还包括一个名为“其他 IOPS”的指标,指任何非读取或写入的操作。 “其他 IOPS”包括元数据等操作,与大多数读取和写入操作同时存在

以下类型的元数据操作包含在“其他 IOPS”指标中

NFSv3

NFSv3 元数据调用包含在“其他 IOPS”中,如 RFC-1813 所述:

  • 过程 0:NULL - 不执行任何操作
  • 过程 1:GETATTR - 获取文件特性
  • 过程 2:SETATTR - 设置文件特性
  • 过程 3:LOOKUP - 查找文件名
  • 过程 4:ACCESS - 检查访问权限
  • 过程 5:READLINK - 从符号链接读取
  • 过程 8:CREATE - 创建文件
  • 过程 9:MKDIR - 创建目录
  • 过程 10:SYMLINK - 创建符号链接
  • 过程 11:MKNOD - 创建特殊设备
  • 过程 12:REMOVE - 删除文件
  • 过程 13:RMDIR - 删除目录
  • 过程 14:RENAME - 重命名文件或目录
  • 过程 15:LINK - 创建对象链接
  • 过程 16:READDIR - 从目录中读取
  • 过程 17:READDIRPLUS - 从目录中扩展读取
  • 过程 18:FSSTAT - 获取动态文件系统信息
  • 过程 19:FSINFO - 获取静态文件系统信息
  • 过程 20:PATHCONF - 检索 POSIX 信息
  • 过程 21:COMMIT - 将服务器上的缓存数据提交到稳定的存储

NFSv4.1

NFSv4.1 元数据调用包含在“其他 IOPS”中,如 RFC-7530 所述:

  • 过程 0:NULL - 不执行任何操作
  • 过程 1:COMPOUND - 将多个 NFS 操作合并为单个请求
  • 操作 3:ACCESS - 检查访问权限
  • 操作 4:CLOSE – 关闭文件
  • 操作 5:COMMIT – 提交缓存的数据
  • 操作 6:CREATE - 创建非常规文件对象
  • 操作 7:DELEGPURGE - 清除等待恢复的委派
  • 操作 8:DELEGRETURN - 返回委派
  • 操作 9:GETATTR - 获取特性
  • 操作 10:GETFH - 获取当前文件句柄
  • 操作 11:LINK - 创建文件链接
  • 操作 12:LOCK - 创建锁
  • 操作 13:LOCKT - 对锁进行测试
  • 操作 14:LOCKU - 解锁文件
  • 操作 15:LOOKUP - 查找文件名
  • 操作 16:LOOKUPP - 查找父目录
  • 操作 17:NVERIFY - 验证特性的差异
  • 操作 18:OPEN - 打开常规文件
  • 操作 19:OPENATTR - 打开命名特性目录
  • 操作 20:OPEN_CONFIRM - 确认打开
  • 操作 21:OPEN_DOWNGRADE - 减少对打开文件的访问
  • 操作 22:PUTFH - 设置当前文件句柄
  • 操作 23:PUTPUBFH - 设置公共文件句柄
  • 操作 24:PUTROOTFH - 设置根文件句柄
  • 操作 26:READDIR - 读取目录
  • 操作 27:READLINK - 读取符号链接
  • 操作 28:REMOVE - 删除文件系统对象
  • 操作 29:RENAME - 重命名目录条目
  • 操作 30:RENEW - 续订租用
  • 操作 32:SAVEFH - 保存当前文件句柄
  • 操作 33:SECINFO - 获取可用安全性
  • 操作 34:SETATTR - 设置特性
  • 操作 35:SETCLIENTID - 协商客户端 ID
  • 操作 36:SETCLIENTID_CONFIRM - 确认客户端 ID
  • 操作 37:VERIFY - 验证相同的特性
  • 操作 39:RELEASE_LOCKOWNER – 释放锁定所有者状态

SMB(包括 SMB2 和 SMB3.x)

包含在“其他 IOPS”中的 SMB 命令,其操作码值为:

SMB 命令 操作码值
SMB2 NEGOTIATE 0x0000
SMB2 SESSION_SETUP 0x0001
SMB2 LOGOFF 0x0002
SMB2 TREE_CONNECT 0x0003
SMB2 TREE_DISCONNECT 0x0004
SMB2 CREATE 0x0005
SMB2 CLOSE 0x0006
SMB2 FLUSH 0x0007
SMB2 LOCK 0x000A
SMB2 IOCTL 0x000B
SMB2 CANCEL 0x000C
SMB2 ECHO 0x000D
SMB2 QUERY_DIRECTORY 0x000E
SMB2 CHANGE_NOTIFY 0x000F
SMB2 QUERY_INFO 0x0010
SMB2 SET_INFO  0x0011
SMB2 OPLOCK_BREAK  0x0012

访问指标的方法

Azure NetApp 文件指标本机集成到 Azure Monitor 中。 在 Azure 门户中,可以从两个位置查找 Azure NetApp 文件容量池和卷的指标:

  • 在 Azure Monitor 中,选择“指标”,然后选择容量池或卷。 然后选择“指标”以查看可用指标

    屏幕截图显示了如何访问容量池或卷的 Azure NetApp 文件指标。

  • 在 Azure NetApp 文件容量池或卷中,选择“指标”。 然后选择“指标”以查看可用指标

    显示如何导航到“指标”下拉菜单的快照。

容量池的使用情况指标

  • 池分配大小
    池的预配大小。

  • 分配到卷的池的大小
    给定容量池中的卷配额总和 (GiB)(即,容量池中卷的预配大小的总和)。
    这是创建卷期间选择的大小。

  • 池消耗大小
    容量池中各个卷已使用的逻辑空间 (GiB) 的总和。

  • 池的总快照大小
    池中所有卷的快照大小总和。

卷的使用情况指标

  • 卷已使用大小的百分比
    已用卷(包括快照)的百分比。
    卷已用大小的百分比不支持聚合指标(例如最小值、最大值)。

  • 卷分配大小
    卷的预配大小

  • 卷配额大小
    为卷预配的配额大小 (GiB)。

  • 卷消耗大小
    卷的逻辑大小(所用字节数)。
    此大小包括活动文件系统和快照使用的逻辑空间。

  • 卷快照大小
    一个卷中全部快照的大小。

  • 已达到吞吐量限制

    已达到吞吐量限制是一个布尔指标,表示卷命中其 QoS 限制。 值 1 表示卷已达到其最大吞吐量,并且此卷的吞吐量将受到限制。 值 0 表示尚未达到此限制。

    注意

    已达到吞吐量限制指标每 5 分钟收集一次,如果在过去 5 分钟内收集了该指标,则会显示为命中。

    如果卷命中吞吐量限制,则不会根据应用程序的需求相应调整其大小。 解决吞吐量问题:

    • 调整卷大小:

      增大加密卷大小,为加密卷分配更多吞吐量,使其不被节流。

    • 修改服务级别:

      Azure NetApp 文件的高级和超高级服务级别可满足吞吐量要求较高的工作负载。 将卷移动到更高服务级别的容量池会自动增加卷的这些限制。

    • 改变工作量/应用:

      考虑重新利用加密卷,并委派规模更大和/或服务级别更高的不同加密卷,以满足你的应用要求。 如果是 NFS 卷,可考虑更改挂载选项,以减少数据流(如果你的应用支持这些更改)。

    显示 Azure NetApp 文件指标的屏幕截图,其中的折线图显示已达到吞吐量限制。

卷的性能指标

注意

“平均读取延迟”和“平均写入延迟”的卷延迟在存储服务中测量,不包括网络延迟。

  • 平均读取延迟
    从卷进行读取的平均往返时间(RTT,以毫秒为单位)。
  • 平均写入延迟
    从卷进行写入的平均往返时间(RTT,以毫秒为单位)。
  • 读取 IOPS
    每秒对卷进行的读取操作次数。
  • 写 IOPS
    每秒对卷进行的写入操作次数。
  • 其他 IOPS 每秒对卷进行的其他操作次数。
  • 总 IOPS 每秒对卷的写入、读取和其他操作的总和。

卷复制指标

注意

  • 网络传输大小(例如,“卷复制总传输”指标)可能不同于跨区域复制的源或目标卷。 此行为是由于使用有效的复制引擎来最大程度地减少网络传输成本而导致的。
  • 目前是为复制目标卷填充卷复制指标,而不是为复制关系的源填充。
  • 卷复制状态是否正常
    复制关系的状况。 正常状态表示为 1。 不正常状态表示为 0

  • 卷复制是否正在传输
    卷复制的状态是否为“正在传输”。

  • 卷复制延隔时间
    延隔时间是复制滞后于源的实际时间量。 它指示目标卷中的复制数据相对于源卷的年限。

注意

评估卷复制的运行状况时,请考虑卷复制延隔时间。 如果延隔时间大于复制计划,则复制卷将无法赶上源。 若要解决此问题,请调整复制速度或复制计划。

  • 卷复制上次传输持续时间
    上次传输完成所用的时间(秒)。

  • 卷复制上次传输大小
    作为上次传输的一部分传输的总字节数。

  • 卷复制进度
    当前传输操作传输的总数据量。

  • 卷复制总传输字节
    为关系传输的累计字节数。

容量池的吞吐量指标

  • 池分配的吞吐量
    属于该池的所有卷的总吞吐量。

  • 池的预配吞吐量
    此池的预配吞吐量。

卷的吞吐量指标

  • 读取吞吐量
    读取吞吐量(以字节/秒为单位)。

  • 总吞吐量
    所有吞吐量的总和(以字节/秒为单位)。

  • 写入吞吐量
    写入吞吐量(以字节/秒为单位)。

  • 其他吞吐量
    未读取或写入的其他吞吐量(以字节/秒为单位)。

  • 总吞吐量 每秒所有吞吐量(读取、写入和其他操作)的总和,以字节为单位。

卷备份指标

  • 卷备份是否已启用
    显示是否对卷启用了备份。 已启用 10 表示禁用该作业。

  • 卷备份操作是否已完成
    显示最后一个卷备份或还原操作是否成功完成。 1 表示成功。 0 表示未成功。

  • 卷备份是否已暂停
    显示卷的备份策略是否已暂停。 1 表示未暂停。 0 表示已暂停。

  • 卷备份字节数
    为此卷备份的总字节数。

  • 卷备份上次传输的字节数
    上次备份或还原操作传输的总字节数。

  • 卷备份操作上次传输字节数
    上次备份操作传输的总字节数。

  • 卷备份还原操作上次传输字节数
    上次备份还原操作传输的总字节数。

冷访问指标

  • 卷冷层大小
    冷层的卷占用情况。

  • 卷冷层数据读取大小
    每卷使用 GET 读取的数据。

  • 卷冷层数据写入大小
    每卷使用 PUT 分层的数据。

后续步骤