什么是运行状况建模?
若要确定环境是否按预期工作,必须监视应用程序的运行状况及其 Azure 资源的关键指标。 运行状况建模是一项设计练习,用于增强原始数据日志和指标,满足关键业务要求。 目标是量化应用程序运行状况并推动运行状况的自动评估。
运行状况建模的优点
若要评估工作负载的总体运行状况,需要全面了解所有指标。 还需要快速识别和解决可靠性问题。
运行状况建模侧重于彻底的检测和监视,但它还会添加一个上下文层,以提供对应用程序的运行状况的关键见解。 设计良好的运行状况模型应清楚地指示工作负载的总体运行状况,而不是原始数据指标。
任务关键型应用程序由于其复杂性,预计会生成大量运营数据。 可能难以评估应用程序的运行状况并找出解决已识别问题的正确操作。
运行状况模型使用设置指示器来表示运行状况,从而直观地了解并快速响应可能出现的任何问题。 运行状况通常通过使用“红绿灯”指示器(如绿色、黄色和红色)来表示。 可以跟踪应用程序运行状况分数,以快速找到服务降级的根本原因。
如何入门
若要进行运行状况建模练习,必须深入了解系统及其预期性能。 建议使用分层模型,以在粒度级别反映应用程序的整体运行状况。 这些层表示包含应用程序及其依赖项的分层工作负载结构。
- 在顶层,运行状况表示应用程序中的用户交互或流。 考虑关键路径上的流和不在关键路径上的流。
- 在较低层,必须定义各个应用程序组件的运行状况,同时牢记关键的非功能性要求。 映射功能组件和逻辑组件之间的依赖关系。 此外,映射应用程序组件使用的 Azure 资源之间的依赖关系。
- 在基础层,运行状况表示应用程序使用的 Azure 资源。
对运行状况建模的过程是一项自上而下的设计活动,首先定义所有用户流、映射依赖关系以及将运行状况状态量化到流。
下面是该方法的建议步骤:
- 量化每个组件的运行状况状态,使每个组件指示运行状况分数。 运行状况分数可以是考虑到关键业务要求的各种性能指标的聚合。
- 通过组合各个组件的运行状况分数来量化每个流的运行状况,以指示流的运行状况。 考虑非功能性要求,以根据关键性设置上下文。
- 根据业务关键性,在所有层应用适当的权重,以构建对总体运行状况的有意义的定义。 例如,在顶层,财务上重要的流和面向客户的用户流比其他流更重要。
此图显示了上述方法的示例结果。 运行状况模型使用这些分层运行状况定义来告知所有系统组件的关键监视指标,并验证操作子系统组合。
在下一练习中,我们将大致流程应用于示例并生成分层运行状况模型。
有关分层运行状况模型的详细信息,请参阅分层应用程序运行状况。 另请参阅分层运行状况模型的示例。