Azure 中的全栈监视
你的组织正在将其所有系统从本地位置迁移到 Azure,并且希望你设计一个监视策略。 本单元介绍了全栈监视策略为何能够识别并缓解应用程序和基础结构的所有层级中的问题,从而改进客户体验。
使用全栈监视
全堆栈监视是监视、会审和诊断应用程序、基础结构和安全问题的整套方法。 全栈监视包括遥测数据收集、跟踪关键性能指标、隔离问题和分析根本原因。
你的应用程序和基础结构可能面临不同类型的潜在破坏性问题,例如响应速度慢、使用率不断变化、异常和安全风险。 你的响应必须适合问题类型。 你可以通过扩展容量来满足增加的负载,或者通过更改应用程序或基础架构来提高性能并减少错误。
使用正确的工具,你可以:
- 监视基础结构和应用程序性能。
- 监视安全风险和可疑活动。
- 在问题出现后立即收集有关问题的信息。
- 分析和响应你收集的信息。
通过使用全栈方法监视你的应用程序和基础结构,你可以快速并恰当地对更改和问题做出响应。 此策略可以帮助你的组织变得更高效、更安全、更具经济效益和竞争力。
监视应用程序
在开发应用程序的过程中监视应用程序的问题,以防止以后在生产中出现错误和异常。 为了改善你的开发生命周期,请确保代码只有在成功通过了必要检查后,才会被推送到开发周期的下一个阶段。
当应用程序上线并使用时,也要对其进行监视。 你可能会遇到失败的请求、服务器响应慢或可用性问题。 通过监视实时问题,可以及时识别这些类型的问题和风险,并有效地做出响应,使应用程序保持正常运行。
为了改善应用程序的运行状况并在将来构建更好的应用程序,请配置警报和自动响应来帮助你处理应用程序问题。
监视基础结构
不同类型的问题可能影响基础结构。 你可能需要处理性能问题或可能导致服务无法访问或整个基础结构不可用的问题。 其中任何一个问题都会影响工作效率、财务损失或损坏组织的名誉。
为了及时有效地处理出现的任何问题,你可以配置警报来监视基础架构中的各种问题。 例如,可以为以下方面配置警报:
- 基础结构的资源利用率。
- 基础结构的可用性和运行状况。
- 在操作系统级别发生的特定事件。
你可以配置警报来启动一个流程以通知某人或团队采取相应的操作。 还可以通过 playbook 和 Webhook 触发对警报的自动响应。
你还可以使用基础结构监视数据进行操作分析和容量规划。 你可以将从虚拟机 (VM) 来宾操作系统收集的性能数据制成图表,以进行比较和趋势分析,从而为决策制定提供信息。
监视 Azure 平台资源
除了监视已部署的应用程序和基础结构之外,你还可以使用 Azure 的内置功能来监视其他 Azure 平台资源。 Azure 资源(例如存储帐户、密钥保管库和 Azure Cosmos DB 数据库)都具有性能指标和资源日志,可以查看和分析它们来跟踪性能和可用性。
这些和其他 Azure 资源类型提供了专门的见解,可以跨订阅、资源组和其他资源提供预定义的监视体验。 下面的屏幕截图显示了 Azure Monitor 存储见解,其中显示了两个订阅的多个存储帐户的使用情况和延迟情况。
你还可以查看和收集 Azure 租户的 Active Directory 相关的日志,以及 Azure 订阅的服务运行状况和活动日志。 全栈监视解决方案包括应用程序和基础结构所依赖的 Azure 平台资源的可见性。
监视安全性
监视应用程序和基础结构的安全性,确保它们始终受到保护并可用,这一点也至关重要。 你应该监视数据外泄以及基础设施的任何安全风险,例如可疑用户帐户或恶意 IP 地址。 安全监视解决方案应包括强大的自动异常情况检测和事件管理能力,以将多个相关事件合并为一个可操作的警报。
总结
采用全栈方法监视应用程序和基础结构,可帮助你及时有效地响应问题。 你可以加强保护,并构建更优质的应用程序和基础结构。 全栈方法还有助于你获得态势感知,从影响环境的问题中吸取经验教训。