使用深入解析監視 VM 和容器
您的組織已將數個應用程式從內部部署移轉到 Azure 虛擬機器 (VM) 和 Azure Kubernetes Services (AKS)。 現在已跨數個 Azure 訂用帳戶部署數百個 Azure 資源。
您必須追蹤資源使用量,以確保佈建的雲端資源足夠,且其效能符合商務需求。 您需要一個監視方法,以提供廣泛可見度,以及快速分類和隔離問題的功能。
本單元說明如何針對您的所有 VM 和容器資源的大規模監視檢視使用 Azure 監視器深入解析和其他工具。 您也會了解如何鑽研特定節點和容器以進行疑難排解。
Azure 監視器深入解析
您可以使用 Azure 監視器深入解析來大規模監視資源使用率和效能,並使用引導式疑難排解來分級和隔離問題。 本單元著重於 VM 深入解析和容器深入解析,但有其他 Azure 資源的深入解析,包括網路、儲存體帳戶和 Azure Cosmos DB 資料庫。 如需可用深入解析的完整清單,請選取 Azure 監視器左側導覽中的 [深入解析中樞]。
Azure 監視器 VM 深入解析
VM 深入解析是一項 Azure 監視器功能,可藉由收集一組常用的計量並將其傳送至 Log Analytics 工作區,協助您開始監視 VM 用戶端。 Azure 監視器 VM 深入解析的用途包括:
- 檢視您 VM 的健康情況和效能。
- 大規模監視多個訂用帳戶和資源群組中的 VM。
- 取得顯示 VM 和虛擬機器擴展集處理序和網路連線詳細資料的拓撲檢視。
若要啟用 Azure 監視器 VM 深入解析,請從 Azure 監視器左側導覽中選取 [虛擬機器],然後在 [開始使用] 索引標籤上選取 [設定深入解析]。在 [概觀] 索引標籤的 [未受監視] 區段中,選取要監視的 VM 和虛擬機器擴展集,然後選取 [啟用]。
啟用 VM 深入解析會將延伸模組和設定新增至您的 VM 和虛擬機器擴展集,以收集、儲存及顯示預先決定的一組使用量和效能度量。
大規模監視您的 VM
啟用之後,VM 深入解析會監視 VM 和虛擬機器擴展集使用量和效能。 選取 VM 深入解析 [效能] 索引標籤,以查看顯示 VM 資源使用量的前 N 個圖表和前 N 個清單。
這些圖表可讓您快速找出極端值和作用點,其中配置的資源可能不足以支援現有負載。 從前 N 個清單,您可以選取 VM 以存取更多詳細資料,例如其屬性、其他活頁簿的連結、收集的記錄和警示。
您可以從 [記錄事件] 下顯示的清單選取事件類型,向下切入至 Azure 監視器記錄。 相關的 Log Analytics 工作區隨即開啟,出現適當的資料表並套用篩選。
Azure 監視器 VM 深入解析 [對應] 索引標籤會顯示整個資源群組、虛擬機器擴展集或個別 VM 的網路連線。 使用檢視頂端的篩選,選取感興趣的資源。
您可以展開完整清單的處理序數目,並檢視每個處理序的網路連線。 選取代表連線的箭號,以取得網路使用量和效能詳細資料。
Azure 監視器容器見解
容器深入解析是 Azure 監視器的功能,可監視部署至 Azure 的容器工作負載的效能和健康情況,包括 AKS。 容器深入解析會從控制器、節點和容器收集記憶體和處理器計量,並收集容器記錄。 您可以使用 Azure 監視器容器深入解析來:
- 大規模檢視多個訂用帳戶和資源群組中的 Kubernetes 工作負載健康情況和效能。
- 從控制器、節點和容器檢視記憶體和處理器效能計量。
- 檢視並儲存容器記錄,以進行即時和歷程記錄分析。
您可以在建立 AKS 叢集時啟用 Azure 監視器容器深入解析,或在 Azure 監視器左側導覽中選取 [容器],然後選取 [未受監視的叢集] 索引標籤。
大規模監視 Kubernetes 叢集
啟用容器深入解析之後,您可以在容器深入解析頁面上,依叢集、節點、控制器或容器檢視 Kubernetes 工作負載的效能和資源使用率。 例如,您可以:
- 調查使用量過高的節點。
- 依控制器檢視 Pod 的狀態。
- 查看特定容器的重新啟動次數和 CPU 或記憶體使用率。
[受監視的叢集] 索引標籤會顯示您的所有叢集、節點、系統 Pod 和使用者 Pod 的健康情況和狀態的大規模檢視。 您可以依命名空間篩選此檢視,並將其當做起點來鑽研問題區域。 您也可以使用容器深入解析來存取記錄,並啟用建議的警示。
適用於 Prometheus 的 Azure 監視器受管理服務
Prometheus 是專為容器和微服務設計的開放原始碼監視系統。 Prometheus 著重於分散式應用程式,使其成為監視 Kubernetes、分散式服務和容器化微服務的熱門工具。
Azure 監視器適用於 Prometheus 的受管理服務是 Azure 監視器計量的元件,其支援開放原始碼查詢和視覺效果工具,例如 PromQL 和 Grafana。 Azure 監視器適用於 Prometheus 的受管理服務可以從 AKS 或從任何使用遠端寫入執行自我管理 Prometheus 的 Kubernetes 叢集收集資料。 若要啟用Azure 監視器適用於 Prometheus 的受管理服務,您會建立 Azure 監視器工作區來儲存 Prometheus 計量。
與 Azure 受控 Grafana 整合
Grafana 是開放原始碼視覺效果和儀表板平台,是視覺化 Prometheus 計量的主要方法。 您可以將 Azure 監視器工作區連線到 Grafana 工作區,以使用 Prometheus 計量資料作為 Grafana 儀表板中的資料來源。
Azure 受控 Grafana 是完全受控的 Grafana 實作,可提供多個預先定義的 Grafana 儀表板來監視 Kubernetes 並執行完整堆疊疑難排解。 您可以匯入使用 Prometheus 計量的預先建置 Grafana 儀表板,也可以建立自訂儀表板。 下列螢幕擷取畫面顯示使用 AKS 監視資料的 Azure 受控 Grafana 儀表板。
Azure 監視器警示
某些類型的 Azure 監視器深入解析包含建議的警示範本,但您也可以指定條件來觸發特定環境中的警示。 您可以設定警示規則來監視基礎結構的效能和可用性,並使用警示規則和動作規則來決定如何處理警示。
您可以根據 Azure 監視器警示來填入深入解析的相同計量或記錄資料。 例如,Azure 監視器可以在 VM 超過使用率閾值或發生指定數目的容器重新啟動時傳送警示。
您也可以指定應收到通知的人員。 深入解析可以透過電子郵件或簡訊傳送通知,或者使用 Runbook 和 Webhook 自動回應警示。