使用 Windows Azure 診斷延伸模組進行效能監視
本文件說明如何以 Windows 叢集的 Windows Azure 診斷 (WAD) 延伸模組逐步設定效能計數器集合。 若為 Linux 叢集,請設定 Log Analytics 代理程式以收集您節點的效能計數器。
注意
應該在您的叢集上部署 WAD 延伸模組,以便這些步驟產生效用。 如果未設定,請參閱使用 Windows Azure 診斷的事件彙總和收集。
注意
建議您使用 Azure Az PowerShell 模組來與 Azure 互動。 若要開始使用,請參閱安裝 Azure PowerShell (部分機器翻譯)。 若要了解如何移轉至 Az PowerShell 模組,請參閱將 Azure PowerShell 從 AzureRM 移轉至 Az。
透過 WadCfg 收集效能計數器
若要透過 WAD 收集效能計數器,您需要適當地修改叢集 Resource Manager 範本中的設定。 請按照下列步驟來新增您想要收集至範本的效能計數器,並執行資源管理員資源升級。
尋找您的叢集範本中的 WAD 設定 - 尋找
WadCfg
。 您將在DiagnosticMonitorConfiguration
下新增效能計數器以進行收集。將下列區段新增至您的
DiagnosticMonitorConfiguration
即可進行設定,以收集效能計數器。"PerformanceCounters": { "scheduledTransferPeriod": "PT1M", "PerformanceCounterConfiguration": [] }
scheduledTransferPeriod
所定義的是收集的計數器值傳輸到 Azure 儲存體資料表和任何已設定的接收之頻率。將您想要收集的效能計數器新增至上一步中宣告的
PerformanceCounterConfiguration
。 您想要收集的每個計數器皆可透過counterSpecifier
、sampleRate
、unit
、annotation
,以及任何相關的sinks
定義。
處理器時間總計 (CPU 用於處理作業的時間量) 和每秒 Service Fabric 動作項目方法引動過程 (其中一個 Service Fabric 自訂效能計數器) 的計數器組態範例如下。 請參閱 Reliable Actor 效能計數器和 Reliable Service 效能計數器,取得 Service Fabric 自訂效能計數器的完整清單。
"WadCfg": {
"DiagnosticMonitorConfiguration": {
"overallQuotaInMB": "50000",
"EtwProviders": {
"EtwEventSourceProviderConfiguration": [
{
"provider": "Microsoft-ServiceFabric-Actors",
"scheduledTransferKeywordFilter": "1",
"scheduledTransferPeriod": "PT5M",
"DefaultEvents": {
"eventDestination": "ServiceFabricReliableActorEventTable"
}
},
{
"provider": "Microsoft-ServiceFabric-Services",
"scheduledTransferPeriod": "PT5M",
"DefaultEvents": {
"eventDestination": "ServiceFabricReliableServiceEventTable"
}
}
],
"EtwManifestProviderConfiguration": [
{
"provider": "cbd93bc2-71e5-4566-b3a7-595d8eeca6e8",
"scheduledTransferLogLevelFilter": "Information",
"scheduledTransferKeywordFilter": "4611686018427387904",
"scheduledTransferPeriod": "PT5M",
"DefaultEvents": {
"eventDestination": "ServiceFabricSystemEventTable"
}
}
]
},
"PerformanceCounters": {
"scheduledTransferPeriod": "PT1M",
"PerformanceCounterConfiguration": [
{
"counterSpecifier": "\\Processor(_Total)\\% Processor Time",
"sampleRate": "PT1M",
"unit": "Percent",
"annotation": [
],
"sinks": ""
},
{
"counterSpecifier": "\\Service Fabric Actor Method(*)\\Invocations/Sec",
"sampleRate": "PT1M",
}
]
}
}
},
可視需求修改計數器的採樣速率。 其格式為 PT<time><unit>
;因此,如果您希望每秒收集計數器,應該設定 "sampleRate": "PT15S"
。
您可以使用 ARM 範本中的變數來收集效能計數器陣列,這在您會針對每個處理序收集效能計數器的情況下很有幫助。 在下列範例中,我們會使用變數來收集每個處理序的處理器時間與記憶體回收行程時間,接著收集節點本身上方的 2 個效能計數器。
"variables": {
"copy": [
{
"name": "processorTimeCounters",
"count": "[length(parameters('monitoredProcesses'))]",
"input": {
"counterSpecifier": "\\Process([parameters('monitoredProcesses')[copyIndex('processorTimeCounters')]])\\% Processor Time",
"sampleRate": "PT1M",
"unit": "Percent",
"sinks": "applicationInsights",
"annotation": [
{
"displayName": "[concat(parameters('monitoredProcesses')[copyIndex('processorTimeCounters')],' Processor Time')]",
"locale": "en-us"
}
]
}
},
{
"name": "gcTimeCounters",
"count": "[length(parameters('monitoredProcesses'))]",
"input": {
"counterSpecifier": "\\.NET CLR Memory([parameters('monitoredProcesses')[copyIndex('gcTimeCounters')]])\\% Time in GC",
"sampleRate": "PT1M",
"unit": "Percent",
"sinks": "applicationInsights",
"annotation": [
{
"displayName": "[concat(parameters('monitoredProcesses')[copyIndex('gcTimeCounters')],' Time in GC')]",
"locale": "en-us"
}
]
}
}
],
"machineCounters": [
{
"counterSpecifier": "\\Memory\\Available Bytes",
"sampleRate": "PT1M",
"unit": "KB",
"sinks": "applicationInsights",
"annotation": [
{
"displayName": "Memory Available Kb",
"locale": "en-us"
}
]
},
{
"counterSpecifier": "\\Memory\\% Committed Bytes In Use",
"sampleRate": "PT15S",
"unit": "percent",
"annotation": [
{
"displayName": "Memory usage",
"locale": "en-us"
}
]
}
]
}
....
"WadCfg": {
"DiagnosticMonitorConfiguration": {
"overallQuotaInMB": "50000",
"Metrics": {
"metricAggregation": [
{
"scheduledTransferPeriod": "PT1M"
}
],
"resourceId": "[resourceId('Microsoft.Compute/virtualMachineScaleSets', variables('vmNodeTypeApp2Name'))]"
},
"PerformanceCounters": {
"scheduledTransferPeriod": "PT1M",
"PerformanceCounterConfiguration": "[concat(variables ('processorTimeCounters'), variables('gcTimeCounters'), variables('machineCounters'))]"
},
....
新增需要收集的適用效能計數器之後,需要升級叢集資源,以便讓這些變更反映在正在執行的叢集中。 儲存修改的
template.json
,並開啟 PowerShell。 您可以使用New-AzResourceGroupDeployment
升級叢集。 呼叫需要資源群組的名稱、更新的範本檔案,以及參數檔案,並提示資源管理員對您更新的資源進行適當的變更。 一旦登入您的帳戶並進入正確的訂用帳戶,請使用下列命令以執行升級:New-AzResourceGroupDeployment -ResourceGroupName <ResourceGroup> -TemplateFile <PathToTemplateFile> -TemplateParameterFile <PathToParametersFile> -Verbose
升級推出完畢後 (大約需要 15-45 分鐘,視其是否為第一次部署,以及您資源群組的大小而定),WAD 應該會收集效能計數器,並將其傳送至與您叢集相關的儲存體帳戶中,名為 WADPerformanceCountersTable 的表格。 藉由將 AI 接收新增至 Resource Manager 範本,查看 Application Insights 中的效能計數器。
下一步
- 為您的叢集收集更多效能計數器。 請參閱效能度量,以取得您應該收集的計數器清單。
- 透過 Windows VM 與 Azure Resource Manager 範本使用監視和診斷,對
WadCfg
做進一步的修改,包括設定診斷資料要傳送到的其他儲存體帳戶。 - 請造訪 WadCfg 建立器 (英文) 來從頭開始建立範本,並確定您的語法正確。來從頭開始建立範本,並確定您的語法正確。