利用 OMS Log Analytics 監視 VMware

[アーティクル]
03/27/2017

這篇部落格會告訴您如何建立 OMS 來收集 VMware 的記錄。此外，還會介紹一些 OMS 搜尋指令的範例讓您能夠快速開始部署並為您的 VMware 環境提供深度的洞察。

建立 OMS 從 VMware 收集資料

1. 首先建立您的 VMware 環境讓記錄能夠合併到 syslog 中並被傳送到 vCenter Server。您可以有多個 ESXi 主機傳送 syslog 到單一的 vCenter Server 中。此範例使用最新的 vCenter 伺服器和版本6.0 的 ESXi 主機。

接著將 OMS Windows agent 安裝到 vCenter 上。詳細安裝步驟請參閱：將 Windows 電腦連接到 Azure 中的 Log Analytics 服務。

2. 安裝完 agent 後，設定 OMS 自訂記錄檔讓 syslog 能被收集。如何設定自訂記錄檔的詳細資料請參閱：Log Analytics 中的自訂記錄檔。

在 vCenter Server 建立 syslog 資料夾作為您的自訂記錄檔。

"C:\ProgramData\VMware\vCenterServer\data\vmsyslogcollector\ yourESXihostname \syslog.txt"

3. 接著設定就完成了。前往 OMS 設定頁面查看您的 vCenter server 是否上線了。

4. 設定 OMS 中的自訂欄位。詳細資訊請參閱：Log Analytics 中的自訂欄位。

VMwareHost_CF ESXi Hostname

VMwarePN_CF VMware Application Name ( vmkernel, vmkwarning, vobd, hostd, etc.)

完成以上設定後，您便可以針對 syslog 執行一個簡單的搜尋指令。

搜尋指令範例

在每天的運作中，您會想瞭解在您環境中所發生的事件。以下的幾個指令會提供您前十名的 VMware 事件和趨勢、磁盤警告趨勢、VM 建立/刪除的數量、儲存延遲等等。您也可以將這些搜尋指令用於其他案例中。

這些搜尋指令都能夠被繪製並顯示在 OMS 儀表板中。想深入瞭解"我的儀表板"，請參閱：建立用於 Log Analytics 中的自訂儀表板。

VMware 事件前十名

Top 10 Event charting

Type=VMware_CL | measure count() by VMwarePN_CF | top 10

事件的趨勢

Event Trend Hourly Interval

Type=VMware_CL | measure countdistinct(TimeGenerated) by VMwareHost_CF Interval 1HOUR

一段時間內在特定 ESXi 主機上看到的磁盤警示

Hourly Interval Charting	Type=VMware_CL VMwareHost_CF=”yourESXihostname ” VMwarePN_CF=smartd “warn” \| measure count() interval 1HOUR
Daily Interval Charting	Type=VMware_CL VMwareHost_CF=”yourESXihostname ” VMwarePN_CF=smartd “warn” \| measure count() interval 1DAY

磁盤溫度警示圖

Hourly Interval disk temperature on ESXi above threshold

Type=VMware_CL VMwareHost_CF=”yourESXihostname” VMwarePN_CF=smartd (“warn” and “above temperature”) | measure count() interval 1HOUR

過去24小時每個 ESXi 主機中 VM 關閉的數量

Daily Interval Chart

Type=VMware_CL (“is powered off”) VMwarePN_CF=Hostd TimeGenerated:[NOW-1DAY..NOW] | measure count () by VMwareHost_CF

過去24小時建立的 VM 數量

Daily Interval Chart

Type=VMware_CL (“Created virtual machine”) TimeGenerated:[NOW-1DAY..NOW] | measure countdistinct(TimeGenerated) by VMwareHost_CF

過去24小時刪除的 VM 數量

Daily Interval Chart

Type=VMware_CL VMwarePN_CF=Hostd (“removed”) TimeGenerated:[NOW-1DAY..NOW] | measure countdistinct(TimeGenerated) by VMwareHost_CF

過去24小時每個 ESXi 主機中的儲存延遲

Daily Interval Chart

Type=VMware_CL (“latency”) TimeGenerated:[NOW-1DAY..NOW] | measure count() by VMwareHost_CF

警示範例

OMS 具有一個利用搜尋指令結果的警示功能。在 OMS 警示規則的介面中，您可以設定一個時間軸來決定何時要執行搜尋指令，並加入一個閾值來產生警示。想瞭解更多警示的詳細資料請參閱：回應在 Log Analytics 中使用警示的問題。

如預設的，建議將閾值調成3。完成 OMS 警示設定後，您將會收到 email 認證。

以下是一些您可以為問題設定警示的範例搜尋指令：

一段時間內多個 VM 關閉時警示

Alerting Multiple VM powered off

Type=VMware_CL (“is powered off”) VMwareHost_CF=”yourESXihostname“

儲存體溫度過高警示

Alert on the high temperature query

Type=VMware_CL VMwarePN_CF=smartd (“warn” and “above temperature”)

磁碟警告警示

Disk Warning Alerting

Type=VMware_CL VMwarePN_CF=smartd “warn”

儲存體容量接近 ESXi 主機的消耗警示

Disk Space Alerting

Type=VMware_CL (“space left on device”)

vCenter Server 關閉警示

vCenter Shutting down

EventLog=Application Source=”VMware VirtualCenter Server” “shutdown”

次の方法で共有

利用 OMS Log Analytics 監視 VMware

建立 OMS 從 VMware 收集資料

搜尋指令範例

VMware 事件前十名

事件的趨勢

一段時間內在特定 ESXi 主機上看到的磁盤警示

磁盤溫度警示圖

過去24小時每個 ESXi 主機中 VM 關閉的數量

過去24小時建立的 VM 數量

過去24小時刪除的 VM 數量

過去24小時每個 ESXi 主機中的儲存延遲

警示範例

一段時間內多個 VM 關閉時警示

儲存體溫度過高警示

磁碟警告警示

儲存體容量接近 ESXi 主機的消耗警示

vCenter Server 關閉警示

その他のリソース

VMwareHost_CF	ESXi Hostname
VMwarePN_CF	VMware Application Name ( vmkernel, vmkwarning, vobd, hostd, etc.)