共用方式為


監視 Azure 檔案同步

使用 Azure 檔案同步,將組織的檔案共用集中在 Azure 檔案儲存體服務中,同時保有內部部署檔案伺服器的彈性、效能及相容性。 Azure 檔案同步會將 Windows Server 轉換成 Azure 檔案共用的快速快取。 您可以使用 Windows Server 上可用的任何通訊協定來從本機存取資料,包括 SMB、NFS 和 FTPS。 您可以在世界各地,盡可能多地擁有您所需的快取數量。

內建監視 Azure 檔案同步

本文描述如何使用 Azure 監視器、儲存體同步服務和 Windows Server 來監視您的 Azure 檔案同步部署。 其中涵蓋下列案例:

  • 檢視 Azure 監視器中的 Azure 檔案同步計量。
  • 在 Azure 監視器中建立警示,以主動通知您重大情況。
  • 使用 Azure 入口網站來檢視 Azure 檔案同步部署的健康情況。
  • 使用 Windows Server 上的事件記錄檔和效能計數器來監視 Azure 檔案同步部署的健康情況。

檢視 Azure 檔案同步 計量

依預設會啟用 Azure 檔案同步的計量,並且每 15 分鐘傳送至 Azure 監視器一次。

若要在 Azure 監視器中檢視 Azure 檔案同步 計量:

  1. 移至 Azure 入口網站 中的記憶體同步服務,然後選取 [計量]。
  2. 選取 [ 計量 ] 下拉式列表,然後選取您想要檢視的計量。

Azure 入口網站 中 Azure 檔案同步 計量的螢幕快照。

當您的監視資料中發現重要條件時,警示會主動通知您。 若要深入了解如何在 Azure 監視器中設定警示,請參閱 Microsoft Azure 中的警示概觀

警示

若要建立 Azure 檔案同步 的警示:

  1. 移至 Azure 入口網站中的 [儲存體同步服務]
  2. 在 [監視] 區段中選取 [警示 ],然後選取 [+ 新增警示規則]。
  3. 選取 [ 選取條件 ],並提供警示的下列資訊:
    • 計量
    • 維度名稱
    • 警示邏輯
  4. 選取 [ 選取動作群組 ],然後選取現有的動作群組或建立新的動作群組,將動作群組(電子郵件、SMS 等)新增至警示。
  5. 填入警示詳細資料,例如警示規則名稱描述嚴重性
  6. 選取 [建立警示規則] 以建立警示。

注意

如果您使用「伺服器名稱」維度設定警示,且伺服器已重新命名,則必須更新警示,才能監視新的伺服器名稱。

儲存體同步服務

若要在 Azure 入口網站 中檢視 Azure 檔案同步 部署的健康情況,請瀏覽至記憶體同步服務 提供下列資訊:

  • 已註冊的伺服器健康情況

  • 伺服器端點健康情況

    • 持續性同步錯誤
    • 暫時性同步錯誤
    • 同步活動 (上傳至雲端、下載至伺服器)
    • 雲端階層處理節省的空間
    • 階層處理錯誤
    • 重新叫用錯誤
  • 計量

已註冊的伺服器健康情況

若要在入口網站中檢視已註冊的伺服器健康情況,請瀏覽至 [儲存體同步服務] 的 [已註冊的伺服器] 區段。

此螢幕快照顯示已註冊的伺服器頁面,其中包含伺服器名稱和狀態。

  • 如果已註冊的伺服器處於線上狀態,表示伺服器正順利地與服務進行通訊。
  • 如果已註冊的伺服器狀態為 [顯示為離線],則記憶體同步監視器進程 (AzureStorageSyncMonitor.exe) 未執行,或伺服器無法存取 Azure 檔案同步 服務。 如需詳細資訊,請參閱疑難排解文件

伺服器端點健康情況

若要在入口網站中檢視伺服器端點的健康情況,請瀏覽至 [儲存體同步服務] 的 [同步處理群組] 區段,然後選取一個同步處理群組

顯示 Azure 入口網站中伺服器端點健康情況的螢幕擷取畫面。

  • 入口 網站中的伺服器端點健全狀況同步活動 (上傳至雲端、下載至伺服器)是以伺服器遙測事件記錄檔中記錄的同步事件為基礎(標識元 9102 和 9302)。 如果同步會話因為暫時性錯誤而失敗,例如已取消錯誤,只要目前的同步會話正在進行中,伺服器端點仍會在入口網站中顯示為 狀況良好 (已套用檔案)。 事件識別碼 9302 是同步處理進度事件,而在同步處理工作階段完成之後,會記錄事件識別碼 9102。 如需詳細資訊,請參閱同步處理健康情況同步處理進度。 如果伺服器端點健康情況顯示 [狀況良好] 以外的狀態,請參閱疑難排解文件取得指引。
  • 入口 網站中的持續性同步錯誤暫時性同步錯誤 計數是以伺服器遙測事件記錄檔中記錄的事件標識碼 9121 為基礎。 當同步處理工作階段完成時,每個項目的錯誤都會記錄此事件。 若要在入口網站中檢視錯誤,請移至 [伺服器端點屬性],然後瀏覽至 [錯誤與疑難排解] 區段。 若要解決個別項目錯誤,請參閱 如何? 查看是否有特定檔案或資料夾未同步?
  • 雲端階層處理節省的空間提供雲端階層處理所節省的磁碟空間量。 為 節省 雲端階層處理空間所提供的數據是以伺服器遙測事件記錄檔中記錄的事件標識碼 9071 為基礎。 若要檢視其他雲端階層處理資訊和計量,請移至 [伺服器端點屬性 ] 並流覽至 [雲端階層處理狀態 ] 區段。 若要深入了解,請參閱監視雲端階層處理
  • 若要在入口網站中檢視 [階層處理錯誤] 和 [重新叫用錯誤],請移至 [伺服器端點屬性],然後瀏覽至 [錯誤與疑難排解] 區段階層處理錯誤 是以伺服器遙測事件記錄檔中記錄的事件標識碼 9003 為基礎,而 重新叫用錯誤 是以事件標識碼 9006 為基礎。 如需無法分層或重新叫用之檔案的詳細資訊,請參閱 如何針對無法分層 的檔案進行疑難解答,以及如何 針對無法回收的檔案進行疑難解答。

計量圖表

您可以在儲存體同步服務入口網站中檢視下列計量圖表:

度量名稱 描述 頁面名稱
同步的位元組 傳輸的資料大小 (上傳和下載)。 伺服器端點 - 同步狀態
檔案無法同步 無法同步的檔案計數。 伺服器端點 - 同步狀態
同步的檔案 傳輸的檔案計數 (上傳和下載)。 伺服器端點 - 同步狀態
雲端階層處理快取命中率 從快取提供服務與從雲端重新叫用的位元組 (並非整個檔案) 百分比。 伺服器端點 - 雲端階層處理狀態
上次存取時間的快取資料大小 上次存取時間的資料大小。 伺服器端點 - 雲端階層處理狀態
上次維護作業分層的雲端階層處理資料大小 在上次維護作業期間分層的資料大小。 伺服器端點 - 雲端階層處理狀態
雲端階層處理重新叫用大小 (依應用程式) 應用程式重新叫用的資料大小。 伺服器端點 - 雲端階層處理狀態
雲端階層處理重新叫用 重新叫用的資料大小。 伺服器端點 - 雲端階層處理狀態、已註冊的伺服器
伺服器線上狀態 從伺服器接收到的活動訊號計數。 已註冊的伺服器

注意

儲存體同步服務入口網站中的圖表時間範圍為 24 小時。 若要檢視不同的時間範圍或維度,請使用 Azure 監視器。

Windows Server

在已安裝 Azure 檔案同步代理程式的 Windows Server 上,您可以使用事件記錄檔效能計數器,在該伺服器上檢視伺服器端點的健康情況。

事件記錄檔

若要監視已註冊的伺服器、同步處理和雲端階層處理健康情況,請使用遙測事件伺服器記錄。 遙測事件記錄檔位於事件檢視器中的 Applications and Services\Microsoft\FileSync\Agent 下。

  • 同步健康情況

    • 同步工作階段完成後,會記錄事件識別碼 9102。 您可以使用此事件來判斷同步處理工作階段是否成功 (HResult = 0) 以及是否有每個項目同步錯誤 (PerItemErrorCount)。 如需詳細資訊,請參閱同步健康情況每個項目的錯誤文件。

      注意

      有時候同步處理工作階段會整體失敗或有非零的 PerItemErrorCount。 不過,工作階段仍會繼續進行,而某些檔案會成功同步。 您可以在已套用欄位中看到此情況,例如 AppliedFileCount、AppliedDirCount、AppliedTombstoneCount 和 AppliedSizeBytes。 這些欄位會告訴您工作階段的成功程度。 如果您在某個資料列中看到多個同步處理工作階段失敗,而且有增加的已套用計數,請在您開啟支援票證之前,提供同步處理時間再試一次。

    • 當同步處理工作階段完成時,每個項目的錯誤都會記錄事件識別碼 9121。 您可以使用此事件來判斷無法同步處理且具有此錯誤的檔案數目 (PersistentCountTransientCount)。 您應該調查永續性個別項目錯誤。 如需詳細資訊,請參閱 如何? 查看是否有未同步處理的特定檔案或資料夾?

    • 如果有使用中的同步工作階段,則會每隔 5 到 10 分鐘記錄事件識別碼 9302 一次。 使用此事件來判斷要同步處理的項目數目(TotalItemCount)、到目前為止同步處理的項目數目(AppliedItemCount)和因個別專案錯誤 (PerItemErrorCount) 而無法同步的專案數目。 如果同步未進行(AppliedItemCount=0),同步會話最終會失敗,並記錄事件標識碼 9102 並出現錯誤。 如需詳細資訊,請參閱同步處理進度文件

  • 已註冊的伺服器健康情況

    • 當伺服器查詢服務中的作業時,將會每 30 秒記錄事件識別碼 9301 一次。 如果 GetNextJob 完成,且狀態 = 0,表示伺服器能夠與服務通訊。 如果 GetNextJob 完成但發生錯誤,請查看疑難排解文件以取得指引。
  • 雲端階層處理健康情況

    • 若要監視伺服器上的階層處理活動,請在遙測事件記錄檔中使用事件識別碼 9003、9016 和 9029 (位於事件檢視器中的 Applications and Services\Microsoft\FileSync\Agent 下)。

      • 事件識別碼 9003 會提供伺服器端點的錯誤分布。 例如:錯誤總數和錯誤碼。 系統會為每個錯誤碼記錄一個事件。
      • 事件識別碼 9016 會提供磁碟區的建立映像結果。 例如:可用空間百分比、在工作階段中建立映像的檔案數目,以及無法建立映像的檔案數目。
      • 事件識別碼 9029 會提供伺服器端點的虛像化工作階段資訊。 例如:在工作階段中嘗試的檔案數目、在工作階段中進行階層處理的檔案數目,以及已進行階層處理的檔案數目。
    • 若要監視伺服器上的重新叫用活動,請在遙測事件記錄檔中使用事件識別碼 9005、9006、9009、9059 和 9071 (位於事件檢視器中的 Applications and Services\Microsoft\FileSync\Agent 下)。

      • 事件識別碼 9005 會提供伺服器端點的回收可靠性。 例如:存取的唯一檔案總數和存取失敗的唯一檔案總數。
      • 事件識別碼 9006 會提供伺服器端點的回收錯誤分布。 例如:失敗的要求總數和錯誤碼。 系統會為每個錯誤碼記錄一個事件。
      • 事件識別碼 9009 會提供伺服器端點的回收工作階段資訊。 例如:DurationSeconds、CountFilesRecallSucceeded 和 CountFilesRecallFailed。
      • 事件識別碼 9059 會提供伺服器端點的應用程式回收分布。 例如:ShareId、應用程式名稱和 TotalEgressNetworkBytes。
      • 事件識別碼 9071 會提供伺服器端點的雲端階層處理效率。 例如:TotalDistinctFileCountCacheHit、TotalDistinctFileCountCacheMiss、TotalCacheHitBytes 和 TotalCacheMissBytes。

效能計數器

使用伺服器上的 Azure 檔案同步效能計數器,可監視同步活動。

若要在伺服器上檢視 Azure 檔案同步效能計數器,請開啟效能監視器 (Perfmon.exe)。 您可以在已傳輸的 AFS 位元組AFS 同步處理作業物件下找到計數器。

以下是效能監視器中為 Azure 檔案同步提供的效能計數器:

效能物件\計數器名稱 描述
傳輸的 AFS 位元組\每秒下載的位元組 每秒下載的位元組數。
傳輸的 AFS 位元組\每秒上傳的位元組 每秒上傳的位元組數。
傳輸的 AFS 位元組\每秒的位元組總數 每秒的位元組總數 (上傳和下載)。
AFS 同步作業\每秒下載的同步檔案 每秒下載的檔案數。
AFS 同步作業\每秒上傳的同步檔案 每秒上傳的檔案數。
AFS 同步作業\每秒的同步檔案作業總數 同步的檔案總數 (上傳和下載)。

使用 Azure 監視器收集數據

下表描述如何收集數據來監視服務,以及一旦收集數據后,您可以執行哪些動作:

要收集的資料 描述 如何收集和路由數據 檢視數據的位置 支援的資料
計量資料 計量為數值,可描述系統在特定時間點的某個方面。 相較於其他計量,您可以使用演算法匯總計量,並分析一段時間的趨勢。 定期自動收集。 計量瀏覽器 Azure 監視器支援的 Azure 檔案同步 計量
活動記錄數據 Azure 監視器活動記錄提供訂用帳戶層級事件的深入解析。 此活動記錄包含像是何時修改資源或啟動虛擬機器的資訊。 自動收集。 活動記錄檔

如需 Azure 監視器支援的所有計量資料清單,請參閱 Azure 監視器支援的計量

使用 Azure 監視器工具來分析數據

這些 Azure 監視器工具可在 Azure 入口網站 中使用,以協助您分析監視數據:

  • 某些 Azure 服務在 Azure 入口網站 中有內建的監視儀錶板。 這些儀錶板稱為深入解析,您可以在 Azure 入口網站 的 Azure 監視器深入解析區段中找到這些儀錶板。

  • 計量總 管可讓您檢視和分析 Azure 資源的計量。 如需詳細資訊,請參閱 使用 Azure 監視器計量總管分析計量

  • Log Analytics 可讓您使用 Kusto 查詢語言 (KQL) 來查詢和分析記錄數據。 如需詳細資訊,請參閱開始使用 Azure 監視器中的記錄查詢

  • Azure 入口網站 具有使用者介面,可用於檢視活動記錄和基本搜尋。 若要進行更深入的分析,請將數據路由傳送至 Azure 監視器記錄,並在 Log Analytics 中執行更複雜的查詢。

  • Application Insights 會監視 Web 應用程式的可用性、效能和使用狀況,因此您可以識別和診斷錯誤,而不需要等待使用者回報錯誤。
    Application Insights 包含各種開發工具的連接點,並與 Visual Studio 整合以支援 DevOps 程式。 如需詳細資訊,請參閱 App Service 的應用程式監視 (部分機器翻譯)。

支援更複雜視覺效果的工具包括:

  • 儀表板 (機器翻譯) 可讓您將不同類型的資料合併到 Azure 入口網站中的單一窗格。
  • 活頁簿 (機器翻譯) 是能在 Azure 入口網站中建立的可自訂報表。 活頁簿可以包含文字、計量及記錄查詢。
  • Grafana 是在操作儀表板中表現相當出色的開放平台工具。 您可以使用 Grafana 來建立儀表板,納入 Azure 監視器以外多個來源的資料。
  • Power BI (機器翻譯) 是一項商務分析服務,可提供跨各種資料來源的互動式視覺效果。 你可以將 Power BI 設定為自動從 Azure 監視器匯入記錄資料,以利用這些視覺效果。

匯出 Azure 監視器數據

您可以使用:

若要開始使用 Azure 監視器 REST API,請參閱 Azure 監視 REST API 逐步解說

使用 Azure 監視器警示通知您問題

Azure 監視器警示 可讓您識別並解決系統中的問題,並在客戶注意到問題之前,在監視數據中找到特定條件時主動通知您。 您可以針對在 Azure 監視器資料平台中的任何計量或記錄資料來源發出警示。 根據您監視的服務,以及您要收集的監視數據,有 不同類型的 Azure 監視器警示 。 請參閱選擇正確的警示規則類型

下表列出 Azure 檔案同步 的常見和建議警示規則。

案例 用於警示的計量
伺服器端點健康情況會在入口網站中顯示錯誤 同步工作階段結果
檔案無法同步至伺服器或雲端端點 檔案無法同步
已註冊的伺服器無法與儲存體同步服務通訊 伺服器線上狀態
雲端階層處理回收大小在一天內超過 500 GiB 雲端階層處理重新叫用大小

如需 Azure 資源的常見警示範例,請參閱記錄警示查詢範例 (機器翻譯)。

大規模實作警示

對於某些服務,若要進行大規模監控,您可以將同一計量警示規則套用至相同 Azure 區域中存在的多個同類型資源。 Azure 監視器基準警示 (AMBA) 提供半自動化的方法,可大規模實作重要的平臺計量警示、儀錶板和指導方針。

警示範例

本節提供 Azure 檔案同步的一些範例警示。

注意

如果您建立警示,而其雜訊太多,請調整閾值和警示邏輯。

如果伺服器端點健全狀況在入口網站中顯示錯誤,請建立警示:

  1. Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]
  2. 移至 [監視] 區段,然後選取 [警示]
  3. 選取 [+ 新增警示規則] 來新建警示規則。
  4. 按一下 [選取條件] 來設定條件。
  5. 在 [ 設定訊號邏輯] 區 段中,選取 [訊號名稱] 底下的 [ 同步會話結果 ]。
  6. 選取下列維度設定:
    • 維度名稱:伺服器端點名稱
    • 運算子:=
    • 維度值:所有目前和未來的值
  7. 瀏覽至 [警示邏輯],然後完成下列項目:
    • 閾值設定為 [靜態]
    • 運算子:小於
    • 彙總類型:最大值
    • 閾值:1
    • 評估依據:彙總細微性 = 24 小時 | 評估頻率 = 每小時
    • 選取完成
  8. 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
  9. 填入警示詳細資料,例如警示規則名稱描述嚴重性
  10. 選取 [建立警示規則]

如果檔案無法同步至伺服器或雲端端點,請建立警示:

  1. Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]
  2. 移至 [監視] 區段,然後選取 [警示]
  3. 選取 [+ 新增警示規則] 來新建警示規則。
  4. 選取 [選取條件] 來設定條件。
  5. 在 [ 設定訊號邏輯] 區段中,選取 [訊號名稱下未同步處理的 檔案]。
  6. 選取下列維度設定:
    • 維度名稱:伺服器端點名稱
    • 運算子:=
    • 維度值:所有目前和未來的值
  7. 瀏覽至 [警示邏輯],然後完成下列項目:
    • 閾值設定為 [靜態]
    • 運算子:大於
    • 彙總類型:平均
    • 閾值:100
    • 評估依據:彙總細微性 = 5 分鐘 | 評估頻率 = 每 5 分鐘
    • 選取完成
  8. 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
  9. 填入警示詳細資料,例如警示規則名稱描述嚴重性
  10. 選取 [建立警示規則]

如果已註冊的伺服器無法與記憶體同步服務通訊,請建立警示:

  1. Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]
  2. 移至 [監視] 區段,然後選取 [警示]
  3. 選取 [+ 新增警示規則] 來新建警示規則。
  4. 選取 [選取條件] 來設定條件。
  5. 在 [ 設定訊號邏輯] 區段中,選取 [訊號名稱] 底下的 [伺服器在線狀態 ]。
  6. 選取下列維度設定:
    • 維度名稱:伺服器名稱
    • 運算子:=
    • 維度值:所有目前和未來的值
  7. 瀏覽至 [警示邏輯],然後完成下列項目:
    • 閾值設定為 [靜態]
    • 運算子:小於
    • 彙總類型:最大值
    • 閾值 (位元組):1
    • 評估依據:彙總細微性 = 1 小時 | 評估頻率 = 每 30 分鐘
      • 計量會每隔 15 到 20 分鐘傳送至 Azure 監視器。 請勿將 評估 頻率設定為少於 30 分鐘,因為這樣做會產生錯誤的警示。
    • 選取完成
  8. 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
  9. 填入警示詳細資料,例如警示規則名稱描述嚴重性
  10. 選取 [建立警示規則]

若要在一天內將 500 GiB 的雲端階層處理重新叫用大小移除,請建立警示:

  1. Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]
  2. 移至 [監視] 區段,然後選取 [警示]
  3. 選取 [+ 新增警示規則] 來新建警示規則。
  4. 選取 [選取條件] 來設定條件。
  5. 在 [ 設定訊號邏輯] 區 段中,選取 [ 訊號名稱] 底下的 [雲端階層處理回收大小 ]。
  6. 選取下列維度設定:
    • 維度名稱:伺服器名稱
    • 運算子:=
    • 維度值:所有目前和未來的值
  7. 瀏覽至 [警示邏輯],然後完成下列項目:
    • 閾值設定為 [靜態]
    • 運算子:大於
    • 彙總類型:總計
    • 閾值 (位元組):67108864000
    • 評估依據:彙總細微性 = 24 小時 | 評估頻率 = 每小時
    • 選取完成
  8. 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
  9. 填入警示詳細資料,例如警示規則名稱描述嚴重性
  10. 選取 [建立警示規則]