共用方式為


可靠性建議

Azure Advisor 協助您確保及改善商務關鍵性應用程式的持續性。 您可以在 Azure Advisor 的 [可靠性] 索引標籤上,取得可靠性建議。

  1. 登入 Azure 入口網站

  2. 搜尋並選取任何頁面中的 Advisor

  3. Advisor 儀表板上,選取 [效能] 索引標籤。

AgFood 平台

升級至最新的 ADMA DotNet SDK 版本

我們已識別出對已排程要淘汰 ADMA DotNet SDK 版本的呼叫。 為了確保不中斷存取 ADMA、最新功能和效能改善,請切換至最新的 SDK 版本。

潛在優點:確保對 ADMA 的持續無中斷存取

如需詳細資訊,請參閱什麼是適用於農業的 Azure 資料管理員?

升級至最新的 ADMA Java SDK 版本

我們已識別出對已排程要淘汰 ADMA Java Sdk 版本的呼叫。 建議您切換至最新的 Sdk 版本,以確保不中斷存取 ADMA、最新功能和效能改善。

潛在優點:確保對 ADMA 的持續無中斷存取

如需詳細資訊,請參閱什麼是適用於農業的 Azure 資料管理員?

升級至最新的 ADMA Python SDK 版本

我們已識別出對已排程要淘汰 ADMA Python SDK 版本的呼叫。 為了確保不中斷存取 ADMA、最新功能和效能改善,請切換至最新的 SDK 版本。

潛在優點:確保對 ADMA 的持續無中斷存取

如需詳細資訊,請參閱什麼是適用於農業的 Azure 資料管理員?

升級至最新的 ADMA JavaScript SDK 版本

我們已識別出對已排程要淘汰 ADMA JavaScript SDK 版本的呼叫。 為了確保不中斷存取 ADMA、最新功能和效能改善,請切換至最新的 SDK 版本。

潛在優點:確保對 ADMA 的持續無中斷存取

如需詳細資訊,請參閱什麼是適用於農業的 Azure 資料管理員?

API 管理

將 API 管理服務遷移至 stv2 平台

在 stv1 平台上裝載 API 管理執行個體的支援,將於 2024 年 8 月 31 日淘汰。 先移轉至 stv2 型平台,以避免服務中斷。

潛在優點:改善服務穩定性並利用新的平台功能

如需詳細資訊,請參閱 APIM stv1 平台淘汰 - 全域 Azure 雲端 (2024 年 8 月)

主機名稱憑證輪替失敗

API 管理服務無法從金鑰保存庫重新整理主機名稱憑證,可能會導致服務使用過時的憑證,以及執行階段 API 流量遭到封鎖。 請確定憑證存在於金鑰保存庫,而且 API 管理服務識別已獲得秘密的讀取權限。

潛在優點:確保服務可用性

如需詳細資訊,請參閱設定 Azure APIM 執行個體的自訂網域名稱

舊版入口網站已在 3 年前被取代,並在 2023 年 10 月淘汰。 不過,我們看到入口網站的作用中使用量,可能會在停用服務時很快造成服務中斷。

強烈建議您儘快移轉至新的開發人員入口網站,以繼續享受我們的服務,並利用新功能和改進功能。

潛在優點:確保業務持續性

如需詳細資訊,請參閱移轉至新的開發人員入口網站

相依性網路狀態檢查失敗

Azure APIM 服務相依性無法使用。 請檢查虛擬網路設定。

潛在優點:改善服務穩定性

如需詳細資訊,請參閱將您的 Azure APIM 執行個體部署到虛擬網路 - 外部模式

SSL/TLS 重新交涉受阻

SSL/TLS 重新交涉嘗試遭到封鎖;安全通訊可能會失敗。 若要支援用戶端憑證驗證情節,請在列出的主機名稱上啟用 [交涉用戶端憑證]。 對於瀏覽器型用戶端,此選項可能會在用戶端出現憑證提示。

潛在優點:確保服務可用性

如需詳細資訊,請參閱如何使用 APIM 中的用戶端憑證驗證保障 API 的安全性

將 Azure API 管理執行個體部署到多個 Azure 區域以增加服務可用性

Azure API 管理支援多區域部署,可讓 API 發行者將區域性 API 閘道新增至現有 API 管理執行個體。 多區域部署有助降低異地散發 API 取用者感知的要求延遲,且改善服務可用性。

潛在優點:提高抵抗區域性失敗的復原能力

如需詳細資訊,請參閱將 Azure APIM 執行個體部署到多個 Azure 區域

在生產工作負載上啟用和設定 API 受控執行個體的自動縮放。

生產服務層級中的 API 受控執行個體可以藉由新增和移除單位來調整。 自動調整功能可以動態調整 API 受控執行個體的單位,以因應負載變更而不需要手動介入。

潛在優點:提高可擴縮性並最佳化成本。

如需詳細資訊,請參閱自動調整 Azure APIM 執行個體

應用程式服務

擴增 App Service 方案以避免 CPU 耗盡

高 CPU 使用率可能導致應用程式發生執行階段問題。 在過去幾天,您的應用程式已超過 90% CPU。 為減少 CPU 使用量並避免執行階段問題,請擴增應用程式。

潛在優點:讓您的應用程式保持良好狀態

如需詳細資訊,請參閱 Azure App Service 的最佳做法

檢查應用程式的服務健康狀態問題

我們有與您應用程式服務健康狀態相關的建議。 請開啟 Azure 入口網站,移至應用程式,按一下 [診斷並解決] 查看更多詳細資料。

潛在優點:讓您的應用程式保持良好狀態

如需詳細資訊,請參閱 Azure App Service 的最佳做法

修正 App Service 資源的備份資料庫設定

應用程式有無效的資料庫組態時,備份會失敗。 如需詳細資料,請參閱應用程式管理頁面的應用程式備份歷程記錄。

潛在優點:確保業務持續性

如需詳細資訊,請參閱 Azure App Service 的最佳做法

修正 App Service 資源的備份儲存體設定

應用程式有無效的儲存體設定時,備份會失敗。 如需詳細資料,請參閱應用程式管理頁面的應用程式備份歷程記錄。

潛在優點:確保業務持續性

如需詳細資訊,請參閱 Azure App Service 的最佳做法

擴大 App Service 方案 SKU 以免發生記憶體問題

包含您應用程式的 App Service 方案已超過 85% 記憶體配置。 高記憶體使用量可能導致應用程式發生執行階段問題。 找出問題應用程式,將它擴大為記憶體資源更多的較高階方案。

潛在優點:讓您的應用程式保持良好狀態

如需詳細資訊,請參閱 Azure App Service 的最佳做法

擴增 App Service 方案

請考慮將您的 App Service 方案擴增到至少兩個執行個體,以避免在例行性維護期間發生冷啟動延遲和服務中斷。

潛在優點:最佳化使用者體驗和可用性

如需詳細資訊,請參閱 https://aka.ms/appsvcnuminstances

修正應用程式程式碼,因為發生未處理的例外狀況,導致背景工作處理序損毀

因為發生未處理的例外狀況,導致應用程式的背景工作處理序損毀。 若要識別根本原因,請在損毀時收集記憶傾印並呼叫堆疊資訊。

潛在優點:讓您的應用程式保持良好狀態且高度可用

如需詳細資訊,請參閱 https://aka.ms/appsvcproactivecrashmonitoring

將 App Service 升級至標準方案,避免要求拒絕

應用程式是共用 App Service 方案的一部分,且多次達到配額時,可能會拒絕連入要求。 達到配額之後,Web 應用程式就無法接受連入要求。 若要移除配額,請升級為標準方案。

潛在優點:讓您的應用程式保持良好狀態

如需詳細資訊,請參閱 Azure App Service 方案概觀

將 App Service 資源移至標準或更高的 SKU 並使用部署位置

一週多次部署應用程式時,可能會發生問題。 上週您已多次部署應用程式。 為協助您減少部署對生產 Web 應用程式的影響,請將 App Service 資源移至 Standard (或更高階) 方案,並使用部署位置。

潛在優點:更新時讓您的應用程式保持良好狀態

如需詳細資訊,請參閱在 Azure App Service 中設定預備環境

請考慮將此訂用帳戶中的 Static Web Apps 主控方案升級為標準 SKU。

此訂用帳戶中所有可用 SKU Static Web Apps 使用的頻寬總和超過每月 100 GB 的限制。 請考慮將這些應用程式升級至標準 SKU,以免發生節流。

潛在優點:藉由避免節流來提高應用程式的可用性。

如需詳細資訊,請參閱定價 - Static Web Apps

對 App Service 資源使用部署位置

一週多次部署應用程式時,可能會發生問題。 上週您已多次部署應用程式。 為協助您管理變更,並協助您減少部署對生產 Web 應用程式的影響,請使用部署位置。

潛在優點:更新時讓您的應用程式保持良好狀態

如需詳細資訊,請參閱在 Azure App Service 中設定預備環境

考慮將您的應用程式架構變更為 64 位元

您的 App Service 已設定為 32 位元,且其記憶體耗用量快要接近 2 GB 的限制。 如果您的應用程式有提供支援,請考慮重新編譯您的應用程式,並將 App Service 組態改為 64 位元。

潛在優點:改善您的應用程式可靠性

如需詳細資訊,請參閱 Azure Web 應用程式的應用程式效能常見問題集

CX 觀察器個人化建議

CX 觀察器個人化建議

潛在優點:NA

App Service 憑證

需要網域驗證才能核發 App Service 憑證

您擁有目前處於暫止發行狀態且需要網域驗證的 App Service 憑證。 驗證網域擁有權失敗會導致憑證發行失敗。 未針對 App Service 憑證將網域驗證程序自動化,而且需要操作。 如果您最近已驗證網域擁有權並已核發憑證,您可以忽略此訊息。

潛在優點:確保成功發行 App Service 憑證。

如需詳細資訊,請參閱在 Azure App Service 中新增和管理 TLS/SSL 憑證

應用程式閘道

升級 SKU 或新增更多執行個體

部署兩個以上的中型或大型執行個體,可在計劃性或非計劃性維護造成中斷的期間確保業務持續性 (容錯)。

潛在優點:透過應用程式閘道復原能力來確保業務持續性

如需詳細資訊,請參閱多重區域負載平衡 - Azure 參考架構

避免主機名稱覆寫以確保網站完整性

設定應用程式閘道時,避免覆寫主機名稱。 在應用程式閘道前端擁有的網域有別於用來存取後端的網域時,可能導致 Cookie 或重新導向 URL 中斷。 請確定後端能夠處理網域差異,或更新應用程式閘道設定,主機名稱才不必覆寫到後端。 與 App Service 搭配使用時,請將自訂網域名稱附加至 Web 應用程式,並避免對後端使用 *.azurewebsites.net 主機名稱。 請注意,前端網域不同未必在所有情況都是問題,某些類別的後端,例如 REST API,通常比較不敏感。

潛在優點:透過有復原性的應用程式閘道設定來確保網站完整性並避免損壞的 Cookie 或重新導向 URL。

如需詳細資訊,請參閱針對應用程式閘道中的 App Service 問題進行疑難排解

在網路效能監控上實作 ExpressRoute 監視器

當 ExpressRoute 線路未受到網路效能的 ExpressRoute 監視器監視時,您會錯過內部部署對 Azure 資源遺失、延遲和效能的通知,以及 Azure 到內部部署資源。 對於端對端監控,在網路效能監控上實作 ExpressRoute 監視器。

潛在優點:改善您網路中的偵測時間和緩和時間問題,並透過 ExpressRoute 提供網路路徑的深入解析

如需詳細資訊,請參閱設定 ExpressRoute 的網路效能監控 (已被取代)

在您的虛擬網路中針對跨單位復原實作多個 ExpressRoute 線路

ExpressRoute 閘道只有一個相關聯的 ExpressRoute 電路時,可能發生復原問題。 將一或多個額外電路連線到您的閘道,確保對等互連位置的備援和復原。

潛在優點:在 ExpressRoute 對等互連位置失敗時改善復原能力

如需詳細資訊,請參閱使用 ExpressRoute 專為高可用性而設計

在設定檔中再新增至少一個端點,最好是在另一個 Azure 區域

設定檔需要多個端點,才能在其中一個端點失敗時確保可用性。 此外,也建議端點應位於不同的區域。

潛在優點:藉由允許容錯移轉來提升復原能力

如需詳細資訊,請參閱流量管理員端點

新增設定為「所有 (全球)」的端點

針對地理路由,流量會傳送至定義區域中的端點。 如果區域失敗,則不會有預先定義的容錯移轉。 為地理設定檔端點的區域群組設定為「所有 (全球)」,可避免流量黑洞,並保證服務可供使用。

潛在優點:藉由避開流量黑洞來提升復原能力

如需詳細資訊,請參閱新增、停用、啟用、刪除或移動端點

將某個端點新增或移動到另一個 Azure 區域

與這個鄰近設定檔相關聯的所有端點都位於相同的區域中。 其他區域的使用者在嘗試連線時可能會遇到較長的延遲。 如果一個區域中的所有端點都失敗,則將端點新增或移動到另一個區域會改善鄰近路由的整體效能,並提供更佳的可用性。

潛在優點:藉由允許容錯移轉到另一個區域來提升復原能力

如需詳細資訊,請參閱設定效能流量路由方法

從基本閘道移至生產閘道 SKU

基本 VPN SKU 適用於開發或測試案例。 如果您打算在實際執行環境使用 VPN 閘道,請移至實際執行 SKU,因為提供的通道數較多,並且提供邊界閘道協定 (BGP)、主動-主動設定、自訂 IPsec/IKE 原則,以及更高的穩定性和可用性。

潛在優點:其他可用功能和更高的穩定性與可用性

如需詳細資訊,請參閱關於 VPN 閘道組態設定

啟用主動-主動閘道以提供備援

在主動-主動設定,VPN 閘道的兩個執行個體都會建立內部部署 VPN 裝置的站對站 (S2S) VPN 通道。 一個閘道執行個體發生計劃性維護或非計劃性事件時,系統會自動將流量切換到另一個作用中 IPsec 通道。

潛在優點:透過連線復原能力來確保業務持續性

如需詳細資訊,請參閱針對跨內部部署和 VNet 對 VNet 連線設計高可用性閘道連線

當原始群組中只有一個來源時,停用健全狀態探查

如果您只有單一來源,則 Front Door 始終會將流量路由至該來源,即使其健全狀態探查報告了狀況不良狀態也是如此。 健全狀態探查的狀態不會執行任何動作來變更 Front Door 的行為。 在此案例中,健全狀態探查不提供權益。

潛在優點:藉由減少不必要的健全狀態探查流量來確保服務可用性

如需詳細資訊,請參閱 Front Door 最佳做法

使用受控 TLS 認證

當 Front Door 管理 TLS 認證時,會降低您的營運成本,並協助您避免因忘記續訂認證而造成成本高昂的中斷。 Front Door 會自動發出並輪替受控 TLS 認證。

潛在優點:透過讓 Front Door 管理和輪換您的憑證來確保服務可用性

如需詳細資訊,請參閱 Front Door 最佳做法

使用輸出連線的 NAT 閘道

使用虛擬網路輸出流量的 NAT 閘道,可避免因來源網路位址轉譯 (SNAT) 連接埠耗盡導致連線失敗。 NAT 閘道會動態調整,並為流向網際網路的流量提供安全的連線。

潛在優點:使用 NAT 閘道避免輸出連線失敗

如需詳細資訊,請參閱對輸出連線使用來源網路位址轉譯 (SNAT)

跨可用性區域部署應用程式閘道

透過跨可用性區域部署應用程式閘道來達成區域備援。 區域備援可藉由讓應用程式閘道在各種中斷中倖存下來,以提升復原能力,即使有一個區域受到影響,也能確保連續性,並增強整體可靠性。

潛在優點:使用可用性區域時,應用程式閘道的復原能力會大幅增加。

如需詳細資訊,請參閱調整應用程式閘道 v2 和 WAF v2

更新應用程式閘道使用者的 VNet 權限

為了提升安全性,並提供更一致的 Azure 體驗,所有使用者都必須通過權限檢查,才能在虛擬網路中建立或更新應用程式閘道。 使用者或服務主體至少需要的權限為 Microsoft.Network/virtualNetworks/subnets/join/action。

潛在優點:避免中斷應用程式閘道資源的管理

如需詳細資訊,請參閱應用程式閘道基礎結構設定

在 Front Door 和您的來源上使用相同的網域名稱

當您重寫主機標頭時,要求 Cookie 以及 URL 重新導向可能會中斷。 當您使用 Azure App Service 這樣的平台時,工作階段親和性以及驗證和授權等功能可能無法正常運作。 請務必驗證您的應用程式是否能正常運作。

潛在優點:藉由保留原始主機名稱來確保應用程式完整性

如需詳細資訊,請參閱 Front Door 最佳做法

實作 ExpressRoute 的網站復原性

為了確保復原上限,Microsoft 建議您連線到兩個對等互連位置中的兩個 ExpressRoute 線路。 「最大復原」的目標是要增強可用性,並確保關鍵工作負載的最高復原層級。

潛在優點:ExpressRoute 中的最大復原能力旨在確保 Microsoft 網路路徑中沒有任何單一失敗點。 透過在 ExpressRoute 中提供兩個不同位置的雙重 (2) 線路,以達到此目的。 「最大復原」的目標是要增強可用性,並確保關鍵工作負載的最高復原層級。

如需詳細資訊,請參閱設計和建構 Azure ExpressRoute 以進行復原

實作區域備援 ExpressRoute 閘道

在 Azure 可用性區域中實作區域備援虛擬網路閘道。 此方式可為虛擬網路閘道帶來復原能力、可擴縮性和更高的可用性。

潛在優點:提供 ExpressRoute 的區域性復原和備援

如需詳細資訊,請參閱在可用性區域中建立區域備援虛擬網路閘道

確保自動調整用於提升效能和復原能力

設定應用程式閘道時,建議您佈建自動調整以縮減和擴增,以回應需求變更。 這有助於將單一失敗元件的影響降到最低。

潛在優點:提高效能和復原能力。

如需詳細資訊,請參閱調整應用程式閘道 v2 和 WAF v2

ExpressRoute IP 路由接近指定限制

您的 ExpressRoute 線路即將達到其 IP 路由限制。 超過這些限制將會中斷連線。 一旦路由在限制範圍內時,連線性將會還原:定期監視路由計數。 探索虛擬 WAN RouteMap 以減少公告的 IP 路由。

潛在優勢:監視 IP 路由計數可防止連線能力問題,並確保穩定性。

如需詳細資訊,請參閱虛擬 WAN 常見問題 (機器翻譯)

避免將「流量管理員」放在「Front Door」之後

不建議使用 流量管理員 作為 Front Door 的其中一個來源,因為這可能會導致路由問題。 如果您需要高可用性架構中的這兩項服務,請一律將「流量管理員」放在「Azure Front Door」前面。

潛在優點:增加工作負載復原能力

如需詳細資訊,請參閱 Front Door 最佳做法

請考慮至少有兩個來源

多個來源可藉由將流量分散到應用程式的多個執行個體,以支援備援。 如果一個執行個體無法使用,則其他後端來源仍然可以接收流量。

潛在優點:增加工作負載復原能力

如需詳細資訊,請參閱 Azure Front Door 上的 Azure 架構架構檢視方塊

變更名為 GatewaySubnet 的 V1 閘道子網,因為它已保留給 VPN/Express Route

由於內部升級失敗,您的應用程式閘道在 2024 年 10 月之後面臨刪除的風險。 這是因為名為 Gatewaysubnet 的子網路已保留給 VPN/ExpressRoute。 若要解決,請變更子網路或移轉至 V2。 修正問題後,請等待一天,此訊息會自行消失

潛在優點:避免 應用程式閘道 V1 資源的管理中斷

如需詳細資訊,請參閱關於 應用程式閘道的常見問題

將 V1 閘道的子網路變更為目前包含 NAT 閘道的子網路

由於內部升級失敗,您的應用程式閘道可能會在 2024 年 10 月之後刪除。 這是因為它缺少專用子網路,且包含 NAT 閘道。 若要解決,請變更子網路、移除 NAT 閘道,或移轉至 V2。 修正問題後,請等待一天,此訊息會自行消失

潛在優點:避免 應用程式閘道 V1 資源的管理中斷

如需詳細資訊,請參閱關於 應用程式閘道的常見問題

重新啟用訂用帳戶以解除對 V1 閘道的內部升級

由於內部升級失敗,您的應用程式閘道在 2024 年 10 月之後面臨刪除的風險。 這是因為訂用帳戶處於非作用中狀態。 若要修正此問題,請啟用訂用帳戶。 修正問題之後,允許此訊息消失一天。

潛在優點:避免 應用程式閘道 V1 資源的管理中斷

如需詳細資訊,請參閱 重新啟用已停用的 Azure 訂用帳戶

容器的應用程式閘道

移轉至支援的 AGC 版本

適用於容器的應用程式閘道版本是使用預覽版本佈建的,不支援生產環境。 請確定您使用最新的 API 版本佈建新閘道。

潛在優點:確保生產工作負載的支援性和復原能力

如需詳細資訊,請參閱什麼是適用於容器的應用程式閘道?

建立標準搜尋服務 (2GB)

當您超過儲存配額時,編製索引作業會停止運作。 您快要超過 2GB 的儲存配額。 如果您需要更多記憶體,請建立標準搜尋服務或新增額外分割區。

潛在優點:處理更多資料的能力

如需詳細資訊,請參閱 https://aka.ms/azs/search-limits-quotas-capacity

建立標準搜尋服務 (50MB)

當您超過儲存配額時,編製索引作業會停止運作。 您即將超出 50MB 的儲存配額。 若要維護作業,請建立基本或標準搜尋服務。

潛在優點:處理更多資料的能力

如需詳細資訊,請參閱 https://aka.ms/azs/search-limits-quotas-capacity

新增更多分割區,以避免超過可用的儲存配額

當超出儲存配額時,您仍可進行查詢,但編製索引作業將停止運作。 您即將超出可用的儲存配額。 如果您需要更多儲存體,請新增額外的分割區。

潛在優點:能夠為其他資料編製索引

如需詳細資訊,請參閱 https://aka.ms/azs/search-limits-quotas-capacity

已啟用 Azure Arc 的 Kubernetes

升級至已啟用 Azure Arc 的最新代理程式版 Kubernetes

為獲得已啟用 Azure Arc 的最佳 Kubernetes 體驗、改進的穩定性和新功能,請升級至最新的代理程式版本。

潛在優點:已啟用 Arc 的 K8s 最新代理程式版本

如需詳細資訊,請參閱升級已啟用 Azure Arc 的 Kubernetes 代理程式

已啟用 Azure Arc 的 Kubernetes 組態

將 Microsoft Flux 擴充功能升級至最新的主要版本

Microsoft Flux 擴充功能已發行主要版本。 針對所有已啟用 Azure Arc 的 Kubernetes 和 Azure Kubernetes Service (AKS) 叢集,在 6 個月內規劃手動升級至 Microsoft Flux 最新主要版本,以取得持續支援和新功能。

潛在優點:持續支援和新功能

如需詳細資訊,請參閱已啟用 Azure Arc 的 Kubernetes 叢集可用的延伸模組

即將推出的 Microsoft Flux 延伸項目中斷性變更

Microsoft Flux 延伸項目經常會接收安全性與穩定性的更新。 即將推出的更新會與 OSS Flux 專案一致,藉由移除已被取代的欄位來修改 HelmRelease 和 HelmChart API。 為了避免工作負載中斷,需要採取必要的動作。

潛在優點:改善穩定性、安全性和新功能

如需詳細資訊,請參閱已啟用 Azure Arc 的 Kubernetes 叢集可用的延伸模組

將 Microsoft Flux 延伸模組升級至支援的版本

一或多個已啟用 Azure Arc 的叢集和 Azure Kubernetes 叢集上目前版本的 Microsoft Flux 不受支援。 要取得安全性修補程式、錯誤修復和 Microsoft 支援服務,升級至支援的版本。

潛在優點:取得安全性修補程式、BUG 修正和 Microsoft 支援

如需詳細資訊,請參閱已啟用 Azure Arc 的 Kubernetes 叢集可用的延伸模組

已啟用 Azure Arc 的伺服器 (英文)

升級至最新版的 Azure Connected Machine 代理程式

Azure Connected Machine 代理程式會定期更新,並修正錯誤、增強穩定性和新增功能。 為獲得最佳的 Azure Arc 體驗,將您的代理程式升級至最新版本。

潛在優點:改善穩定性和新功能

如需詳細資訊,請參閱管理和維護 Connected Machine 代理程式

Azure Cache for Redis

增加分散記憶體保留

分散和記憶體壓力可能會導致可用性事件。 為了協助降低在高記憶體壓力下執行的快取失敗,請透過 [進階設定] 選項中可用的 maxfragmentationmemory-reserved 設定,增加片段的記憶體保留。

潛在優點:避免您的快取有高記憶體分散時的可用性事件

如需詳細資訊,請參閱如何設定 Azure Cache for Redis

設定 Cache for Redis 執行個體的異地複寫,以提高應用程式的持久性

異地復寫可針對快取資料進行災害復原,即使在不太可能發生大範圍區域性失敗的情況下也一樣。 這對於任務關鍵性應用程式而言非常重要。 我們建議您設定進階 Azure Cache for Redis 執行個體的被動異地複寫

潛在優點:異地複寫可為快取的資料提供災害復原功能。

如需詳細資訊,請參閱設定進階 Azure Cache for Redis 執行個體的被動異地複寫

Azure 容器應用程式

重新建立您的容器應用程式環境,以避免 DNS 問題

您的容器應用程式環境存在潛在的網路問題,可能會導致 DNS 問題。 我們建議您建立新的容器應用程式環境,在新的環境中重新建立您的容器應用程式,並刪除舊的容器應用程式環境。

潛在優點:避免容器應用程式環境中的 DNS 失敗。

如需詳細資訊,請參閱快速入門:使用 Azure 入口網站部署您的第一個容器應用程式

更新自訂網域憑證

您上傳的自訂網域憑證即將到期。 為防止可能的服務停機,請更新您的憑證,並且為容器應用程式上傳新憑證。

潛在優點:您的服務不會因為憑證過期而失敗。

如需詳細資訊,請參閱 Azure 容器應用程式中的自訂網域名稱和攜帶您自己的憑證

偵測到導致無法更新受控憑證的問題。

我們偵測到容器應用程式所使用的受控憑證無法自動更新。 請遵循文件連結,確定自訂網域的 DNS 設定正確無誤。

潛在優點:避免因憑證過期而停機。

如需詳細資訊,請參閱 Azure 容器應用程式中的自訂網域名稱和免費受控憑證

提高容器化應用程式的最低複本計數

對 Azure 容器應用程式容器化應用程式設定的最低複本計數可能太低,這可能會導致復原、延展性和負載平衡問題。 為獲得更好的可用性,請考慮增加最低複本計數。

潛在優點:提供容器應用程式更好的可用性。

如需詳細資訊,請參閱在 Azure 容器應用程式中設定調整規則

Azure Cosmos DB

使用分割區索引鍵來設定 Azure Cosmos DB 容器

當 Azure Cosmos DB 非分割集合達到其佈建的儲存配額時,您會失去新增資料的能力。 Cosmos DB 非分割集合已接近其佈建的儲存配額。 將這些集合遷移至具有分割區索引鍵定義的新集合,讓服務可以自動相應放大。

潛在優點:提高儲存體或要求費率,以順暢調整容器而不受限制

如需詳細資訊,請參閱 Azure Cosmos DB 中的資料分割與水平放大

在程式碼中使用靜態 Cosmos DB 用戶端執行個體,並快取資料庫和集合的名稱

帳戶上的大量中繼資料作業會會導致速率限制。 中繼資料作業具有系統保留的要求單位 (RU) 限制。 在程式碼中使用靜態 Cosmos DB 用戶端執行個體,並快取資料庫和集合的名稱,以避免速率受限於中繼資料作業。

潛在優點:最佳化您的 RU 使用量並避免速率限制

如需詳細資訊,請參閱 Azure Cosmos DB 和 .NET SDK v2 的效能秘訣

檢查託管加密金鑰的連結 Azure Key Vault

當 Azure Cosmos DB 帳戶無法存取其託管加密金鑰的連結 Azure Key Vault 時,可能會發生資料存取和安全性問題。 Azure Key Vault 的設定會讓您的 Cosmos DB 帳戶無法與金鑰保存庫聯繫,以存取您的受控加密金鑰。 如果您最近執行了金鑰輪替,請確定先前的金鑰或金鑰版本仍維持啟用狀態並可供使用,直到 Cosmos DB 完成輪替為止。 先前的金鑰或金鑰版本可在 24 小時後停用,或在 Azure Key Vault 稽核記錄不再顯示 Azure Cosmos DB 中屬於該金鑰或金鑰版本的活動之後停用。

潛在優點:更新您的設定以繼續使用客戶自控金鑰及存取您的資料

如需詳細資訊,請參閱使用 Azure Key Vault,為 Azure Cosmos DB 帳戶設定客戶自控金鑰

在 Azure Cosmos DB 容器上設定一致的索引模式

以延遲索引模式設定的 Azure Cosmos 容器會以異步方式更新,可改善寫入效能,但可能會影響查詢的有效性。 您的容器設定了延遲索引模式。 如果查詢有效性至關重要,請使用一致的索引模式進行立即索引更新。

潛在優點:改進查詢結果一致性和可靠性

如需詳細資訊,請參閱管理 Azure Cosmos DB 中的索引編製原則

Hotfix - 升級至 2.6.14 版的 Async Java SDK v2 或 Java SDK v4

Azure Cosmos DB Async Java SDK v2 的 2.6.13 版 (和更舊版本) 有重大 BUG,會在達到全域邏輯序號 (LSN) 大於最大整數值時造成錯誤。 當 Azure Cosmos DB 容器的存留期內發生大量交易後,服務就會在您不知情的情況下發生錯誤。 注意:這是 Async Java SDK v2 的重大 Hotfix,強烈建議您遷移至 Java SDK v4

潛在優點:如果未採取行動,所有的建立、讀取、更新和刪除作業可能都會開始失敗,並出現 NumberFormatException

如需詳細資訊,請參閱Azure Cosmos DB Async Java SDK for API for NoSQL (舊版):版本資訊與資源

Azure Cosmos DB Java SDK v4 的 4.15 版和更舊版本有重大 BUG,會在達到全域邏輯序號 (LSN) 大於最大整數值時造成錯誤。 當 Azure Cosmos DB 容器的存留期內發生大量交易後,服務就會在您不知情的情況下造成此情況。 升級至目前建議的 Java SDK v4 版本,以避免此問題

潛在優點:如果未採取行動,所有的建立、讀取、更新和刪除作業可能都會開始失敗,並出現 NumberFormatException

如需詳細資訊,請參閱Azure Cosmos DB Java SDK v4 for API for NoSQL:版本資訊與資源

使用新的 3.6+ 端點連線至已升級的「適用於 MongoDB 的 Azure Cosmos DB API」帳戶

您的部分應用程式使用舊版 3.2 端點 ([accountname].documents.azure.com) 連線至已升級的「適用於 MongoDB 的 Azure Cosmos DB API」帳戶。 請使用新的端點 - [accountname].mongo.cosmos.azure.com (或其在主權、政府或受限雲端中的對等項目)。

潛在優點:運用適用於 MongoDB 的 Azure Cosmos DB API 3.6+ 版的最新功能

如需詳細資訊,請參閱 Azure Cosmos DB for MongoDB (4.0 伺服器版本):支援的功能和語法

將 Azure Cosmos DB API for MongoDB 帳戶升級至 4.2 版,以節省查詢/儲存體成本並享用新的功能

Azure Cosmos DB API for MongoDB 帳戶有資格升級至 4.2 版。 升級至 4.2 版後可以利用新的儲存格式,使儲存成本最多降低 55%,查詢成本最多降低 45%。 4\.2 版還包含許多額外的功能,例如多文件交易。

潛在優點:改進了可靠性、查詢/儲存效率、效能及新功能

如需詳細資訊,請參閱升級 API 版本的 Azure Cosmos DB for MongoDB 帳戶

在適用於 MongoDB 帳戶的 Azure Cosmos DB 的 API 上,啟用伺服器端重試 (SSR)

當帳戶擲回 TooManyRequests 錯誤並出現 16500 錯誤碼時,啟用伺服器端重試 (SSR) 有助於緩解問題。

潛在優點:防止節流並提升查詢的可靠性和效能

將第二個區域新增至 Azure Cosmos DB 上的生產工作負載

在單一區域中執行 Azure Cosmos DB 上的生產工作負載,可能發生可用性問題,一些 Cosmos DB 帳戶似乎就是這種情況。 將其設定為至少跨兩個 Azure 區域,藉以提高其可用性。 注意:更多區域會產生額外的成本。

潛在優點:改善生產工作負載的可用性

如需詳細資訊,請參閱 Azure Cosmos DB for NoSQL 中的高可用性 (可靠性)

將舊版的 Azure Cosmos DB SDK 升級為最新版本

使用舊版 SDK 的 Azure Cosmos DB 帳戶缺乏最新的修正和改進。 您的 Azure Cosmos DB 帳戶目前使用舊版的 SDK。 如需取得最新修正、提升效能及取得新功能,請升級至最新版本。

潛在優點:改進了可靠性、效能並增加了新功能

如需詳細資訊,請參閱 Azure Cosmos DB 文件

將過時的 Azure Cosmos DB SDK 升級為最新版本

使用舊版 SDK 的 Azure Cosmos DB 帳戶缺乏最新的修正和改進。 您的 Azure Cosmos DB 帳戶使用過時的 SDK 版本。 建議您升級至最新版本,以取得最新修正、提升效能及取得新功能。

潛在優點:改進了可靠性、效能並增加了新功能

如需詳細資訊,請參閱 Azure Cosmos DB 文件

啟用 Cosmos DB 帳戶的服務受控容錯移轉

啟用 Cosmos DB 帳戶的服務受控容錯移轉,以確保帳戶的高可用性。 服務受控容錯移轉會在主要區域中斷時,自動將寫入區域切換至次要區域。 這確保應用程式在不停機的情況下繼續運作。

潛在優點:Azure 的服務管理容錯移轉功能可透過自動執行容錯移轉程序、減少停機時間並提高復原能力來增強系統可用性。

如需詳細資訊,請參閱 Azure Cosmos DB for NoSQL 中的高可用性 (可靠性)

為您的生產工作負載啟用 HA

許多具有一致工作負載的叢集未啟用高可用性 (HA)。 建議您從 Azure 入口網站中的 [調整] 頁面啟用 HA,以防止發生非預期節點失敗時造成資料庫停機,並符合 SLA 保證的資格。

潛在優點:啟用 HA 以避免節點意外失敗時資料庫停機

如需詳細資訊,請參閱調整及設定 Azure Cosmos DB for MongoDB V 核心叢集

為多區域 Cosmos DB 帳戶啟用區域備援

這項建議建議為多區域 Cosmos DB 帳戶啟用區域備援,以增強高可用性,並在發生區域性中斷時降低資料遺失的風險。

潛在優點:改善了高可用性並降低了資料遺失的風險

如需詳細資訊,請參閱 Azure Cosmos DB for NoSQL 中的高可用性 (可靠性)

在另一個 Azure 區域中新增至少一個資料中心

Azure Managed Instance for Apache Cassandra 叢集被指定為生產叢集,但目前部署在單一 Azure 區域中。 針對生產叢集,我們建議在另一個 Azure 區域中新增至少一個資料中心,以防範災害復原案例。

潛在優點:確保應用程式在災害復原時有另一個區域

如需詳細資訊,請參閱高可用性和災害復原的最佳做法

避免控制平面作業的速率受限

我們透過資源提供者在您的帳戶發現大量控制平面作業。 超過連續 5 分鐘期間內持續層級上記錄限制的要求,可能會遇到在 Azure Cosmos DB 資源上進行節流處理的要求,以及失敗或不完整的作業。

潛在優點:最佳化控制平面作業,並避免因速率限制而導致作業失敗

如需詳細資訊,請參閱 Azure Cosmos DB 服務配額

Azure 資料總管

解決虛擬網路問題

服務因為虛擬網路 (VNet) 問題而無法安裝或繼續。 若要解決此問題,請遵從下列疑難排解指南中的步驟。

潛在優點:改進可靠性、可用性、效能並增加新功能

如需詳細資訊,請參閱針對虛擬網路中 Azure 資料總管叢集的存取、擷取和作業進行疑難排解

新增 'Microsoft.Kusto/clusters' 的子網路委派

如果未委派子網路,相關聯的 Azure 服務將無法在其中運作。 您的子網路沒有必要委派。 委派 'Microsoft.Kusto/clusters' 的子網路。

潛在優點:改進可靠性、可用性、效能並增加新功能

如需詳細資訊,請參閱什麼是子網路委派?

適用於 MySQL 的 Azure 資料庫

高可用性 - 將主索引鍵新增至目前沒有主索引鍵的資料表。

我們的內部監視系統在高可用性待命伺服器上發現重大複寫延遲。 此延遲主要是因為待命伺服器在缺少主索引鍵的資料表上重新執行轉送記錄所造成。 若要解決此問題並遵守最佳做法,建議將所有主索引鍵新增至所有資料表。 完成後,接著繼續停用,然後重新啟用高可用性以減輕問題。

潛在優點:藉由實作此方法,待命伺服器將會受到防護,避免任何資料表上沒有主索引鍵所造成之高複寫延遲的負面影響。 這種方法有助於縮短容錯移轉時間,最終支援維護商務持續性的目標。

如需詳細資訊,請參閱針對適用於 MySQL 的 Azure 資料庫 - 彈性伺服器中的複寫延遲進行疑難排解

複寫 - 將主索引鍵新增至目前沒有主索引鍵的資料表

我們的內部監視觀察到複本伺服器存在嚴重的複寫延遲,因為複本伺服器正在一個缺少主索引鍵的資料表上重新執行轉送記錄。 為了確保複本伺服器可以有效地與主伺服器同步並了解變更,請將主索引鍵新增至主要伺服器中的資料表,然後重新建立複本伺服器。

潛在優點:藉由實作此方法,複本伺服器將會達到與主要伺服器接近同步處理的狀態。

如需詳細資訊,請參閱針對適用於 MySQL 的 Azure 資料庫 - 彈性伺服器中的複寫延遲進行疑難排解

適用於 PostgreSQL 的 Azure 資料庫

移除非使用中的邏輯複寫位置 (重要)

非使用中的邏輯複寫位置可能會導致伺服器效能降低,並因為預寫記錄檔 (WAL) 檔案保留期和快照集檔案的產生而無法使用。 適用於 PostgreSQL 的 Azure 資料庫彈性伺服器可能具有非使用中邏輯複寫位置。 此問題需要立即關注。 刪除非作用中的複寫位置,或開始使用這些位置的變更,讓位置的記錄序號 (LSN) 累進,並接近伺服器目前的 LSN。

潛在優點:移除非使用中的邏輯複寫位置來改善 PostgreSQL 可用性

如需詳細資訊,請參閱適用於 PostgreSQL 的 Azure 資料庫 - 彈性伺服器中的邏輯複寫和邏輯解碼

移除非使用中的邏輯複寫位置

當 Orcas PostgreSQL 彈性伺服器具有非使用中邏輯複寫位置時,可能會由於預寫記錄 (WAL) 檔案保留期和快照檔案的產生而導致伺服器效能降低和不可用。 此問題需要立即關注。 刪除非作用中的複寫位置,或開始使用這些位置的變更,讓位置的記錄序號 (LSN) 累進,並接近伺服器目前的 LSN。

潛在優點:移除非使用中的邏輯複寫位置來改善 PostgreSQL 可用性

如需詳細資訊,請參閱邏輯解碼

設定地區備援備份儲存體

設定 GRS,確保資料庫在發生失敗或災害時也能滿足可用性和持久性目標。

潛在優點:確保能從區域性失敗或災害中復原。

如需詳細資訊,請參閱適用於 PostgreSQL 的 Azure 資料庫 - 彈性伺服器中的備份與還原

定義在離峰時段期間發生的自訂維護時段

指定維護排程的喜好設定時,您可以挑選星期幾和時間範圍。 若未指定,系統將會依據您伺服器的區域時間挑選晚上 11 點和早上 7 點之間的時間。 挑選使用量很低的日期和時間。

潛在優點:設定維護視窗可避免在系統高峰期間進行維護。

如需詳細資訊,請參閱適用於 PostgreSQL 的 Azure 資料庫 - 彈性伺服器中的排程維護

Azure IoT 中樞

將 Microsoft Edge 裝置執行階段升級至 IoT 中樞支援的版本

當邊緣裝置使用過時的版本時,可能會發生效能降低的情況。 建議您升級至最新支援的 Azure IoT Edge 執行階段版本。

潛在優點:對您的邊緣裝置使用最新的支援版本來確保業務持續性

如需詳細資訊,請參閱更新 IoT Edge

將裝置用戶端 SDK 升級至支援的 IotHub 版本

當裝置使用過時的 SDK 時,可能會發生效能降低的情況。 部分或所有裝置都使用過時的 SDK。 建議您升級至支援的 SDK 版本。

潛在優點:對您的裝置使用支援的 SDK 來確保業務持續性

如需詳細資訊,請參閱 Azure IoT 中樞 SDK

偵測到 IoT 中樞的潛在裝置風暴

有兩個或更多裝置嘗試使用相同的裝置識別碼認證連線至 IoT 中樞時,就可能發生此狀況。 當第二個裝置 (B) 連線時,會導致第一個裝置 (A) 中斷連線。 然後,(A) 嘗試重新連線,導致 (B) 中斷連線。

潛在優點:改善裝置的連線能力

如需詳細資訊,請參閱了解和解決 Azure IoT 中樞錯誤

將 IoT 中樞裝置更新 SDK 升級為支援的版本

當 IoT 中樞裝置更新執行個體使用過時版本的 SDK 時,無法取得最新的升級。 如需取得最新修正、提升效能及取得新功能,請升級至最新 IoT 中樞裝置更新 SDK 版本。

潛在優點:使用支援的 SDK 來確保業務持續性

如需詳細資訊,請參閱什麼是 IoT 中樞裝置更新?

新增 IoT 中樞單位或增加 SKU 層級

當 IoT 中樞超過每日訊息配額時,可能會發生作業和成本問題。 若要確保未來作業順暢,請新增單位或增加 SKU 層級。

潛在優點:IoT 中樞可以再次接收訊息。

如需詳細資訊,請參閱了解和解決 Azure IoT 中樞錯誤

Azure Kubernetes Service (AKS)

啟用系統節點集區的自動調整

在系統節點集區上啟用自動調整功能,以確保即使在高負載期間也會排程您的系統 Pod。

潛在優點:對系統節點集區啟用自動調整器可確保系統 Pod 能夠被排程且叢集可以正常運作。

如需詳細資訊,請參閱使用 Azure Kubernetes Service (AKS) 中的叢集自動調整程式

在系統節點集區中至少有 2 個節點

請確定您的系統節點集區至少有 2 個節點,系統 Pod 才能以可靠的方式運作。 使用單一節點時,若節點或硬體失敗,叢集可能失敗。

潛在優點:擁有 2 個節點可確保抵抗節點失敗的復原能力。

如需詳細資訊,請參閱在 Azure Kubernetes Service (AKS) 中管理系統節點集區

建立專用的系統節點集區

沒有專用系統節點集區的叢集較不可靠。 我們建議您將系統節點集區專用於只提供重要的系統 Pod,以防止系統與競爭使用者 Pod 之間的資源耗盡。 在集區上使用 CriticalAddonsOnly=true:NoSchedule 污點強制執行此行為。

潛在優點:透過防止核心系統 Pod 的資源短缺來確保叢集可靠性

如需詳細資訊,請參閱在 Azure Kubernetes Service (AKS) 中管理系統節點集區

確定 B 系列虛擬機器 (VM) 不會用於生產環境

當叢集有一或多個使用非建議高載 VM SKU 的節點集區,無法保證 100% 的完整 vCPU 功能。 確定 B 系列 VM 不會用於生產環境。

潛在優點:一致效能的最佳做法

如需詳細資訊,請參閱 Bv1 大小資料數列 (機器翻譯)

Azure NetApp Files

設定 Azure Netapp Files AD 連接器的 AD DS 網站

如果 Azure NetApp Files 無法連線到指派的 AD DS 站台網域控制站,網域控制站探索程序會查詢所有網域控制站。 可能使用無法連線的網域控制站,而導致磁碟區建立、用戶端查詢、驗證和 AD 連線修改的問題。

潛在優點:使用 Azure Netapp Files 最佳化 DNS 連線能力

如需詳細資訊,請參閱了解適用於 Azure NetApp Files 的 Active Directory 網域服務網站設計與規劃指導方針

確定指派給 Microsoft.NetApp 代理子網路的角色具有子網路讀取權限

管理 Azure NetApp 檔案資源所需的角色,在委派給 Microsoft.NetApp 的子網路必須具有「Microsoft.network/virtualNetworks/subnets/read」權限。如果角色、自訂或內建沒有此權限,則磁碟區建立將會失敗

潛在優點:透過確保子網路/讀取權限來防止磁碟區建立失敗

檢閱 SAP 組態以取得與 Azure NetApp Files 搭配使用的逾時值

與 Azure NetApp Files 搭配使用時的 SAP 高可用性依賴設定適當的逾時值,以避免中斷您的應用程式。 請檢閱「深入了解」連結,以確保您的設定符合文件中所說明的逾時值。

潛在優點:改善 ANF 上 SAP 應用程式的復原能力

如需詳細資訊,請參閱使用 Azure 來裝載及執行 SAP 工作負載案例

為您的 Azure NetApp Files 資源實作災害復原策略

若要避免在區域或區域性災害期間發生資料或功能遺失,請實作常見的災害復原技術,例如跨區域複寫或跨區域複寫,適用於您的 Azure NetApp Files 磁碟區。

潛在優點:使用 Azure NetApp Files 複寫功能輕鬆管理災害復原

如需詳細資訊,請參閱了解 Azure NetApp Files 中的資料保護和災害復原選項

Azure Netapp Files - 啟用 SMB 磁碟區的連續可用性

針對持續可用性,建議您為 Azure Netapp Files 啟用伺服器訊息區 (SMB) 磁碟區。

潛在優點:透過啟用 SMB 磁碟區的連續可用性來防止應用程式中斷

如需詳細資訊,請參閱於現有 SMB 磁碟區啟用持續可用性

Azure Site Recovery

啟用復原服務保存庫的虛刪除

虛刪除可協助您在刪除後於復原服務保存庫中將備份資料保留額外的持續時間,讓您有機會在永久刪除前先加以擷取。

潛在優點:在意外刪除的情況下,協助復原備份資料

如需詳細資訊,請參閱 Azure 備份的虛刪除

啟用復原服務保存庫的跨區域還原

跨區域還原 (CRR) 可讓您還原次要區域 (即 Azure 配對區域) 中的 Azure VM,協助進行災害復原。

潛在優點:作為其中一個還原選項,跨區域還原 (CRR) 可讓您在次要區域 (也就是 Azure 配對區域) 中還原 Azure VM。

如需詳細資訊,請參閱如何在 Azure 入口網站中還原 Azure VM 資料

Azure Spring Apps

將應用程式組態服務升級至 Gen 2

我們注意到您仍在使用應用程式設定服務 Gen1,其將於 2024 年 4 月終止支援。 相較於 Gen1,應用程式設定服務 Gen2 可提供更佳的效能,從 Gen1 升級至 Gen2 是零停機,我們建議儘快升級。

潛在優點:更高的穩定性和可用性

如需詳細資訊,請參閱使用 Tanzu 的應用程式設定服務

Azure SQL Database

針對 SQL Database 啟用跨區域災害復原

在發生區域性中斷時,為 Azure SQL Database 啟用跨區域災害復原,以保持商務持續性。

潛在優點:啟用災害復原會為主要資料庫建立一個持續同步的可讀取次要資料庫。

如需詳細資訊,請參閱使用 Azure SQL Database 的商務持續性概觀

啟用 Azure SQL 資料庫的區域備援,以達到高可用性和復原能力。

若要達到高可用性和復原能力,請為 SQL Database 或彈性集區啟用區域備援,以使用可用性區域,並確保資料庫或彈性集區能夠從區域性失敗中復原。

潛在優點:啟用區域備援可確保 Azure SQL Database 對於區域性的硬體和軟體失敗具有復原性,而且復原對應用程式是透明的。

如需詳細資訊,請參閱透過備援的可用性 - Azure SQL Database

Azure Stack HCI

升級至 Arc 啟用的 AKS 最新版本

升級至 Azure Arc 啟用的 AKS API/SDK 的最新版本,以獲得新功能和改進的穩定性。

潛在優點:Azure Arc 啟用的最新版 AKS,並具備新功能和改善穩定性。

如需詳細資訊,請參閱 https://azure.github.io/azure-sdk/releases/latest/index.html

升級至 Arc 啟用的 AKS 最新版本

升級至 Azure Arc 啟用的 AKS API/SDK 的最新版本,以獲得新功能和改進的穩定性。

潛在優點:Azure Arc 啟用的最新版 AKS,並具備新功能和改善穩定性。

如需詳細資訊,請參閱 https://azure.github.io/azure-sdk/releases/latest/index.html

傳統部署模型儲存體

必要的動作:在 2024 年 8 月 30 日前移轉傳統儲存體帳戶。

將傳統儲存體帳戶移轉至 Azure Resource Manager 以確保業務持續性。 Azure Resource Manager 將提供所有相同的功能,外加一致的管理層、資源群組,以及新功能和更新的存取權。

潛在優點:確保能夠透過移轉您的傳統儲存體帳戶來管理您的資料

傳統部署模型虛擬機器

在 2024 年 8 月 31 日之前移轉 雲端服務 (傳統)

雲端服務 (傳統) 即將淘汰。 在 2024 年 8 月 31 日之前移轉,以避免任何資料或商務持續性遺失。

潛在優點:您的服務的持續性

如需詳細資訊,請參閱將 Azure 雲端服務 (傳統) 移轉至 Azure 雲端服務 (延伸支援)

認知服務

升級您的應用程式,以使用 Azure OpenAI 的最新 API 版本

具有舊版 API 的 Azure OpenAI 資源缺少最新的特性和功能。 建議您一律使用最新穩定 REST API 版本。

潛在優點:我們的新 API 版本包含最新、最強大的特性和功能。

如需詳細資訊,請參閱 Azure OpenAI 服務 REST API 參考

超過此資源的配額、等候或升級以解除封鎖

如果超過資源的配額,您的資源就會遭到封鎖。 您可以等候配額獲得補充,或立即再次使用資源,將其升級至付費 SKU。

潛在優點:如果您升級至付費 SKU,就能立即再次使用資源。

如需詳細資訊,請參閱規劃和管理 Azure AI Studio 的成本

Container Registry

若為生產環境工作負載,請使用進階版 SSD

「進階版」登錄提供最多的內含儲存體、並行作業和網路頻寬,可應付高容量案例。 進階版分層也會新增異地複寫、可用性區域支持、內容信任、客戶自控密鑰和私人端點等功能。

潛在優點:進階層提供最高的效能、調整和復原選項

如需詳細資訊,請參閱 Azure Container Registry 服務層級

確定異地複寫已啟用復原功能

異地複寫可讓工作負載跨區域使用單一映像、標記和登錄名稱、提供網路關閉登錄存取、降低資料傳輸成本,以及在發生區域性中斷時區域登錄恢復能力。 進階服務層級中僅提供這項功能。

潛在優點:改善了復原能力和提取效能、簡化登錄管理並降低了資料傳輸成本

如需詳細資訊,請參閱 Azure Container Registry 中的異地複寫

內容傳遞網路

Azure CDN From Edgio,受控憑證更新失敗。 需要其他驗證。

Azure CDN from Edgio 採用 CNAME 委派來更新包含 DigiCert 的憑證,以進行受控憑證更新。 自訂網域必須解析為 azureedge.net 端點,才能成功使用 DigiCert 進行自動更新程序。 請確定您的自訂網域 CNAME 和 CAA 記錄已正確設定。 如需進一步的協助,請提交支援案例至 Azure,以重新嘗試更新要求。

潛在優點:確保服務可用性。

更新過期的 Azure Front Door 客戶憑證,以避免服務中斷

當 Azure Front Door 標準和進階版配置檔的客戶憑證過期時,您可能會發生服務中斷。 若要避免服務中斷,請在認證到期之前續訂認證。

潛在優點:確保服務可用性。

如需詳細資訊,請參閱透過使用 Azure 入口網站,在 Azure Front Door 自訂網域上設定 HTTPS

重新驗證 Azure Front Door 受控憑證更新的網域擁有權

Azure Front Door (AFD) 無法自動更新受控憑證,因為網域不是對應至 AFD 端點的 CNAME。 為要自動更新的受控憑證重新驗證網域所有權。

潛在優點:未定義

如需詳細資訊,請參閱使用 Azure 入口網站在 Azure Front Door 上設定自訂網域

將 Azure Front Door 客戶憑證的祕密版本切換為「最新」

將 Azure Front Door (AFD) 客戶憑證祕密設定為「最新」,讓 AFD 可參考 Azure Key Vault 中最新的祕密版本,並讓祕密可自動輪替。

潛在優點:最新版本可以自動輪換。

如需詳細資訊,請參閱透過使用 Azure 入口網站,在 Azure Front Door 自訂網域上設定 HTTPS

藉由將 DNS TXT 記錄新增至 DNS 提供者來驗證網域擁有權

將 DNS TXT 記錄新增至 DNS 提供者,藉以驗證網域擁有權。 透過 TXT 記錄驗證網域所有權可增強安全性,並確保正確控制您的網域。

潛在優點:確保服務可用性。

如需詳細資訊,請參閱使用 Azure 入口網站在 Azure Front Door 上設定自訂網域

Data Factory

在 Azure Data Factory 中實作跨區域備援的 BCDR 策略

實作 BCDR 策略可增強高可用性並降低資料遺失風險

潛在優點:改善高可用性並降低了資料遺失的風險

如需詳細資訊,請參閱 Azure Data Factory 和 Azure Synapse Analytics 管線的 BCDR - Azure 架構中心

在您的 SHIR 上啟用自動升級

已停用自我裝載整合執行階段的自動升級。 了解您未在自我裝載整合執行階段上取得最新的變更和錯誤修正。 評論它們以啟用 SHIR 自動升級

潛在優點:取得自我裝載整合執行階段的最新變更和 BUG 修正

如需詳細資訊,請參閱 自我裝載整合運行時間自動更新和到期通知

流體轉送

應升級 Azure 流體轉送用戶端程式庫

如果使用舊的用戶端程式庫叫用 Azure 流體轉送服務,它可能會導致應用程式問題。 為確保您的應用程式可繼續運作,您的 Azure 流體轉送用戶端程式庫現在應升級至最新版本。 升級將提供最新的功能,以及效能和穩定性方面的增強功能。

潛在優點:改進了可靠性

如需詳細資訊,請參閱 Fluid Framework 版本的版本相容性

HDInsight

卸除並重新建立 HDInsight 叢集來套用重大更新 (憑證輪換第 2 輪)

HDInsight 服務已嘗試在執行中的叢集上,套用重要的憑證更新。 不過,由於某些自訂組態變更,我們無法在所有叢集上都套用更新。 為防止這些叢集狀況不良且無法使用,請卸除並重新建立您的叢集。

潛在優點:確保叢集的健康情況和穩定性

如需詳細資訊,請參閱使用 Apache Hadoop、Apache Spark、Apache Kafka 及其他工具在 HDInsight 中設定叢集

非 ESP ABFS 叢集 [Word 可讀取叢集權限]

計畫引進非 ESP ABFS 叢集的變更,這會限制非 Hadoop 群組使用者,使其無法在進行儲存體作業時執行 Hadoop 命令。 這項變更是在提升叢集安全性狀態。 客戶必須在 2023 年 9 月 30 日之前規劃更新。

潛在優點:此變更是為了改善叢集安全性態勢

如需詳細資訊,請參閱 Azure HDInsight 發行備註

重新啟動 Kafka 叢集磁碟上的訊息代理程式

當 HDInsight 叢集中 Kafka 訊息代理程式使用的資料磁碟幾乎已滿時,Apache Kafka 訊息代理程式的程序無法啟動並失敗。 若要減輕問題,請尋找每個主題的保留時間,備份較舊的檔案並重新啟動訊息代理程式。

潛在優點:避免 Kafka 訊息 Broker 問題

如需詳細資訊,請參閱案例:訊息代理程式狀況不良或因磁碟空間已滿的問題而無法重新啟動

叢集名稱長度更新

叢集名稱的最大長度將從 59 個字元變更為 45 個字元,以改善叢集的安全性態勢。 這項變更將於 2023 年 9 月 30 日實施。

潛在優點:HDInsight 的安全性態勢改善

如需詳細資訊,請參閱 Azure HDInsight 發行備註

將您的叢集升級至最新的 HDInsight 映像

一年前建立的叢集沒有最新的映像升級。 您的叢集是在 1 年前建立的。 在最佳做法中,建議您使用最新的 HDInsight 映像,以獲得最佳開放原始碼更新、Azure 更新和安全性修正。 叢集升級的建議最大持續時間小於六個月。

潛在優點:取得最新的修正和功能

如需詳細資訊,請參閱開始建立叢集之前,請考慮下列幾點。

升級 HDInsight 叢集

未使用最新映像的叢集沒有最新的升級。 您的叢集未使用最新的映像。 我們建議您使用最新版的 HDInsight 映像,以獲得最佳的開放原始碼更新、Azure 更新和安全性修正。 HDInsight 每 30 到 60 天會發行一次。

潛在優點:取得最新的修正和功能

如需詳細資訊,請參閱 Azure HDInsight 發行備註

無法連線到閘道或虛擬機器

我們偵測到網路問題故障,表示閘道或虛擬機器無法連線。 確認所有叢集主機的可用性。 重新啟動虛擬機器以復原。 如果需要進一步協助,歡迎連絡 Azure 支援以取得協助。

潛在優點:改善了可用性

VM 代理程式為 9.9.9.9。 升級叢集。

我們的記錄表明,您的一個或多個叢集正在使用日期為 2022 年 2 月或更早的影像 (影像為 2202xxxxxx 或更低的版本)。 使用 2022 年 2 月或更早的影像的 HDInsight 叢集存在潛在的可靠性問題。請考慮使用最新的影像重建叢集。

潛在優點:改進了調整和網路連線的可靠性

媒體服務

增加媒體服務配額或限制

當媒體帳戶達到配額限制時,可能會中斷服務。 若要避免任何服務中斷,請檢閱資產、內容金鑰原則和串流原則的目前使用量,以及增加接近達到限制之實體的配額限制。 您可以開啟票證並新增相關詳細資料,要求增加配額限制。 提示:請勿為了嘗試取得更高的限制而建立其他 Azure 媒體帳戶。

潛在優點:避免客戶因超過配額限制而導致服務中斷。

如需詳細資訊,請參閱 Azure 媒體服務配額和限制

服務匯流排

使用服務匯流排進階層來改善復原能力

執行重要應用程式時,服務匯流排進階層在 CPU 和記憶體層級提供較佳資源隔離,提高可用性。 它還支援異地災害復原功能,能夠更輕鬆地從區域災害復原,而不需要變更應用程式設定。

潛在優點:服務匯流排進階層透過 CPU 和記憶體資源隔離以及異地災害復原提供更好的復原能力

如需詳細資訊,請參閱服務匯流排進階傳訊層級

使用服務匯流排自動調整功能在進階層改善復原能力

執行重要應用程式時,啟用自動調整功能可讓您有足夠的容量來處理應用程式上的負載。 執行正確的資源量,可以減少節流,並提供更佳的使用者體驗。

潛在優點:啟用自動調整可防止使用者受到容量限制

如需詳細資訊,請參閱自動更新 Azure 服務匯流排命名空間的傳訊單位

Azure 虛擬機器上的 SQL Server

為虛擬機器上的 SQL 啟用 Azure 備份

為實現使用 SQL AG 整合的零基礎結構備份、時間點還原和集中管理優勢,請使用 Azure 備份為虛擬機器上的 SQL 資料庫啟用備份。

潛在優點:在備份、集中式管理、AG 整合和時間點還原等方面皆無需基礎結構的 SQL 感知備份

如需詳細資訊,請參閱關於 Azure VM 中的 SQL Server 備份

儲存體

將受控磁碟用於達到容量限制的儲存體帳戶

儲存體帳戶中的進階 SSD 非受控磁碟即將達到進階儲存體 容量限制時,可能會發生失敗。 若要避免在達到此限制時發生失敗,請移轉至沒有帳戶容量限制的受控磁碟。 您可以透過入口網站在 5 分鐘內完成此移轉。

潛在優點:避免當帳戶達到容量限制時的調整問題

如需詳細資訊,請參閱標準儲存體帳戶的可擴縮性和效能目標

設定 blob 備份

Azure blob 備份保護資料免遭意外或惡意刪除。 建議您設定 blob 備份。

潛在優點:保護資料免遭意外或惡意刪除

如需詳細資訊,請參閱 Azure Blob 備份概觀

訂用帳戶

開啟 Azure 備份,為資料取得簡單、可靠且符合成本效益的保護措施

若要讓保護資訊與應用程式,請按一下 [backup from Azure] \(從 Azure 備份\)。 啟用 Azure 備份,以針對各種工作負載取得符合成本效益的保護措施,包括 VM、SQL 資料庫、應用程式與檔案共用。

潛在優點:確保您的關鍵業務應用程式受到保護

如需詳細資訊,請參閱 Azure 備份文件 - Azure 備份

建立 Azure 服務健康狀態警示

Azure 服務健康狀態警示可讓您隨時掌握四個領域的問題和諮詢 (服務問題、計劃性維護、安全性和健康狀態諮詢)。 這些警示會個人化,通知您所選 Azure 區域和服務發生中斷或潛在影響。

潛在優點:隨時了解 4 個領域 (服務問題、計劃性維護、安全性諮詢和健康情況諮詢) 的問題和諮詢

如需詳細資訊,請參閱使用 Azure 入口網站建立服務通知的活動記錄警示

虛擬機器

使用受控磁碟改善資料可靠性

可用性設定組的虛擬機器若有磁碟共用儲存體帳戶或儲存體縮放單位,就無法從中斷期間的單一儲存體縮放單位失敗中復原。 遷移至 Azure 受控磁碟可確保可用性設定組中不同 VM 的磁碟已經過充分隔離,以避免發生單一點失敗。

潛在優點:透過資料復原能力來確保業務持續性

如需詳細資訊,請參閱 https://aka.ms/aa_avset_manageddisk_learnmore

啟用虛擬機器複寫以防止應用程式受到區域性中斷的影響

當複寫到另一個區域時,虛擬機器可復原區域中斷。 若要降低 Azure 區域中斷期間的不良業務影響,建議您啟用所有業務關鍵虛擬機器的複寫。

潛在優點:確保在發生任何 Azure 區域中斷時仍保有業務持續性

如需詳細資訊,請參閱快速入門:設定 Azure VM 到次要 Azure 區域的災害復原

將您的輸出連線通訊協定更新為 Azure Site Recovery 的服務標籤

IP 位址式允許清單這個控制防火牆輸出連線性的方式易受攻擊,服務標籤是不錯的另類選擇。 強烈建議您使用服務標籤,以允許連線到電腦的 Azure Site Recovery 服務。

潛在優點:確保比硬式編碼 IP 位址更高的安全性、穩定性和復原性

如需詳細資訊,請參閱關於 Azure VM 災害復原的網路功能

將連結到具進階功能 VM 的標準磁碟升級為進階磁碟

搭配進階版 VM 使用標準 SSD 磁碟,可能導致效能不佳和延遲問題。 建議您考慮將標準磁碟升級至進階版磁碟。 若有任何單一執行個體虛擬機器針對所有作業系統磁碟和資料磁碟使用進階儲存體,我們保證虛擬機器連線能力至少達 99.9%。 選擇升級時,應考量兩項因素。 第一個因素是,升級時必須重新啟動 VM,需要 3 至 5 分鐘才能完成。 第二個因素是,如果清單中的 VM 是任務關鍵性生產 VM,則請針對進階磁碟的成本來評估所提升的可用性。

潛在優點:只有在全都使用進階磁碟時,單一 VM SLA 的可用性才會提升

如需詳細資訊,請參閱 Azure 受控磁碟類型

免費將 VM 從進階非受控磁碟升級至受控磁碟

Azure 受控磁碟可提供更高的復原性、簡易的服務管理、更高的調整目標,和更多樣化的磁碟類型選項。 您的 VM 所使用的進階非受控磁碟可移轉至受控磁碟,不需要額外付費,透過入口網站可以在 5 分鐘內完成。

潛在優點:利用受控磁碟的更高恢復能力和其他優點

如需詳細資訊,請參閱 Azure 受控磁碟簡介

將已取代的虛擬機器映射升級至較新的映像

訂用帳戶中的虛擬機器 (VM) 正在已排程淘汰的映像上執行 淘汰映像之後,就無法從已淘汰的映像建立新 VM。 請升級至較新的映像 SKU,以防止工作負載中斷。 (VMRunningDeprecatedImage)

潛在優點:將 VM 工作負載的任何潛在中斷降至最低

如需詳細資訊,請參閱已取代 Azure Marketplace 映像 - Azure 虛擬機器

升級至較新的虛擬機器映像供應專案

訂用帳戶中的虛擬機器 (VM) 正在已排程淘汰的映像上執行 淘汰映像之後,就無法從已淘汰的映像建立新 VM。 請升級至較新的映像 SKU,以防止工作負載中斷。 (VMRunningDeprecatedOfferLevelImage)

潛在優點:將 VM 工作負載的任何潛在中斷降至最低

如需詳細資訊,請參閱已取代 Azure Marketplace 映像 - Azure 虛擬機器

升級至較新的虛擬機器映像 SKU

訂用帳戶中的虛擬機器 (VM) 正在已排程淘汰的映像上執行 淘汰映像之後,就無法從已淘汰的映像建立新 VM。 請升級至較新的映像 SKU,以防止工作負載中斷。

潛在優點:將 VM 工作負載的任何潛在中斷降至最低

如需詳細資訊,請參閱已取代 Azure Marketplace 映像 - Azure 虛擬機器

將虛擬機器擴展集升級至替代映像版本

訂用帳戶中的 VMSS 正在已排程淘汰的映像上執行。 淘汰映像之後,您的虛擬機器擴展集工作負載將無法再擴增。請升級至較新版本的映像,以防止工作負載中斷。

潛在優點:將虛擬機器擴展集工作負載的任何潛在中斷降至最低

如需詳細資訊,請參閱已取代 Azure Marketplace 映像 - Azure 虛擬機器

將虛擬機器擴展集升級至替代映像供應項目

訂用帳戶中的 VMSS 正在已排程淘汰的映像上執行。 淘汰映像之後,您的虛擬機器擴展集工作負載將無法再擴增。若要防止工作負載中斷,請升級至較新的映像供應項目。

潛在優點:將虛擬機器擴展集工作負載的任何潛在中斷降至最低

如需詳細資訊,請參閱已取代 Azure Marketplace 映像 - Azure 虛擬機器

將虛擬機器擴展集升級至替代映像 SKU

訂用帳戶中的 VMSS 正在已排程淘汰的映像上執行。 淘汰映像之後,您的虛擬機器擴展集工作負載將無法再擴增。若要防止工作負載中斷,請升級至較新的映像 SKU。

潛在優點:將虛擬機器擴展集工作負載的任何潛在中斷降至最低

如需詳細資訊,請參閱已取代 Azure Marketplace 映像 - Azure 虛擬機器

提供 Azure 虛擬桌面環境缺少存取必要網址的權限

若要讓工作階段主機能夠正確部署和註冊至 Windows 虛擬桌面 (WVD),您必須將一組 URL 新增至允許清單,以防止您的 VM 在受限的環境中執行。 針對允許清單中遺漏的特定網址,您也可以在應用程式事件記錄檔中搜尋事件 3702。

潛在優點:確定在使用 Windows 虛擬桌面服務時,能夠有成功的部署和正常運作的工作階段主機

如需詳細資訊,請參閱 Azure 虛擬桌面的必要 FQDN 和端點

對齊資源和資源群組的位置

為了減少區域中斷的影響,請將資源放置在資源群組所在的同一區域。 如此一來,Azure Resource Manager 便可將群組內與所有資源相關的中繼資料都儲存一個區域中。 共置可以減少因區域無法使用而受到影響的機會。

潛在優點:減少因區域中斷而造成的寫入失敗

如需詳細資訊,請參閱什麼是 Azure Resource Manager?

使用可用性區域來提升復原能力和可用性

Azure 中的可用性區域 (AZ) ,有助於保護您的應用程式和資料不受資料中心故障的影響。 每個 AZ 都是由一或多個資料中心所組成,配備了獨立的電力、冷卻系統及網路系統。 藉由設計使用區域性 VM 解決方案,您可以將 VM 與任何其他區域中的失敗隔離。

潛在優點:使用區域性 VM 可保護您的應用程式免受任何其他區域中的區域性中斷的影響。

如需詳細資訊,請參閱 將 Azure 單一實例 VM 從區域移至區域目標可用性區域

啟用 Azure 虛擬機器擴展集 (VMSS) 應用程式狀況監控

使用應用程式健康情況延伸模組或負載平衡器健全狀態探查來設定虛擬機器擴展集應用程式狀況監控,可讓 Azure 平台藉由回應應用程式健康情況中的變更來改善應用程式的復原能力。

潛在優點:透過向 Azure 公開應用程式的健康情況來增加復原能力

如需詳細資訊,請參閱搭配虛擬機器擴展集使用應用程式健康狀態延伸模組

在您的虛擬機器上啟用備份

為虛擬機器啟用備份來保護您的資料。

潛在優點:虛擬機器的保護

如需詳細資訊,請參閱什麼是 Azure 備份服務?

在 Azure 虛擬機器擴展集 (VMSS) 上啟用自動修復原則

透過維護一組狀況良好的執行個體,啟用自動執行個體修復可協助實現高可用性。 如果應用程式健全狀態延伸模組或 Load Balancer 健全狀態探查發現狀況不良的執行個體,則自動執行個體修復會嘗試觸發修復動作來復原執行個體

潛在優點:透過自動修復失敗的執行個體來增加復原能力

如需詳細資訊,請參閱Azure 虛擬機器擴展集的自動執行個體修復

依計量設定虛擬機器擴展集自動化調整

使用以計量為基礎的自訂自動調整,將資源使用率最佳化、降低成本,以及增強應用程式效能。 根據 CPU、記憶體和磁碟作業等即時計量自動新增虛擬機器執行個體。 確保高可用性,同時維護成本效益。

潛在優點:確保高可用性,同時保持成本效益

如需詳細資訊,請參閱使用 Azure 虛擬機器擴展集自動調整概觀

搭配區域備援儲存體 (ZRS) 使用 Azure 磁碟,以提高復原能力和可用性

具有 ZRS 的 Azure 磁碟可在區域中的三個可用性區域中提供資料的同步複寫,讓磁碟能夠容忍區域性故障,而不造成應用程式中斷。 將磁碟從 LRS 移轉至 ZRS,以提高復原能力和可用性。

潛在優點:透過將您的應用程式設計為使用 ZRS 磁碟,您的資料可以跨 3 個可用性區域進行複寫,從而使您的磁碟對區域性中斷具有復原性

如需詳細資訊,請參閱將磁碟從 LRS 轉換成 ZRS

工作負載

為多用途 SQL 伺服器 (MPSQL) 設定 Always On 可用性群組

具有 Always On 可用性群組的 MPSQL 伺服器具有更好的可用性。 您的 MPSQL 伺服器不會設定為 Epic 系統中共用基礎結構中 Always On 可用性群組的一部分。 Always On 可用性群組可改善資料庫可用性和資源的使用方式。

潛在優點:改善了資料庫可用性和資源使用

如需詳細資訊,請參閱什麼是 Always On 可用性群組?

在 Citrix VDI 伺服器中設定本機主機快取,以確保訊息代理程式的順暢運行

我們發現您的 Citrix VDI 伺服器未設定本機主機快取。 本地主機快取 (Local Host Cache, LHC) 是 Citrix Virtual 應用程式與桌面的一項功能,可在訊息代理中斷時繼續操作。當無法在 90 秒內存取網站資料庫時,LHC 就會啟動。

潛在優點:無縫的連線代理作業

將超空間 Web 伺服器部署為針對 3 個區域設定的虛擬機器擴展集 Flex 的一部分

我們發現虛擬機器擴展集 Flex 設定中的超空間 Web 伺服器不會分散到所選取區域中的 3 個區域。 針對 Epic 系統中需要高可用性和大規模的超空間 Web 等服務,建議將伺服器部署為虛擬機器擴展集 Flex 的一部分,並分散到 3 個區域。 透過彈性的協調流程,Azure 就能在整個 Azure VM 生態系統提供統一的體驗。

潛在優點:Epic DB 中超空間 Web 伺服器的高可用性和按需大規模調整

如需詳細資訊,請參閱建立使用可用性區域的虛擬機器擴展集

根據 SAP 工作負載中的 ASCS HA 設定,將 Azure Load Balancer 的閒置逾時設定為 30 分鐘

若要防止負載平衡器逾時,請確定所有 Azure 負載平衡規則:[閒置逾時 (分鐘)] 設定為最大值 30 分鐘。 開啟負載平衡器,選取 [負載平衡規則],然後新增或編輯規則以啟用設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

根據 SAP 工作負載中的 ASCS HA 設定,啟用 Azure Load Balancer 中的浮動 IP

為了連接埠重複使用和更好的高可用性,根據 SAP 工作負載中 ASCS 執行個體的 HA 設定,啟用 Azure Load Balancer 負載平衡規則中的浮動 IP。 開啟負載平衡器,選取 [負載平衡規則],然後新增或編輯規則以啟用。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

根據 SAP 工作負載中的 ASCS HA 設定,啟用 Azure Load Balancer 中的 HA 連接埠

為了連接埠重複使用和更好的高可用性,根據 SAP 工作負載中 ASCS 執行個體的 HA 設定,啟用負載平衡規則中的 HA 連接埠。 開啟負載平衡器,選取 [負載平衡規則],然後新增或編輯規則以啟用。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載的 ASCS HA 設定中,停用位於 Azure Load Balancer 後方 VM 上的 TCP 時間戳記

在位於 AzurEnabling TCP 時間戳記後方的 VM 上停用 TCP 時間戳記會導致健全狀態探查失敗,因為 VM 客體作業系統 TCP 堆疊捨棄 TCP 封包,導致負載平衡器將端點標示為關閉

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱 https://launchpad.support.sap.com/#/notes/2382421

根據 SAP 工作負載中的 HANA DB HA 設定,將 Azure Load Balancer 的閒置逾時設定為 30 分鐘

若要防止負載平衡器逾時,請確定所有 Azure 負載平衡規則:[閒置逾時 (分鐘)] 參數設定為最大值 30 分鐘。 開啟負載平衡器,選取 [負載平衡規則],然後新增或編輯規則以啟用建議的設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

根據 SAP 工作負載中的 HANA DB HA 設定,啟用 Azure Load Balancer 中的浮動 IP

為了獲得更靈活的路由,根據 SAP 工作負載中 HANA DB 執行個體的 HA 設定,啟用 Azure Load Balancer 負載平衡規則中的浮動 IP。 開啟負載平衡器,選取 [負載平衡規則],然後新增或編輯規則以啟用建議的設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

根據 SAP 工作負載中的 HANA DB HA 設定,啟用 Azure Load Balancer 中的 HA 連接埠

為了增強可擴充性,根據 SAP 工作負載中 HANA DB 執行個體的 HA 設定,啟用負載平衡規則中的 HA 連接埠。 開啟負載平衡器,選取 [負載平衡規則],然後新增或編輯規則以啟用建議的設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載的 HANA DB HA 設定中,停用位於 Azure Load Balancer 後方 VM 上的 TCP 時間戳記

停用位於 Azure Load Balancer 後方 VM 上的 TCP 時間戳記。 啟用 TCP 時間戳記會導致健全狀態探查失敗,因為 VM 客體作業系統 TCP 堆疊捨棄 TCP 封包,導致負載平衡器將端點標示為關閉。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱 Azure Load Balancer 健全狀態探查

確定已在 SAP 工作負載中針對 ASCS HA 設定中的 Pacemaker 設定啟用 stonith

在 Pacemaker 叢集中,節點層級隔離的實作會使用 STONITH (Shoot The Other Node in the Head) 資源來進行。 為了協助管理故障節點,確定 HA 叢集設定中的 'stonith-enable' 設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

針對 SAP 工作負載 (RHEL) 中的 ASCS HA 設定,將 Pacemaker 叢集中的 corosync 權杖設定為 30000

corosync 權杖設定會決定直接使用的逾時,或是在 HA 叢集中作為實際權杖逾時計算基礎的逾時。 要允許記憶體保留維護,將 Azure 上的 SAP 的 corosync 權杖設定為 30000。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

在 SAP 工作負載 (RHEL) 的 ASCS HA 設定中,將 Pacemaker 設定中的預期投票參數設定為 '2'

針對兩個節點 HA 叢集,請按照 Azure 上的 SAP 建議,將仲裁「預期投票」參數設定為 '2',以確保適當的仲裁、復原和資料一致性。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

在 SAP 工作負載的 ASCS HA 設定中啟用 Pacemaker 設定中的 'concurrent-fencing' 參數 (ConcurrentFencingHAASCSRH)

並行隔離可讓隔離作業平行執行,進而增強高可用性 (HA)、防止核心分裂案例,並促成健全的 SAP 部署。 在 ASCS HA 設定的 Pacemaker 叢集設定中,將此參數設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

確定已在 SAP 工作負載中針對 ASCS HA 設定中的叢集設定啟用 stonith

在 Pacemaker 叢集中,節點層級隔離的實作會使用 STONITH (Shoot The Other Node in the Head) 資源來進行。 為了協助管理故障節點,確定 HA 叢集設定中的 'stonith-enable' 設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載的 ASCS HA 設定中,將叢集設定中的 stonith timeout 設定為 144

'stonith-timeout' 會指定叢集等候 STONITH 動作完成的時長。 將其設定為 '144' 秒,讓隔離動作有更多時間完成。 我們建議針對 Azure 上的 SAP 上的 HA 叢集使用此設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 SAP 工作負載 (SUSE) 中的 ASCS HA 設定,將 Pacemaker 叢集中的 corosync 權杖設定為 30000

corosync 權杖設定會決定直接使用的逾時,或是在 HA 叢集中作為實際權杖逾時計算基礎的逾時。 要允許記憶體保留維護,將 Azure 上的 SAP 上 corosync 權杖設定為 '30000'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載中,於 ASCS HA 設定的 Pacemaker 叢集中,將 'token_retransmits_before_loss_const' 設定為 10

corosync token_retransmits_before_loss_const 會決定在 HA 叢集中逾時之前,嘗試重新傳輸權杖多少次。 為了保持穩定性和可靠性,請將 ASCS HA 設定的 'totem.token_retransmits_before_loss_const' 設定為 '10'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

'corosync join' 逾時以毫秒為單位,指定在成員協定中等待加入訊息的時間,因此當新的節點加入叢集時,必須有時間將其狀態與現有節點同步處理。 在適用於 ASCS HA 設定的 Pacemaker 叢集設定中,設定 '60'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 SAP 工作負載中的 ASCS HA 設定,將 Pacemaker 叢集中的 ‘corosync consensus' 設定為 '36000'

corosync 'consensus' 參數會指定在叢集設定中啟動一輪的成員資格之前,要等候多久 (以毫秒為單位) 以求達成共識。 將 ASCS HA 設定的 Pacemaker 叢集設定中的「共識」設定為 corosync 權杖的 1.2 倍,以實現可靠的容錯移轉行為。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 SAP 工作負載中的 ASCS HA 設定,將 Pacemaker 叢集中的 'corosync max_messages' 設定為 '20'

corosync 'max_messages' 常數會指定處理器收到權杖時,一個處理器可傳送的訊息數目上限。 將其設定為 Pacemaker 叢集中 corosync 權杖參數的 20 倍,以允許高效通訊,而不會壓垮網路。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載 (SUSE) 中 ASCS HA 設定的叢集設定中,將「預期投票」設定為 '2'

針對兩個節點 HA 叢集,請按照 Azure 上的 SAP 建議,將仲裁「預期投票」參數設定為 2,以確保適當的仲裁、復原和資料一致性。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載的 ASCS HA 設定中,將叢集設定中的 two_node 參數設定為 1

對於兩個節點的 HA 叢集,請根據 Azure 上的 SAP 適用的建議,將 'two_node' 參數設定為 1。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載 (ConcurrentFencingHAASCSSLE) 中啟用 Pacemaker ASCS HA 設定中的「並行隔離」

並行隔離可讓隔離作業平行執行,進而增強 HA、防止核心分裂案例,並促成健全的 SAP 部署。 在 ASCS HA 設定的 Pacemaker 叢集設定中,將此參數設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

確定已啟用 HA 的 SAP 工作負載中,Pacemaker 中的 'fence_azure_arm' 執行個體數目為一

如果您使用 Azure 柵欄代理程式搭配受控識別或服務主體進行隔離,請確定 ASCS HA 設定的 Pacemaker 設定中有一個 fence_azure_arm (適用於 Azure Resource Manager 的 I/O 隔離代理程式) 執行個體,以達到高可用性。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 ASCS HA 設定的 Azure 柵欄代理程式,將 Pacemaker 設定中的 stonith-timeout 設定為 900

將 'stonith-timeout't 設定為 900,以讓 ASCS HA 設定的 Pacemaker 可靠運作。 如果您使用 Azure 柵欄代理程式來隔離受控識別或服務主體,則適用此設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 SAP 工作負載中針對 ASCS HA 設定的 Pacemaker 設定建立 softdog 設定檔

softdog 計時器會載入為 linux OS 中的核心模組。 如果此計時器偵測到系統停止回應,就會觸發系統重設。 確定已在 Pacemaker 叢集中建立適用於 ASCS HA 設定的 Softdog 設定檔

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

確保已在 SAP 工作負載中針對 ASCS HA 設定中的 Pacemaler 載入 softdog 模組

softdog 計時器會載入為 linux OS 中的核心模組。 如果此計時器偵測到系統停止回應,就會觸發系統重設。 首先,請確保您已建立 softdog 設定檔,然後在 ASCS HA 設定的 Pacemaker 設定中載入 softdog 模組

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在 HANA DB HA 設定的 Pacemaker 設定中,將 PREFER_SITE_TAKEOVER 參數設定為 'true'

SAP HANA 中的 PREFER_SITE_TAKEOVER 參數會定義 HANA 系統複寫 (SR) 資源代理程式是否會接管至次要執行個體,而不是在本機重新啟動失敗的主要執行個體。 如需 HANA DB 高可用性 (HA) 設定的可靠功能,請將 PREFER_SITE_TAKEOVER 設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

針對具有 Redhat OS 的 VM,在已啟用 HA 的 SAP 工作負載的叢集設定中啟用 stonith

在 Pacemaker 叢集中,節點層級隔離的實作會使用 STONITH (Shoot The Other Node in the Head) 資源來進行。 為了協助管理故障節點,確定您 SAP 工作負載的 HA 叢集設定中已將 'stonith-enable' 設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

針對具有 RHEL OS 的 VM 已啟用 HA 的 HANA DB,將 Pacemaker 叢集中的 corosync 權杖設定為 30000

corosync 權杖設定會決定直接使用的逾時,或是在 HA 叢集中作為實際權杖逾時計算基礎的逾時。 要允許記憶體保留維護,透過 Redhat OS 將 Azure 上的 SAP 的 corosync 權杖設定為 30000。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

在已啟用 HA 的 SAP 工作負載 (RHEL) 的叢集設定中,將預期的投票參數設定為 '2'

針對兩個節點 HA 叢集,請按照 Azure 上的 SAP 建議,將仲裁投票設定為 '2',以確保適當的仲裁、復原和資料一致性。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

在 HANA DB HA 設定的 Pacemaker 設定中啟用 'concurrent-fencing' 參數

並行隔離可讓隔離作業平行執行,進而增強高可用性 (HA)、防止核心分裂案例,並促成健全的 SAP 部署。 在 HANA DB HA 設定的 Pacemaker 叢集設定中,將此參數設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱Red Hat Enterprise Linux 上 Azure VM 中 SAP HANA 的高可用性

在已啟用 HA 的 SAP 工作負載的叢集設定中,將 PREFER_SITE_TAKEOVER 參數設定為 'true'

SAP HANA 拓撲中的 PREFER_SITE_TAKEOVER 參數會定義 HANA SR 資源代理程式是否應該會接管至次要執行個體,而不是在本機重新啟動失敗的主要執行個體。 要獲得 HANA DB HA 設定的可靠函式,請將其設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對具有 SUSE OS 的 VM,在已啟用 HA 的 SAP 工作負載的叢集設定中啟用 stonith

在 Pacemaker 叢集中,節點層級隔離的實作會使用 STONITH (Shoot The Other Node in the Head) 資源來進行。 為了協助管理故障節點,確定 HA 叢集設定中的 'stonith-enable' 設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在已啟用 HA 的 SAP 工作負載的叢集設定中,將 stonith 逾時設定為 144

'stonith-timeout' 會指定叢集等候 STONITH 動作完成的時長。 將其設定為 '144' 秒,讓隔離動作有更多時間完成。 我們建議針對 Azure 上的 SAP 上的 HA 叢集使用此設定。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對具有 SUSE OS 的 VM 已啟用 HA 的 HANA DB,將 Pacemaker 叢集中的 corosync 權杖設定為 30000

corosync 權杖設定會決定直接使用的逾時,或是在 HA 叢集中作為實際權杖逾時計算基礎的逾時。 若要允許記憶體保留維護,針對具有 SUSE OS 的 VM 已啟用 HA 的 HANA DB,將 corosync 權杖設定為 30000。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在已啟用 HA 的 SAP 工作負載中,於 Pacemaker 叢集中將 'token_retransmits_before_loss_const' 設定為 10

corosync token_retransmits_before_loss_const 會決定在 HA 叢集中逾時之前,嘗試重新傳輸權杖多少次。 根據 HANA DB HA 設定的建議,將 totem.token_retransmits_before_loss_const 設定為 10。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 SAP 工作負載中已啟用 HA 的 HANA DB,將 Pacemaker 叢集中的 'corosync join' 設定為 60

'corosync join' 逾時以毫秒為單位,指定在成員協定中等待加入訊息的時間,因此當新的節點加入叢集時,必須有時間將其狀態與現有節點同步處理。 在適用於 HANA DB HA 設定的 Pacemaker 叢集設定中,設定 '60'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 SAP 工作負載中已啟用 HA 的 HANA DB,將 Pacemaker 叢集中的 'corosync consensus' 設定為 36000

corosync 'consensus' 參數會指定在叢集中啟動新一輪的成員資格之前,要等候多久 (以毫秒為單位) 以求達成共識。 要實現可靠的容錯移轉行為,將 HANA DB HA 設定的 Pacemaker 叢集設定中的「共識」設定為 corosync 權杖的 1.2 倍。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 SAP 工作負載中已啟用 HA 的 HANA DB,將 Pacemaker 叢集中的 'corosync max_messages' 設定為 20

corosync 'max_messages' 常數會指定處理器收到權杖時,一個處理器可傳送的訊息數目上限。 要允許高效通訊,而不會壓垮網路,將其設定為 Pacemaker 叢集設定中 corosync 權杖參數的 20 倍。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在已啟用 HA 的 SAP 工作負載 (SUSE) 的叢集設定中,將預期的投票參數設定為 2

在已啟用 HA 的 SAP 工作負載的叢集設定中,將預期的投票參數設定為 '2',以確保適當的仲裁、復原性和資料一致性。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在已啟用 HA 的 SAP 工作負載的叢集設定中,將 two_node 參數設定為 1

對於兩個節點的 HA 叢集,請根據 Azure 上的 SAP 適用的建議,將 'two_node' 參數設定為 1。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

在已啟用 HA 的 SAP 工作負載 (RHEL) 的叢集設定中,將預期的投票參數設定為 '2'

並行隔離可讓隔離作業平行執行,進而增強 HA、防止核心分裂案例,並促成健全的 SAP 部署。 在已啟用 HA 的 SAP 工作負載中,將此參數設定為 'true'。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

確定 HANA DB HA 設定的 Pacemaker 設定中有一個 fence_azure_arm 執行個體

如果您使用 Azure 柵欄代理程式搭配受控識別或服務主體進行隔離,請確定 HANA DB HA 設定的 Pacemaker 設定中有一個 fence_azure_arm (適用於 Azure Resource Manager 的 I/O 隔離代理程式) 執行個體,以達到高可用性。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

針對 HANA DB HA 設定的 Azure 柵欄代理程式,將 Pacemaker 設定中的 stonith-timeout 設定為 900

如果您使用 Azure 柵欄代理程式搭配受控識別或服務主體進行隔離,請透過將 'stonith-timeout' 設定為 900,確保 HANA DB HA 設定 Pacemaker 的可靠功能。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

確保 softdog 設定檔處於 SAP 工作負載中 HANA DB 的 Pacemaker 設定中

softdog 計時器會載入為 Linux OS 中的核心模組。 如果此計時器偵測到系統停止回應,就會觸發系統重設。 確定已在 Pacemaker 叢集中建立適用於 HANA DB HA 設定的 Softdog 設定檔。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

確保已在 SAP 工作負載中針對 ASCS HA 設定中的 Pacemaler 載入 softdog 模組

softdog 計時器會載入為 Linux OS 中的核心模組。 如果此計時器偵測到系統停止回應,就會觸發系統重設。 首先,請確保您已建立 softdog 設定檔,然後在 HANA DB HA 設定的 Pacemaker 設定中載入 softdog 模組。

潛在優點:SAP 工作負載中 HA 設定的可靠性

如需詳細資訊,請參閱SUSE Linux Enterprise Server 上 Azure VM 的 SAP HANA 高可用性

下一步

深入了解可靠性 - Microsoft Azure Well Architected Framework