雲端準備的反面模式
在雲端採用的準備階段,客戶經常會遇到反面模式。 這些反面模式可能會導致意外停機、災害復原問題和可用性問題。
反面模式:假設已發布的服務已準備好用於生產環境
由於雲端運算發展迅速,公司經常會發布新服務的預覽版本。 客戶往往會假設他們可以在生產環境中使用任何可用的雲端服務。 但這可能會導致問題,原因包括:
- 預覽服務通常不提供正常運作時間服務層級協定 (SLA)。
- 新服務通常不如現有的雲端服務成熟。
範例:在生產環境中使用預覽服務
一家研究機構在生產環境中使用預覽雲端服務。 該服務似乎非常適合其使用案例。 但是,該機構並沒有對該服務進行適當的盡職調查。 該機構也未遵循其參考架構的要求和指導方針。
使用預覽服務時出現了問題,導致意外的停機。 該機構開始認為雲端服務總體上並不像承諾的那樣成熟或有彈性。
較好的結果:在生產環境中使用預先核准的雲端服務
在評估處於預覽階段的新服務時,僅應在概念驗證 (POC) 場景中使用這些服務。 不要在生產環境中使用這些服務,因為它們沒有 SLA。 在核准雲端服務時,在功能性與成熟性之間找到適當的平衡點。 請參閱「雲端服務盡職調查清單」,以了解可用於快速評估雲端服務的成熟架構。
反面模式:假設彈性和可用性增加
雲端運算通常比內部部署運算具有優勢。 範例包含:
- 提高韌性:在故障後進行恢復。
- 可用性:在健康狀態下運作,並且沒有明顯的停機時間。
由於大多數雲端服務都具有這些優勢,因此許多公司會認為所有雲端服務都應具備韌性和高可用性。 事實上,這些功能通常需要投入額外的費用和技術才能獲得。
範例:假設高可用性
一家新創公司在基礎設施即服務 (IaaS) 服務上實施了一個關鍵任務應用程式。 這家新創公司的開發人員查看了一個虛擬機器 (VM),其正常運作時間的 SLA 為99.9%。 由於他們希望削減成本,因此使用單一虛擬機器和進階儲存體。
當虛擬機器發生故障時,他們的應用程式無法恢復。 意外的停機結果。 他們假設雲端會提供高可用性。 他們不知道性能保證在以下方面可能有所不同:
- 平台即服務 (PaaS) 和軟體即服務 (SaaS) 等服務模型。
- 負載平衡可用性設定組和可用性區域等技術架構。
較好的結果:在平衡韌性與成本的同時減少故障狀況。
請參閱值得信賴的成熟資源,以了解可減少故障範圍的架構最佳實踐:
找出成本與功能 (如高韌性和可用性) 之間的最佳平衡。 提高韌性和可用性通常會導致成本增加。 例如:
- 單一虛擬機器可能具有保證正常運作時間為 99.9% 的 SLA。
- 執行相同工作負載的兩台虛擬機器將提供正常運作時間在 99.95% 到 99.99% 之間的 SLA。
在設計雲端解決方案時,參與需求工程的基本程序。
反面模式:成為雲端提供者
一些公司會嘗試將其內部 IT 部門打造為雲端提供者。 因此 IT 部門需負責參考架構。 IT 還需要向業務部門提供 IaaS 和 PaaS。 由於這類工作通常不是 IT 的核心業務,因此所提供的服務可能缺乏可用性、韌性、效率和安全性。
範例:提供單體化的受控雲端服務
一家公司的 IT 部門建立了一個雲端卓越中心 (CCoE),作為 IT 與業務單位之間的橋樑。 為了確保公司符合雲端標準,管理層將提供單體化端到端服務的任務指派給雲端卓越中心 (CCoE)。 CCoE 建立了一個內部雲端採購入口網站,業務部門可以使用該入口網站來訂購完全受控的雲端虛擬機器即服務。 但是,IT 部門控制誰可以存取和使用整個平台。 因此,IT 部門會積極阻止業務部門利用 Azure 提供的全方位服務。 導致業務單位無法存取雲端入口網站。 他們只能透過安全殼層 (SSH) 和遠端桌面協定 (RDP) 存取他們訂購的伺服器。
由於多種原因,CCoE 在提供單體化受控服務以裝合雲端中各個可用服務時遇到了困難:
- 雲端提供了大量跨多個解決方案領域的服務。 與開發 IaaS 解決方案相比,設計和工程物聯網 (IoT) 和 AI 解決方案需要不同的專業知識和技能組合。
- 雲端服務經常變化。
- 嘗試提供單體化服務將大大延長上市時間,因為這一過程由 IT 管理,而不是業務單位。
較好的結果:提供護欄
採用雲端技術時,讓 IT 部門從 IT 工作負載入手,獲得有關雲端的第一手經驗。 使用適用於 Azure 的 Microsoft 雲端採用架構來確定您的第一個採用專案。
使用成熟的雲端營運模型,例如集中式營運,讓 IT 部門負責定義平台護欄,例如治理。 這樣,業務單位可以在 IT 定義的護欄內,以安全且一致的方式採用雲端專案。
考慮在開始時僅採用一個主要的公用雲端服務提供者,因為所有主要平台在設定、管理和使用方面都有很大差異。
IT 工具盡量使用 SaaS 解決方案,例如:
- 程式碼存放庫。
- 持續整合和持續傳遞 (CI/CD)。
- 共同作業系統。
對於雲端工作負載,建議 IT 使用熟悉且可大規模安全執行的程式。