Azure 上的 AI 工作負載

發行項
01/08/2025

本文說明設計 AI 工作負載的架構挑戰。其著重於不具決定性的功能、數據和應用程式設計和作業。這些建議是以 Azure Well-Architected Framework 原則為基礎，並包含成功 Azure 實作的深入解析。

這些文章適用於工作負載擁有者和技術項目關係人，例如架構設計人員、開發主管和IT領導者。特殊 AI 和數據角色，例如數據科學家，也應該注意此指引，因為跨各種角色和小組的共同作業是關鍵層面。

注意

Azure 提供各種 AI 服務，您可以將其整合到工作負載中，或加以建置。根據您的業務需求，您可以選擇完全受控的軟體即服務（SaaS）解決方案、平臺即服務（PaaS）解決方案，或建置您自己的 AI 解決方案。 此處未涵蓋特定的 Azure 服務及其功能。我們建議您參考個別的產品檔以取得該資訊。

此外，某些 AI 工作負載不在範圍內，例如：

利用低程式代碼和無程式代碼解決方案實現的工作負載，例如 Copilot Studio。
需要高效能運算的工作負載。
未實作衍生式或歧視 AI 使用案例的工作負載。

什麼是 AI 工作負載？

在 Well-Architected 框架的背景下，AI 工作負載符合預測、識別或生成任務的需求。其著重於道德功能、適應快速演進的 AI 技術，以及保持相關且可解釋性。在每個決策點套用 Well-Architected 架構要素，以確保系統可靠、安全、有效率且符合成本效益。

AI 工作負載與傳統工作負載不同，因為它們會以不具決定性的行為取代部分工作負載中的決定性功能，以針對固定結果不切實際的情況加以解決。相反地，它們會將程式代碼和數據合併成實體，或模型，以啟用傳統系統無法提供的獨特體驗。

開始設計策略之前，請先考慮這些重點。

熟悉廣泛的模型類別

產生 AI：使用機器學習來自主建立新內容。它包含可使用用戶數據自定義的語言模型，或做為 Azure OpenAI 服務等服務使用的語言模型。例如，GPT 是一種語言模型，專門模擬人類交談語言，非常適合聊天和自然語言體驗。

使用案例：Generative AI 可以產生文章、故事和藝術。它也可以產生綜合數據來平衡數據集，並讓聊天機器人更人性化。
區分 AI：使用明確的程式設計，根據規則和演算法執行特定工作。分為：
- 以模型為基礎的：預測系統會根據先前觀察的訓練來尋找模式，以進行預測，但無法自己建立新內容或做出調整。
- 非模型型：自主代理程式會遵循預先定義的規則來與系統互動，例如視頻遊戲字元。
使用案例：辨別 AI 用於預測性分析、建議系統和詐騙偵測。

這一系列文章涵蓋不同的 AI 工作負載，並視需要著重於特定類型，例如語言模型。

重要

當您在衍生式和歧視模型之間進行選擇時，請考慮您需要完成的工作。產生模型會建立新的數據。辨別模型會根據特徵分類現有的數據。針對分類或回歸工作，挑選符合作業的模型。例如，可以分類的語言模型可能比只分類一個多用途的語言模型。

評估組建與購買選項

如果一般回應是可接受的，則使用不透明處理的預先建置模型或 AI 服務型解決方案應該足以應付您的工作負載。但是，如果您需要企業特定的數據或具有合規性需求，請建立自定義模型。

當您選擇自定義模型、預先建置的模型或服務時，請考慮下列因素：

數據控制：自定義模型可讓您更充分掌控敏感數據。預先建置的模型較容易進行一般工作。
自定義：自定義模型更適合獨特的需求。預先建置的模型可能缺乏彈性。
成本和維護：自定義模型需要持續維護和資源。預先建置的模型通常具有較低的初始成本和較少的基礎結構負擔。
效能：預先建置的服務提供優化的基礎結構和延展性。其適用於低延遲或高延展性需求。
專長：自定義模型需要熟練的團隊。如果專業知識有限，預先建置的模型通常會更快速地部署，且更容易使用。

重要

建立和維護您自己的模型需要大量的資源、時間和專業知識。在決定之前，請務必徹底研究。通常，選擇預先建置的模型或受控服務是較佳的選項。

常見的挑戰為何？

計算成本：由於計算需求高，AI 函式的成本可能很高，而且計算需求可能會根據您的工作負載設計而有所不同。瞭解您的需求，並選擇正確的服務來管理成本。
安全性與合規性需求：現成的解決方案可能無法符合您的安全性和合規性需求。研究避免不必要的負擔的選項。
數據量：以各種格式處理大量數據時，面臨著保護敏感性資訊和有效率處理的挑戰。優化記憶體、處理和傳輸成本應該是持續的活動。
模型衰變：模型可能會隨著時間而降低，這會導致結果不正確。測試 AI 系統之所以具有挑戰性，是因為其隨機性。
技能挑戰：新的 AI 工作負載可能需要特殊角色和需要大量訓練的新作業程式。
AI 創新步調：採用最新技術可能令人感到有誘惑力，以維持在尖端之位。仔細評估新技術，以確保他們改善用戶體驗，而且不只是為了最新狀態而增加複雜性。
道德需求：清楚判斷您的使用案例是否為 AI 的道德目標。在整個規劃和實作階段中維護道德標準是必要的，以確保您正在建置負責任的系統。

如何使用本指南

✔ 從設計方法開始，其中概述技術與操作領域的原理和周期性主題。這種系統化方法有助於定義需求和設計策略。當您面臨不確定的選擇，以與工作負載的整體目標保持一致時，請重新流覽此方法。它也提供與項目關係人共同作業的架構，以證明技術決策的合理性，並納入客戶意見反應以進行持續改善。

✔ 繼續設計原則，瞭解設計方法如何與核心 Well-Architected 架構支柱保持一致。請考慮成長演進。共同評估所有支柱的基本原則，包括取捨。

✔ 專注於 對您的解決方案有最大影響的設計區域 。每個區域都包含可引導您完成設計決策的考慮和建議。

✔ 使用評定檢閱工具評估生產環境中優化 AI 工作負載的整備程度。

典型的架構模式和設計區域

下圖說明數據如何從初始集合流經系統到最終用戶互動。

此架構強調整合不同的元件，以在 AI 驅動解決方案中啟用有效率的數據處理、模型優化和即時應用程式部署。其中包含數據源、數據處理、模型定型、模型部署和使用者介面等模組。

下表描述與該模式相關的一些重要設計區域。

設計領域
應用程式設計：瞭解可能對現有應用程式設計標準產生重大影響的 AI 工作負載特有的考慮。
應用程式平臺：決定用來支援 AI 工作負載函式的最佳平臺，例如模型裝載、模型定型和推斷。
訓練數據設計：設計資料攝取、前置處理、保留和治理主題的策略，以處理您的模型訓練數據。
地面數據設計：設計策略，以優化可搜尋性和擷取，同時符合您地面數據的安全性與合規性需求。
數據平台：決定處理您的工作負載所使用的大量數據和可能多種格式的最佳託管平台。
機器學習作業和產生的 AI 作業：建立新式 DevOps 做法，以支援您的機器學習或再生 AI 函式和系統。
工作負載作業：使用新方法將作業實務現代化，並新增特殊角色和訓練。
測試和評估：透過以 AI 工作負載為目標的計量，開發測試和評估策略，以測量精確度、精確度、敏感度和特定性等特性。
工作負載角色：瞭解角色如何參與 AI 工作負載的完整生命週期，以協助確保您的小組能夠完全建置和支援它。
負責任 AI：特別注意將 AI 解決方案發行給公眾的用戶體驗和道德影響。 AI 為新的產品和服務帶來了令人難以置信的機會，但它也帶來相當大的風險。

提示

每個架構決策都牽涉到一系列考慮，以及一組公認的妥協，以平衡架構的不同層面。這些取捨會以這個圖示表示。

後續步驟

設計方法

共用方式為