共用方式為


AI 工作負載團隊角色

在 AI 工作負載建置中,相較於傳統程式碼部署,非決定性模型需要跨多個角色和小組進行反覆的實驗和共同作業。 作業、應用程式開發和數據小組的早期整合,對於增進相互了解至關重要。 此共同作業需要多樣化的技能和持續學習,以跟上技術進步的步伐。

有效的共同作業取決於 整合工具、程序和人員,並由工作負載需求和特定目標驅動。 建議的策略包括:

  • 建立明確的角色和責任。
  • 善用團隊的技能組合來執行適當的任務。
  • 將流程和轉包處理標準化,例如追蹤工作做為共用待辦專案的一部分。
  • 依賴自動化來達到一致性和重現性。

角色可以是具體化這些策略和標準化責任的有效工具。 本文說明 AI 工作負載的角色及其在工作負載設計方面的優點。 它也提供範例和工具,以有效地定義和使用這些小組層級的角色。

什麼是角色?

角色代表參與建立和作業工作負載的人類和程式子集。 人物誌會同時擷取這些個人和流程的角色、實際行為和責任。 個人可以根據內容來體現一或多個角色。 角色不必是一個人。 它也可以是無人值守的流程,例如架構中的代理程式。

您的工作負載可能有驅動功能開發的使用者角色。 這些角色不在本文的範圍內。

不同於在組織中相對靜態的功能或職位的角色,角色是動態且面向目標的角色。 它們可用來將技能需求對應至流程和工具,例如架構元件。 角色主要有助於定義責任範圍,並在專案內設定內容。 它們提供數個其他優點,例如:

  • 識別資源差距。 識別差距可協助您決定是否要招募或訓練資源,或重新設計解決方案。 如果您的工作負載小組缺少符合必要角色的個人,您可能需要調整架構、修改程式,或讓新人員上線。 例如,如果遺漏資深數據科學角色,您可以重新設計架構,以更依賴一般用途軟體即服務 (SaaS) AI 解決方案,或納入非Microsoft AI 解決方案。
  • 增強的技能。 將角色對應至特定架構元件也有助於教育機會,例如課程和在線課程,以增強技能。
  • 確保適當的存取層級。 您應該使用角色來定義安全性和存取需求,方法是將角色對應至進程、架構和服務。 這個對應有助於確保適當的存取層級。
  • 促進專案規劃和溝通。 在項目規劃中,角色有助於識別重要的互動,以利設定同步會議與整體規劃。 一般而言,角色會整合到追蹤使用者劇本、功能和需求階層中,以簡化專案管理。

如何定義角色

識別小組成員的特製化,並將其與 AI 作業或設計中的適當角色一致。 建立範本,以記錄角色的技能期望、團隊資訊,以及他們將參與的過程。

以下是基準範本範例:

角色範本
🔹角色名稱:[名稱]
🔹小組:[負責角色的小組]
🔹主要互動:[角色互動的其他小組]
🔹元件存取:[處理程序和系統元件的安全性及存取需求]
🔹程式:[角色負責或參與的程式]
🔹技能:[完成工作所需的技能,包括模型定型或搜尋索引優化等領域和技術細節]

工具

您可以使用資料表來組織和視覺化每個角色的資訊。 此方法的其中一個優點是,您可以建立並連結至提供更特定資訊的其他數據表。 例如,您可以將架構元件連結至另一個數據表,其中識別型訪問控制是針對每個服務和環境指定(開發、階段、生產環境)。

權衡。 角色太少,因此難以以最低許可權存取實作角色型訪問控制,並有效地分配工作責任。 相反地,擁有太多角色會增加管理額外負荷。 從 5 到 10 個使用者角色開始是很好的平衡點,您應該只新增作業所需的使用者角色。

您也可以使用卡片來定義角色。 這些卡片包含與數據表相同的資訊,或快速摘要。 您可以使用PowerPoint或建立一組 Markdown 檔案來建立這些卡片。

在某些情況下,您可以使用工具的組合。 例如,角色卡片中的每個架構元件都可以開啟 Markdown 檔案,其中包含對應每個服務和環境的安全性和角色型訪問控制的數據表。 如需範例,請參閱 MLOps 加速器:身分識別 RBAC

範例角色

您可以使用卡片來定義角色必須在程式中存取的服務,並概述每個角色所需的技能(無論是人員還是代理人)。

重要

雖然這裏定義的角色可作為基準範例,但建議您使用數據表、角色範本卡片和圖表等工具來建立自己的角色。

請務必讓這些角色與您的程式、組織和使用者保持一致。

AI 資料工程師 (P001)
小組:數據擷取小組
🔹 主要互動:人工智慧開發團隊
🔹 元件存取:Azure Data Factory、Azure Databricks、Azure SQL Database、Azure 記憶體
🔹 進程:DataOps、ETL、ELT
🔹 技能:SQL、Python、PySpark
BI 分析師 (P003)
小組:分析小組
🔹 主要互動對象:資料匯入團隊
🔹 元件存取:Power BI、Azure 數據總管、Azure 記憶體
🔹 程序:數據分析、數據倉儲
🔹 技能:SQL、Python、PySpark
歧視 AI 資料科學家 (P004)
小組:AI 小組
🔹 主要互動:數據擷取小組、DevOps 小組
🔹 元件存取:Azure Machine Learning、Azure Databricks、Azure 儲存體、Azure Key Vault
🔹 進程:MLOps、MLflow
🔹技能:Azure 機器學習、Python、模型定型
GenAI 資料科學家 (P006)
小組:AI 小組
🔹 主要互動:數據擷取小組、DevOps 小組
🔹 元件存取:Azure AI Foundry 入口網站、Azure OpenAI Service、Azure AI 搜尋、Azure 儲存體、Azure Key Vault
🔹 程式:GenAIOps
🔹 技能:Azure Machine Learning、Python、模型知識(LLM、SLM)、微調、RAG、代理概念
GenAI 聊天開發人員 (P007)
小組:工程小組
🔹 主要互動:AI 團隊
🔹 元件存取:Azure Web Apps、Azure API 管理、Azure Cosmos DB、Azure Container Apps、Azure Functions
🔹 程式:DevOps、事件驅動處理、微服務
🔹 技能:Web 應用程式架構(前端/後端)、React、Node.js、HTML、CSS
建置代理程式 MLOps (P009)
小組:工程小組
🔹 主要互動:AI 團隊
🔹 元件存取:Azure Machine Learning、Azure DevOps、GitHub
🔹 程序:處理及提供 Lambda、外部迴圈 MLOps
🔹 技能:Python、Pyspark

使用案例:AI 流程的角色

這些主要過程用於 AI 工作負載:

  • DataOps 是資料的導入和準備。
  • MLOps 是將機器學習模型投入實際運作的過程。
  • GenAIOps 是探索和評估現有模型,以及將這些模型精簡至工作負載內容。
  • 內部迴圈是在開發環境中進行的方案改進,無論是在研究期間,還是由外部迴圈監控所觸發。
  • 外部迴圈是從開發到生產的解決方案移動。 此迴圈會使用持續監視和評估來識別必要的改善。

將角色對應至這些進程,可提供每個角色的內容。 此步驟可協助識別角色可能需要提升技能的過程。

顯示生產環境中 DataOps、MLOps 和 GenAIOps 的圖表。

此影像顯示生產環境中 DataOps、MLOps 和 GenAIOps 的工作流程。 從數據匯入到模型部署和評估的整個流程。 工作流程會使用持續整合和持續傳遞 (CI/CD) 做法。 主要工作包括精簡數據模型、評估批次、部署端點、實時評估模型,以及微調模型。 範例角色會參與整個工作流程。

使用案例:架構設計的角色

將程式連線到支持架構,可協助您識別角色需要與其互動的服務,並醒目提示潛在的提升技能領域。

若要將此連線可視化,請建立圖形化影像,以顯示架構元件連線的方式。 此視覺輔助可以說明服務之間的數據流和互動,以及流程在部署中的自動化方式。 它可協助項目關係人了解架構及其內不同角色的具體職責。

下圖顯示 Azure 上新式分析的 Lambda 架構。

圖表,顯示 Azure 中新式分析的 Lambda 架構。

後續步驟

接下來,請使用評估工具來評估您的設計。