AI 工作負載團隊角色
在 AI 工作負載建置中,相較於傳統程式碼部署,非決定性模型需要跨多個角色和小組進行反覆的實驗和共同作業。 作業、應用程式開發和數據小組的早期整合,對於增進相互了解至關重要。 此共同作業需要多樣化的技能和持續學習,以跟上技術進步的步伐。
有效的共同作業取決於 整合工具、程序和人員,並由工作負載需求和特定目標驅動。 建議的策略包括:
- 建立明確的角色和責任。
- 善用團隊的技能組合來執行適當的任務。
- 將流程和轉包處理標準化,例如追蹤工作做為共用待辦專案的一部分。
- 依賴自動化來達到一致性和重現性。
角色可以是具體化這些策略和標準化責任的有效工具。 本文說明 AI 工作負載的角色及其在工作負載設計方面的優點。 它也提供範例和工具,以有效地定義和使用這些小組層級的角色。
什麼是角色?
角色代表參與建立和作業工作負載的人類和程式子集。 人物誌會同時擷取這些個人和流程的角色、實際行為和責任。 個人可以根據內容來體現一或多個角色。 角色不必是一個人。 它也可以是無人值守的流程,例如架構中的代理程式。
您的工作負載可能有驅動功能開發的使用者角色。 這些角色不在本文的範圍內。
不同於在組織中相對靜態的功能或職位的角色,角色是動態且面向目標的角色。 它們可用來將技能需求對應至流程和工具,例如架構元件。 角色主要有助於定義責任範圍,並在專案內設定內容。 它們提供數個其他優點,例如:
- 識別資源差距。 識別差距可協助您決定是否要招募或訓練資源,或重新設計解決方案。 如果您的工作負載小組缺少符合必要角色的個人,您可能需要調整架構、修改程式,或讓新人員上線。 例如,如果遺漏資深數據科學角色,您可以重新設計架構,以更依賴一般用途軟體即服務 (SaaS) AI 解決方案,或納入非Microsoft AI 解決方案。
- 增強的技能。 將角色對應至特定架構元件也有助於教育機會,例如課程和在線課程,以增強技能。
- 確保適當的存取層級。 您應該使用角色來定義安全性和存取需求,方法是將角色對應至進程、架構和服務。 這個對應有助於確保適當的存取層級。
- 促進專案規劃和溝通。 在項目規劃中,角色有助於識別重要的互動,以利設定同步會議與整體規劃。 一般而言,角色會整合到追蹤使用者劇本、功能和需求階層中,以簡化專案管理。
如何定義角色
識別小組成員的特製化,並將其與 AI 作業或設計中的適當角色一致。 建立範本,以記錄角色的技能期望、團隊資訊,以及他們將參與的過程。
以下是基準範本範例:
角色範本 |
---|
🔹角色名稱:[名稱] 🔹小組:[負責角色的小組] 🔹主要互動:[角色互動的其他小組] 🔹元件存取:[處理程序和系統元件的安全性及存取需求] 🔹程式:[角色負責或參與的程式] 🔹技能:[完成工作所需的技能,包括模型定型或搜尋索引優化等領域和技術細節] |
工具
您可以使用資料表來組織和視覺化每個角色的資訊。 此方法的其中一個優點是,您可以建立並連結至提供更特定資訊的其他數據表。 例如,您可以將架構元件連結至另一個數據表,其中識別型訪問控制是針對每個服務和環境指定(開發、階段、生產環境)。
權衡。 角色太少,因此難以以最低許可權存取實作角色型訪問控制,並有效地分配工作責任。 相反地,擁有太多角色會增加管理額外負荷。 從 5 到 10 個使用者角色開始是很好的平衡點,您應該只新增作業所需的使用者角色。
您也可以使用卡片來定義角色。 這些卡片包含與數據表相同的資訊,或快速摘要。 您可以使用PowerPoint或建立一組 Markdown 檔案來建立這些卡片。
在某些情況下,您可以使用工具的組合。 例如,角色卡片中的每個架構元件都可以開啟 Markdown 檔案,其中包含對應每個服務和環境的安全性和角色型訪問控制的數據表。 如需範例,請參閱 MLOps 加速器:身分識別 RBAC。
範例角色
您可以使用卡片來定義角色必須在程式中存取的服務,並概述每個角色所需的技能(無論是人員還是代理人)。
重要
雖然這裏定義的角色可作為基準範例,但建議您使用數據表、角色範本卡片和圖表等工具來建立自己的角色。
請務必讓這些角色與您的程式、組織和使用者保持一致。
AI 資料工程師 (P001) |
---|
小組:數據擷取小組 🔹 主要互動:人工智慧開發團隊 🔹 元件存取:Azure Data Factory、Azure Databricks、Azure SQL Database、Azure 記憶體 🔹 進程:DataOps、ETL、ELT 🔹 技能:SQL、Python、PySpark |
BI 分析師 (P003) |
---|
小組:分析小組 🔹 主要互動對象:資料匯入團隊 🔹 元件存取:Power BI、Azure 數據總管、Azure 記憶體 🔹 程序:數據分析、數據倉儲 🔹 技能:SQL、Python、PySpark |
歧視 AI 資料科學家 (P004) |
---|
小組:AI 小組 🔹 主要互動:數據擷取小組、DevOps 小組 🔹 元件存取:Azure Machine Learning、Azure Databricks、Azure 儲存體、Azure Key Vault 🔹 進程:MLOps、MLflow 🔹技能:Azure 機器學習、Python、模型定型 |
GenAI 資料科學家 (P006) |
---|
小組:AI 小組 🔹 主要互動:數據擷取小組、DevOps 小組 🔹 元件存取:Azure AI Foundry 入口網站、Azure OpenAI Service、Azure AI 搜尋、Azure 儲存體、Azure Key Vault 🔹 程式:GenAIOps 🔹 技能:Azure Machine Learning、Python、模型知識(LLM、SLM)、微調、RAG、代理概念 |
GenAI 聊天開發人員 (P007) |
---|
小組:工程小組 🔹 主要互動:AI 團隊 🔹 元件存取:Azure Web Apps、Azure API 管理、Azure Cosmos DB、Azure Container Apps、Azure Functions 🔹 程式:DevOps、事件驅動處理、微服務 🔹 技能:Web 應用程式架構(前端/後端)、React、Node.js、HTML、CSS |
建置代理程式 MLOps (P009) |
---|
小組:工程小組 🔹 主要互動:AI 團隊 🔹 元件存取:Azure Machine Learning、Azure DevOps、GitHub 🔹 程序:處理及提供 Lambda、外部迴圈 MLOps 🔹 技能:Python、Pyspark |
使用案例:AI 流程的角色
這些主要過程用於 AI 工作負載:
- DataOps 是資料的導入和準備。
- MLOps 是將機器學習模型投入實際運作的過程。
- GenAIOps 是探索和評估現有模型,以及將這些模型精簡至工作負載內容。
- 內部迴圈是在開發環境中進行的方案改進,無論是在研究期間,還是由外部迴圈監控所觸發。
- 外部迴圈是從開發到生產的解決方案移動。 此迴圈會使用持續監視和評估來識別必要的改善。
將角色對應至這些進程,可提供每個角色的內容。 此步驟可協助識別角色可能需要提升技能的過程。
此影像顯示生產環境中 DataOps、MLOps 和 GenAIOps 的工作流程。 從數據匯入到模型部署和評估的整個流程。 工作流程會使用持續整合和持續傳遞 (CI/CD) 做法。 主要工作包括精簡數據模型、評估批次、部署端點、實時評估模型,以及微調模型。 範例角色會參與整個工作流程。
使用案例:架構設計的角色
將程式連線到支持架構,可協助您識別角色需要與其互動的服務,並醒目提示潛在的提升技能領域。
若要將此連線可視化,請建立圖形化影像,以顯示架構元件連線的方式。 此視覺輔助可以說明服務之間的數據流和互動,以及流程在部署中的自動化方式。 它可協助項目關係人了解架構及其內不同角色的具體職責。
下圖顯示 Azure 上新式分析的 Lambda 架構。
後續步驟
接下來,請使用評估工具來評估您的設計。