다음을 통해 공유


AI 워크로드를 위한 워크로드 팀 페르소나

AI 워크로드를 빌드하는 컨텍스트에서는 기존 코드 배포와 달리 비결정적 모델에는 여러 역할 및 팀에서 반복적인 실험과 협업이 필요합니다. 운영, 애플리케이션 개발 및 데이터 팀의 초기 통합은 상호 이해를 촉진하는 데 필수적입니다. 이 협업은 기술 발전에 보조를 맞추기 위해 다양한 기술과 지속적인 학습을 요구합니다.

효과적인 협업은 도구, 프로세스 및 통합에 달려 있으며 워크로드 요구 사항 및 특정 목표에 따라 달라집니다. 권장되는 전략은 다음과 같습니다.

  • 명확한 역할 및 책임 설정
  • 팀의 기술 능력을 활용하여 적절한 작업을 수행합니다.
  • 공유 백로그의 일부로 작업 추적과 같은 프로세스 및 하위 프로세스를 표준화합니다.
  • 자동화를 사용하여 일관성과 재현성을 달성합니다.

가상 사용자는 이러한 전략을 구체화하고 책임을 표준화하기 위한 효과적인 도구가 될 수 있습니다. 이 문서에서는 AI 워크로드의 가상 사용자와 워크로드 디자인의 이점에 대해 설명합니다. 또한 이러한 팀 수준 페르소나를 효과적으로 정의하고 사용하기 위한 예제와 도구를 제공합니다.

페르소나란?

페르소나(Personas)는 워크로드 생성 및 운영과 관련된 인간 및 프로세스의 하위 집합을 나타냅니다. 페르소나에서는 이러한 개인 및 프로세스의 역할과 실제 행동 및 책임을 모두 포착합니다. 개인은 컨텍스트에 따라 하나 이상의 가상 사용자를 구현할 수 있습니다. 페르소나는 사람이 될 필요가 없습니다. 아키텍처의 에이전트 프로세스와 같은 무인 프로세스일 수도 있습니다.

워크로드에는 기능 개발을 주도하는 사용자 페르소나가 있을 수 있습니다. 해당 페르소나는 이 문서의 대상에 포함되지 않습니다.

조직 내에서 상대적으로 정적인 역할과 달리, 페르소나는 동적이며 목표 지향적입니다. 아키텍처 구성 요소와 같은 프로세스 및 도구에 기술 요구 사항을 매핑하는 데 사용할 수 있습니다. 가상 사용자는 주로 책임 범위를 정의하고 프로젝트 내에서 컨텍스트를 설정하는 데 도움이 됩니다. 다음과 같은 몇 가지 다른 이점을 제공합니다.

  • 리소스 부족 식별 격차를 파악하면 리소스를 모집하거나 학습할지 또는 솔루션을 다시 디자인할지 결정하는 데 도움이 됩니다. 워크로드 팀에 필요한 역할을 가진 개인이 없는 경우 아키텍처를 조정하거나, 프로세스를 수정하거나, 새 직원을 채용해야 할 수도 있습니다. 예를 들어 선임 데이터 과학 페르소나가 없는 경우 범용 SaaS(Software as a Service) AI 솔루션에 더 많이 의존하도록 아키텍처를 다시 디자인하거나 타사 AI 솔루션을 통합할 수 있습니다.
  • 향상된 기술. 페르소나를 특정 아키텍처 구성 요소에 매핑하면 세션 및 온라인 과정과 같은 교육 기회를 용이하게 하여 기술을 향상시킬 수 있습니다.
  • 적절한 수준의 액세스 보장. 페르소나를 사용하여 페르소나를 프로세스, 아키텍처 및 서비스에 매핑하여 보안 및 액세스 요구 사항을 정의해야 합니다. 이 매핑은 적절한 액세스 수준을 보장하는 데 도움이 됩니다.
  • 프로젝트 계획 및 통신을 용이하게 합니다. 프로젝트 계획에서 가상 사용자는 동기화 모임 및 전반적인 계획을 쉽게 설정할 수 있도록 주요 상호 작용을 식별하는 데 도움이 됩니다. 일반적으로 가상 사용자는 프로젝트 관리를 간소화하기 위해 사용자 스토리, 기능 및 요구 사항을 추적하는 계층 구조에 통합됩니다.

가상 사용자를 정의하는 방법

팀 구성원의 전문화를 식별하고 AI 작업 또는 디자인에서 적절한 역할에 맞게 조정합니다. 페르소나의 스킬 기대치, 팀 정보, 및 참여하게 될 프로세스를 문서화하는 템플릿을 만듭니다.

다음은 기준 템플릿의 예입니다.

페르소나 템플릿
🔹페르소나 이름: [이름]
🔹팀: [페르소나를 담당하는 팀]
🔹기본 상호 작용: [페르소나가 상호 작용하는 다른 팀]
🔹구성 요소 액세스: [프로세스 및 시스템 구성 요소에 대한 보안 및 액세스 요구 사항]
🔹프로세스: [가상 사용자가 담당하거나 기여하는 프로세스]
🔹기술: [모델 학습 또는 검색 인덱스 최적화와 같은 도메인 및 기술 관련 작업을 완료하는 데 필요한 기술]

도구

테이블을 사용하여 각 가상 사용자에 대한 정보를 구성하고 시각화할 수 있습니다. 이 방법의 장점 중 하나는 보다 구체적인 정보를 제공하는 다른 테이블을 만들고 연결할 수 있다는 것입니다. 예를 들어 아키텍처 구성 요소를 각 서비스 및 환경(Dev, Stage, Production)에 대해 ID 기반 액세스 제어가 지정된 다른 테이블에 연결할 수 있습니다.

거래. 가상 사용자가 너무 적으면 최소한의 권한으로 역할 기반 액세스 제어를 구현하고 작업 책임을 효과적으로 배포하기가 어려울 수 있습니다. 반대로 가상 사용자가 너무 많으면 관리 오버헤드가 추가됩니다. 5~10개의 가상 사용자부터 시작하는 것이 좋은 균형이며 작업에 필요한 가상 사용자만 추가해야 합니다.

카드를 사용하여 가상 사용자를 정의할 수도 있습니다. 이러한 카드는 테이블과 동일한 정보 또는 빠른 요약을 포함합니다. PowerPoint를 사용하거나 Markdown 파일 집합을 만들어 이러한 카드를 만들 수 있습니다.

경우에 따라 도구 조합을 사용할 수 있습니다. 예를 들어 가상 사용자 카드의 각 아키텍처 구성 요소는 각 서비스 및 환경에 대한 보안 및 역할 기반 액세스 제어를 매핑하는 테이블을 포함하는 Markdown 파일을 열 수 있습니다. 예제는 MLOps 가속기: ID RBAC참조하세요.

예제 페르소나

카드를 사용하여 가상 사용자가 프로세스 내에서 액세스할 수 있어야 하는 서비스를 정의하고 각 페르소나에 필요한 기술(개인이든 에이전트이든)을 간략하게 설명할 수 있습니다.

Important

여기에 정의된 가상 사용자가 기준 예제로 사용되더라도 테이블, 가상 사용자 템플릿 카드 및 그래프와 같은 도구를 사용하여 사용자 고유의 가상 사용자를 만드는 것이 좋습니다.

이러한 가상 사용자가 프로세스, 조직, 사용자와 연계되는 것이 중요합니다.

AI 데이터 엔지니어(P001)
팀: 데이터 수집 팀
🔹 주요 상호 작용: AI 개발 팀
🔹 구성 요소 액세스: Azure Data Factory, Azure Databricks, Azure SQL Database, Azure Storage
🔹 프로세스: DataOps, ETL, ELT
🔹 기술: SQL, Python, PySpark
BI 분석가(P003)
팀: 분석 팀
🔹 기본 상호 작용: 데이터 수집 팀
🔹 구성 요소 액세스: Power BI, Azure Data Explorer, Azure Storage
🔹 프로세스: 데이터 분석, 데이터 웨어하우징
🔹 기술: SQL, Python, PySpark
차별적 AI 데이터 과학자(P004)
팀: AI 팀
🔹 기본 상호 작용: 데이터 수집 팀, DevOps 팀
🔹 구성 요소 액세스: Azure Machine Learning, Azure Databricks, Azure Storage, Azure Key Vault
🔹 프로세스: MLOps, MLflow
🔹 기술: Azure Machine Learning, Python, 모델 학습
GenAI 데이터 과학자(P006)
팀: AI 팀
🔹 기본 상호 작용: 데이터 수집 팀, DevOps 팀
🔹 구성 요소 액세스: Azure AI Foundry Portal, Azure OpenAI Service, Azure AI Search, Azure Storage, Azure Key Vault
🔹 프로세스: GenAIOps
🔹 기술: Azure Machine Learning, Python, 모델 지식(LLM, SLM), 미세 조정, RAG, 에이전트 개념
GenAI 채팅 개발자(P007)
팀: 엔지니어링 팀
🔹 기본 상호 작용: AI 팀
🔹 구성 요소 액세스: Azure Web Apps, Azure API Management, Azure Cosmos DB, Azure Container Apps, Azure Functions
🔹 프로세스: DevOps, 이벤트 기반 처리, 마이크로 서비스
🔹 기술: 웹 애플리케이션 아키텍처(프런트 엔드/백 엔드), React, Node.js, HTML, CSS
빌드 에이전트 MLOps(P009)
팀: 엔지니어링 팀
🔹 주요 상호 작용: AI팀
🔹 구성 요소 액세스: Azure Machine Learning, Azure DevOps, GitHub
🔹 프로세스: 람다, 외부 루프 MLOps의 처리 및 제공
🔹 기술: Python, Pyspark

사용 사례: AI 프로세스용 가상 사용자

이러한 주요 프로세스는 AI 워크로드에서 사용됩니다.

  • DataOps는 데이터의 수집 및 준비입니다.
  • MLOps는 기계 학습 모델의 운영화입니다.
  • GenAIOps는 기존 모델의 검색 및 평가이며 이러한 모델을 워크로드 컨텍스트로 구체화합니다.
  • 내부 루프는 개발 과정에서 솔루션을 세부 조정하는 것으로, 이는 연구 중 또는 외부 루프 모니터링에 의해 지시될 수 있습니다.
  • 외부 루프는 개발에서 프로덕션으로 솔루션을 이동하는 것입니다. 이 루프는 지속적인 모니터링 및 평가를 사용하여 필요한 개선 사항을 식별합니다.

이러한 프로세스에 가상 사용자를 매핑하면 각 가상 사용자에 대한 컨텍스트가 제공됩니다. 이 단계는 페르소나가 업스킬링이 필요할 수 있는 프로세스를 식별하는 데 도움이 될 수 있습니다.

프로덕션 환경 내에서 DataOps, MLOps 및 GenAIOps를 보여 주는 다이어그램

이미지는 프로덕션 환경 내의 DataOps, MLOps 및 GenAIOps에 대한 워크플로를 보여줍니다. 데이터는 수집에서 모델 배포 및 평가로 흐릅니다. 워크플로는 CI/CD(지속적인 통합 및 지속적인 업데이트) 사례를 사용합니다. 주요 작업에는 데이터 모델 구체화, 일괄 처리 평가, 엔드포인트 배포, 실시간으로 모델 평가 및 모델 미세 조정이 포함됩니다. 예제 가상 사용자는 전체 워크플로에 참여합니다.

사용 사례: 아키텍처 디자인에 대한 가상 사용자

프로세스를 지원 아키텍처에 연결하면 가상 사용자가 상호 작용하는 데 필요한 서비스를 식별하고 잠재적인 업스킬링을 위한 영역을 강조 표시할 수 있습니다.

이 연결을 시각화하려면 아키텍처 구성 요소가 연결되는 방법을 보여 주는 그래픽 이미지를 만듭니다. 이 시각적 지원은 서비스 간의 데이터 흐름 및 상호 작용과 배포에서 흐름이 자동화되는 방법을 보여 줍니다. 이해 관계자가 아키텍처와 그 안에 있는 다른 가상 사용자의 역할을 이해하는 데 도움이 됩니다.

다음 이미지는 Azure에서 최신 분석을 위한 람다 아키텍처를 보여 줍니다.

Azure에서 최신 분석을 위한 람다 아키텍처를 보여 주는 다이어그램

다음 단계

다음으로, 평가 도구로 디자인을 평가합니다.