Azure의 AI 워크로드에 대한 리소스 선택 권장 사항
이 문서에서는 Azure에서 AI 워크로드를 실행하는 조직에 대한 리소스 선택 권장 사항을 제공합니다. Azure AI Studio, Azure OpenAI, Azure Machine Learning 및 Azure AI Services를 비롯한 Azure AI PaaS(Platform-as-a-Service) 솔루션에 중점을 둡니다. 생성 및 비제전적 AI 워크로드를 모두 다룹니다.
정보에 입각한 AI 리소스를 선택하면 조직은 AI 워크로드를 관리할 때 성능, 확장성 및 비용 효율성을 높일 수 있습니다. 다음 표에서는 기본 Azure AI PaaS 솔루션 및 중요한 의사 결정 기준에 대한 개요를 제공합니다.
AI 플랫폼 | AI 유형 | 설명 | 필요한 기술 |
---|---|---|---|
Azure OpenAI | 생성 AI | OpenAI 모델에 액세스하기 위한 플랫폼 | 개발자 및 데이터 과학 기술 |
Azure AI Studio | 생성 AI | 프롬프트 엔지니어링 및 생성 AI 엔드포인트 배포를 위한 플랫폼 | 개발자 및 데이터 과학 기술 |
Azure AI 서비스 | 분석 AI | 미리 빌드된 기계 학습 모델을 사용하는 플랫폼 | 개발자 기술 |
Azure Machine Learning | 기계 학습 | 기계 학습 모델 학습 및 배포를 위한 플랫폼 | 개발자 기술 및 고급 데이터 과학 기술 |
생성 AI 워크로드에 대한 리소스 선택
생성 AI를 사용하려면 입력 데이터를 기반으로 의미 있는 출력을 처리하고 생성하기 위해 다양한 리소스의 조합이 필요합니다. 적절한 선택을 통해 RAG(검색 보강 세대)를 사용하는 것과 같은 생성 AI 애플리케이션이 AI 모델을 접지하여 정확한 기능을 제공할 수 있습니다.
일반적인 RAG 워크로드에서 (1) 워크로드는 사용자 쿼리를 받습니다. (2) 프롬프트 흐름, 의미 체계 커널 또는 LangChain과 같은 오케스트레이터가 데이터 흐름을 관리합니다. (3) 검색 및 검색 메커니즘은 생성 AI 엔드포인트에 보낼 적절한 (4) 접지 데이터를 찾습니다. (5) 생성 AI 모델 엔드포인트는 사용자 쿼리 및 접지 데이터를 기반으로 응답을 생성합니다. 다음 권장 사항을 프레임워크로 사용하여 생성 RAG 워크로드를 빌드합니다.
생성 AI 플랫폼을 선택합니다. Azure OpenAI 또는 Azure AI Studio를 사용하여 생성 AI 모델을 배포하고 관리합니다. Azure OpenAI 서비스는 OpenAI 모델 프라이빗 네트워킹 및 콘텐츠 필터링에 대한 액세스를 제공합니다. Azure AI Studio 는 AI 워크로드를 개발하기 위한 코드 우선 플랫폼을 제공합니다. 애플리케이션을 빌드하고 배포하기 위한 기본 제공 도구가 있습니다. 또한 대형 모델 카탈로그, 프롬프트 흐름, 미세 조정, 콘텐츠 안전 필터 등을 제공합니다.
적절한 AI 컴퓨팅 유형을 선택합니다. Azure AI Studio에는 프롬프트 흐름, 인덱스 만들기 및 스튜디오 내에서 Visual Studio Code(웹 또는 데스크톱) 열기를 위한 컴퓨팅 인스턴스 가 필요합니다. 성능 및 예산 요구 사항에 따라 컴퓨팅 유형을 선택합니다.
오케스트레이터를 선택합니다. 생성 AI에 널리 사용되는 오케스트레이터에는 의미 체계 커널, 프롬프트 흐름 및 LangChain이 있습니다. 의미 체계 커널은 Azure 서비스와 통합됩니다. LangChain은 Microsoft 에코시스템을 넘어서 확장성을 제공합니다.
검색 및 지식 검색 메커니즘을 선택합니다. 생성 AI 모델을 기초로 하려면 관련 데이터 검색을 위한 인덱스 또는 벡터 데이터베이스를 만듭니다. Azure AI Search를 사용하여 다양한 데이터 원본에서 기존 및 벡터 인덱스를 빌드하고, 데이터 청크를 적용하고, 여러 쿼리 형식을 사용합니다. 데이터가 구조적 데이터베이스에 있는 경우 Azure Cosmos DB, Azure Database for PostgreSQL 및 Azure Cache for Redis를 사용하는 것이 좋습니다.
데이터를 접지할 데이터 원본을 선택합니다. 이미지, 오디오, 비디오 또는 큰 데이터 세트의 경우 Azure Blob Storage에 접지 데이터를 저장합니다. 또는 Azure AI Search 또는 벡터 데이터베이스에서 지원하는 데이터베이스를 사용합니다.
컴퓨팅 플랫폼을 선택합니다. Azure 컴퓨팅 의사 결정 트리 를 사용하여 워크로드에 적합한 플랫폼을 선택합니다.
비제전적 AI 워크로드에 대한 리소스 선택
비제전적 AI 워크로드는 플랫폼, 컴퓨팅 리소스, 데이터 원본 및 데이터 처리 도구를 사용하여 기계 학습 작업을 지원합니다. 올바른 리소스를 선택하면 미리 빌드된 솔루션과 사용자 지정 솔루션을 모두 사용하여 AI 워크로드를 빌드할 수 있습니다.
비제전적 AI 워크로드에서 (1) 워크로드는 데이터를 수집합니다. (2) 선택적 데이터 처리 메커니즘은 들어오는 데이터를 추출하거나 조작합니다. (3) AI 모델 엔드포인트가 데이터를 분석합니다. (4) 데이터는 AI 모델의 학습 또는 미세 조정을 지원합니다. 다음 권장 사항을 프레임워크로 사용하여 비제전적 AI 워크로드를 빌드합니다.
비제전적 AI 플랫폼을 선택합니다. Azure AI 서비스는 데이터 과학 기술이 필요하지 않은 미리 빌드된 AI 모델을 제공합니다. 올바른 Azure AI 서비스를 선택하는 방법에 대한 지침은 Azure AI 서비스 기술 선택을 참조하세요. Azure Machine Learning 은 사용자 고유의 데이터를 사용하여 기계 학습 모델을 빌드하고 AI 워크로드에서 해당 모델을 사용하는 플랫폼을 제공합니다.
적절한 AI 컴퓨팅을 선택합니다. Azure Machine Learning의 경우 작업을 실행하거나 엔드포인트를 호스트하려면 컴퓨팅 리소스가 필요합니다. 성능 및 예산 요구 사항을 충족하는 컴퓨팅 유형을 사용합니다. Azure AI 서비스에는 컴퓨팅 리소스가 필요하지 않습니다.
데이터 원본을 선택합니다. Azure Machine Learning의 경우 지원되는 데이터 원본 중 하나를 사용하여 학습 데이터를 호스트합니다. Azure AI 서비스의 경우 대부분의 서비스에는 미세 조정 데이터가 필요하지 않으며, Azure AI Custom Vision과 같은 일부 서비스는 관리되는 데이터 스토리지 솔루션에 로컬 파일을 업로드하는 옵션을 제공합니다.
컴퓨팅 플랫폼을 선택합니다. Azure 컴퓨팅 의사 결정 트리 를 사용하여 올바른 워크로드 플랫폼을 선택합니다.
데이터 처리 서비스 선택(선택 사항). Azure Functions는 서버리스 옵션을 제공하기 때문에 일반적인 데이터 처리 선택입니다. Azure Event Grid는 데이터 처리 파이프라인을 시작하는 일반적인 트리거 메커니즘이기도 합니다.