편집

다음을 통해 공유


Azure의 이미지 분류

Azure Blob Storage
Azure Computer Vision
Azure Cosmos DB
Azure Event Grid
Azure 기능

솔루션 아이디어

이 문서에서는 솔루션 아이디어를 설명합니다. 클라우드 설계자는 이 지침을 사용하여 이 아키텍처의 일반적인 구현을 위한 주요 구성 요소를 시각화할 수 있습니다. 이 문서를 시작점으로 사용하여 워크로드의 특정 요구 사항에 맞는 잘 설계된 솔루션을 디자인할 수 있습니다.

Computer Vision API 및 Azure Functions와 같은 Azure 서비스를 사용하면 회사는 비용을 절감하고 Microsoft가 이미 Azure AI 서비스를 사용하여 이미지를 처리하면서 개발한 전문 지식을 활용하면서 개별 서버를 관리할 필요가 없습니다. 이 솔루션 아이디어는 특히 이미지 처리 사용 사례를 다룹니다. 다른 AI 요구 사항이 있는 경우 Azure AI 서비스 전체 제품군을 고려하세요.

건축학

이미지 분류 작업에 사용되는 아키텍처의 다이어그램입니다.

이 솔루션 아이디어의 Visio 파일 다운로드합니다.

데이터 흐름

이 시나리오에서는 웹 또는 모바일 애플리케이션의 백 엔드 구성 요소를 다룹니다. 데이터는 다음과 같이 시나리오를 통해 흐릅니다.

  1. Blob Storage에 새 파일(이미지 업로드)을 추가하면 Azure Event Grid에서 이벤트가 트리거됩니다. 업로드 프로세스는 웹 또는 모바일 애플리케이션을 통해 오케스트레이션할 수 있습니다. 또는 이미지를 Azure Blob Storage에 별도로 업로드할 수 있습니다.
  2. Event Grid는 Azure 함수를 트리거하는 알림을 보냅니다.
  3. Azure Functions는 Azure AI Vision API를 호출하여 새로 업로드된 이미지를 분석합니다. Azure AI Vision은 Azure Functions에서 구문 분석한 Blob URL을 통해 이미지에 액세스합니다.
  4. Azure Functions는 Azure Cosmos DB에서 AI Vision API 응답을 유지합니다. 이 응답에는 이미지 메타데이터와 함께 분석 결과가 포함됩니다.
  5. 결과는 웹 또는 모바일 프런트 엔드에서 사용하고 반영할 수 있습니다. 이 방법은 업로드된 이미지가 아닌 분류 결과를 검색합니다.

구성 요소

  • Azure AI Vision Azure AI 서비스 제품군의 일부이며 각 이미지에 대한 정보를 검색하는 데 사용됩니다.
  • Azure Functions 웹 애플리케이션에 대한 백 엔드 API를 제공합니다. 이 플랫폼은 업로드된 이미지에 대한 이벤트 처리도 제공합니다.
  • Azure Event Grid 새 이미지가 Blob Storage에 업로드될 때 이벤트를 트리거합니다. 그런 다음 Azure Functions를 사용하여 이미지를 처리합니다.
  • Azure Blob Storage 웹 애플리케이션에 업로드된 모든 이미지 파일과 웹 애플리케이션에서 사용하는 모든 정적 파일을 저장합니다.
  • Azure Cosmos DB Computer Vision API의 처리 결과를 포함하여 업로드되는 각 이미지에 대한 메타데이터를 저장합니다.

대안

  • Azure OpenAI GPT-4o 및 GPT-4o-mini . GPT-4o 및 GPT-4o-mini는 제공하는 이미지에 있는 내용에 대한 일반적인 질문에 대답할 수 있는 OpenAI의 멀티모달 채팅 모델입니다.
  • Custom Vision Service . Computer Vision API는 분류 기반 범주 집합을 반환합니다. Computer Vision API에서 반환되지 않는 정보를 처리해야 하는 경우 사용자 지정 이미지 분류자를 빌드할 수 있는 Custom Vision Service를 고려합니다. 이 서비스에 대해 알아보려면 빠른 시작 Custom Vision사용하여 이미지 분류 모델 빌드를 수행합니다.
  • Azure AI Search . 사용 사례에 메타데이터를 쿼리하여 특정 조건을 충족하는 이미지를 찾는 경우 Azure AI Search를 사용하는 것이 좋습니다. Azure AI 검색 이 워크플로를 원활하게 통합합니다.
  • Logic Apps. Blob에 추가된 파일에 대해 실시간으로 반응할 필요가 없는 경우 Logic Apps 사용을 고려할 수 있습니다. 파일이 추가되었는지 확인할 수 있는 논리 앱은 되풀이 트리거 또는 슬라이딩 윈도우 트리거의해 시작될 수 있습니다.
  • 문서에 이미지가 포함된 경우 Azure AI Document Intelligence 사용하여 해당 이미지를 찾습니다. 이 정보를 사용하여 포함된 이미지에서 추가 컴퓨터 비전 작업을 추출하고 수행할 수 있습니다. 문서 인텔리전스를 사용하여 Computer Vision API를 통해 받은 이미지의 다른 메타데이터와 함께 저장할 수 있는 페이지 번호 또는 캡션 텍스트와 같은 포함된 이미지에 대한 데이터를 수집합니다. 이미지가 주로 문서의 사진 또는 스캔인 경우 Document Intelligence 사용자 지정 분류 모델 사용하여 입력 파일 분류를 한 번에 한 페이지씩 수행하여 문서를 식별합니다. 이 방법은 입력 파일 내에서 여러 문서 또는 단일 문서의 여러 인스턴스를 식별할 수도 있습니다.

시나리오 세부 정보

이 시나리오는 이미지를 처리해야 하는 비즈니스와 관련이 있습니다.

잠재적인 애플리케이션에는 패션 웹 사이트에 대한 이미지 분류, 보험 청구에 대한 텍스트 및 이미지 분석 또는 게임 스크린샷의 원격 분석 데이터 이해가 포함됩니다. 일반적으로 기업은 기계 학습 모델에 대한 전문 지식을 개발하고, 모델을 학습시키고, 마지막으로 사용자 지정 프로세스를 통해 이미지를 실행하여 이미지에서 데이터를 가져와야 합니다.

잠재적인 사용 사례

이 솔루션은 소매, 게임, 금융 및 보험 산업에 이상적입니다. 기타 관련 사용 사례는 다음과 같습니다.

  • 패션 웹 사이트에서 이미지 분류 판매용 플랫폼에서 제품 사진을 업로드하는 동안 판매자가 이미지 분류를 사용할 수 있습니다. 그런 다음 관련된 결과적인 수동 태그 지정을 자동화할 수 있습니다. 고객은 제품의 시각적 인상을 검색할 수도 있습니다.

  • 게임 스크린샷에서 원격 분석 데이터 분류 스크린샷에서 비디오 게임의 분류는 컴퓨터 비전과 함께 소셜 미디어의 관련 문제로 진화하고 있습니다. 예를 들어 Twitch 스트리머가 연속적으로 다른 게임을 플레이할 때 스트림 정보를 수동으로 업데이트하는 것을 건너뛸 수 있습니다. 스트림 정보를 업데이트하지 않으면 사용자 검색에서 스트림이 잘못 분류될 수 있으며 콘텐츠 작성자와 스트리밍 플랫폼 모두에 대한 잠재적인 시청률이 손실될 수 있습니다. 새로운 게임을 소개하는 동안, 사용자 지정 모델 경로는 해당 게임에서 새로운 이미지를 감지하는 기능을 소개하는 데 도움이 될 수 있습니다.

  • 보험 청구에 대한 이미지 분류 이미지 분류는 클레임 처리 및 인수의 시간과 비용을 줄이는 데 도움이 될 수 있습니다. 자연 재해 피해, 차량 손상을 분석하고 주거 및 상업용 부동산을 식별하는 데 도움이 될 수 있습니다.

다음 단계

제품 설명서

안내 학습 경로는 다음을 참조하세요.