Azure AI 이미지 및 비디오 처리 기술 선택
Azure AI 서비스는 개발자와 조직이 미리 빌드되고 사용자 지정 가능한 API 및 모델 없이 즉시 사용 가능하고 시장 준비가 되어 있고 책임감 있는 최첨단 지능형 애플리케이션을 만들 수 있도록 지원합니다.
이 문서에서는 시각적 분석 및 이미지 생성, 개체 감지, 이미지 분류 및 얼굴 인식과 같은 비디오 및 이미지 처리 기능을 제공하는 Azure AI 서비스에 대해 설명합니다.
Services
다음 서비스는 Azure AI 서비스에 대한 비디오 및 이미지 처리 기능을 제공합니다.
-
- 미리 학습된 생성 이미징 모델을 사용하여 자연어에서 이미지 생성을 위해 Azure OpenAI를 사용합니다 . 예를 들어 주문형 사용자 지정 아트가 생성됩니다.
- 이미지에 대해 구체적이지 않은 광범위한 분석을 수행해야 하는 경우 Azure OpenAI를 사용합니다 . 예를 들어 접근성 설명을 생성합니다.
- Azure Machine Learning에서 사용할 수 있는 오픈 소스 이미지 생성 모델을 사용하려는 경우 Azure OpenAI를 사용하지 마세요.
- 양식 추출, 얼굴 인식 또는 도메인 특수 이미지 특성 검색과 같은 특정 유형의 이미지 처리를 수행해야 하는 경우 Azure OpenAI를 사용하지 마세요. 이러한 시나리오의 경우 이러한 용도로 특별히 학습된 AI 솔루션을 사용하거나 빌드합니다.
-
- 동작 및 기타 이벤트를 감지하려면 기본 OCR(광학 인식), 이미지 분석 또는 기본 비디오 분석이 필요한 경우 Vision 서비스를 사용합니다 .
- 대규모의 다중 모달 기반 모델이 이미 지원하는 분석에는 Vision 서비스를 사용하지 마세요.
- Vision 서비스를 사용하여 콘텐츠를 조정하지 마세요. 대신 콘텐츠 안전 서비스를 사용합니다.
-
- Basic Vision 서비스의 이미지 분석에서 제공할 수 없는 특정 요구 사항이 있는 경우 서비스를 사용합니다 . 예를 들어 비정상적인 개체를 인식하거나, 결함을 제조하거나, 자세한 사용자 지정 분류를 제공하는 것이 좋습니다.
- 기본 개체 감지 또는 얼굴 감지가 필요한 경우 서비스를 사용하지 마세요. 대신 Face 또는 Vision 서비스를 사용합니다.
- 기본 시각적 분석에는 서비스를 사용하지 마세요. 대신 Azure OpenAI의 비전 지원 모델 또는 Azure Machine Learning의 오픈 소스 모델을 사용합니다.
-
- 얼굴이 라이브인지, 스푸핑/가짜인지 확인하거나, 유사한 얼굴을 식별, 그룹화 또는 찾아야 하는 경우 Face 서비스를 사용합니다 .
- Face 서비스를 사용하여 얼굴의 감정을 감지하거나 얼굴에 대한 다른 높은 수준의 추론을 수행하지 마세요. 이러한 작업에는 다중 모달 언어 모델을 대신 사용합니다.
-
- Azure Video Indexer 서비스를 사용하여 Vision 서비스의 기본 비디오 분석에서 제공할 수 없는 고급 비디오 분석 관련 작업을 수행할 수 있습니다.
- 사용자 계산, 동작 및 이벤트 감지와 같은 기본 비디오 분석 작업에는 Azure Video Indexer 서비스를 사용하지 마세요. Vision Service의 기본 비디오 분석은 이러한 작업에 더 비용 효율적입니다.
Azure OpenAI
Azure OpenAI 는 최신 세대의 GPT 모델을 포함하여 OpenAI의 강력한 언어 모델에 대한 액세스를 제공합니다. 이러한 이미지는 시각적 분석 및 이미지 세대를 지원하며 DALL-E 는 이미지 생성을 지원합니다.
Azure AI Vision
Azure AI Vision 는 관심 있는 시각적 기능을 기반으로 이미지를 처리하고 정보를 반환하는 고급 알고리즘을 제공합니다. OCR, Face 서비스, 이미지 및 공간 분석의 네 가지 서비스를 제공합니다.
기능
다음 표에서는 Azure AI Vision Service에서 사용할 수 있는 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
OCR(광학 인식) | OCR(광학 인식) 서비스는 이미지에서 텍스트를 추출합니다. Read API를 사용하여 사진 및 문서에서 인쇄 및 필기 텍스트를 추출할 수 있습니다. 딥 러닝 기반 모델을 사용하고 다양한 표면 및 배경의 텍스트로 작업합니다. 여기에는 비즈니스 문서, 청구서, 영수증, 포스터, 명함, 문자 및 화이트보드가 포함됩니다. OCR API는 여러 언어로 인쇄된 텍스트 추출을 지원합니다. |
이미지 분석 | 이미지 분석 서비스는 이미지에서 개체, 얼굴 및 자동 생성된 텍스트 설명과 같은 많은 시각적 특징을 추출합니다. Florence 기본 모델을 기반으로 하는 이미지 분석 4.0 사용하여 사용자 지정 이미지 식별자 모델을 만들 수도 있습니다. |
동영상 분석 | 동영상 분석에는 공간 분석 및 동영상 검색과 같은 동영상 관련 기능이 포함됩니다. 공간 분석은 비디오 피드에 대한 사용자의 현재 상태와 이동을 분석하고 다른 시스템에서 응답할 수 있는 이벤트를 생성합니다. |
Azure AI Custom Vision
Azure AI Custom Vision service은 이미지 인식 서비스입니다. 이를 통해 자체 이미지 식별자 모델을 빌드, 배포 및 개선할 수 있습니다. 이미지 식별자는 시각적 특성에 따라 이미지에 레이블을 적용합니다. 각 레이블은 분류 또는 개체를 나타냅니다. Custom Vision을 사용하면 고유한 레이블을 지정하고 사용자 지정 모델을 학습하여 검색할 수 있습니다.
Custom Vision 서비스는 기계 학습 알고리즘을 사용하여 사용자 지정 기능에 대한 이미지를 분석합니다. 찾고 있는 시각적 특성이 있는 이미지와 그렇지 않은 이미지 세트를 제출합니다. 그런 다음 제출할 때 이미지에 고유한 레이블(태그)로 레이블을 지정합니다. 알고리즘에서 이 데이터를 학습하고 동일한 해당 이미지에서 자체적으로 테스트하여 정확도를 계산합니다. 모델이 학습되면 테스트하고 다시 학습한 후 이미지 인식 앱에서 사용하여 이미지를 분류하거나 개체를 검색할 수 있습니다. 모델을 내보내서 오프라인에서 사용할 수도 있습니다.
기능
다음 표에서는 Azure AI Custom Vision Service에서 사용할 수 있는 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
이미지 분류 | 이 기능이라고 하는 입력 집합을 기반으로 범주 또는 클래스를 예측합니다. 가능한 각 클래스에 대한 확률 점수를 계산하고 개체가 속할 가능성이 가장 높은 클래스를 나타내는 레이블을 반환합니다. 이 모델을 사용하려면 기능 및 해당 레이블로 구성된 데이터가 필요합니다. |
물체 감지 | 이미지에서 개체의 좌표를 가져옵니다. 이 모델을 사용하려면 기능 및 해당 레이블로 구성된 데이터가 필요합니다 |
사용 사례
다음 표에서는 Azure AI Custom Vision 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.
사용 사례 | 설명 |
---|---|
IoT 디바이스와 함께 Custom Vision을 사용하여 시각적 상태 보고 | Custom Vision을 사용하여 시각적 상태를 감지하도록 카메라로 디바이스를 학습시킵니다. 내보낸 ONNX 모델을 사용하여 IoT 디바이스에서 이 검색 시나리오를 실행할 수 있습니다. 시각적 상태는 빈 방 또는 사람이 있는 방, 빈 차도 또는 트럭이 있는 차도 등과 같이 이미지의 콘텐츠를 설명합니다. |
카메라 사진에서 로고 인식 | 사진을 분석하고 특정 로고를 찾습니다. |
Azure AI Face
Azure AI 얼굴 서비스 는 이미지에서 사람의 얼굴을 감지, 인식 및 분석하는 AI 알고리즘을 제공합니다. 얼굴 인식 소프트웨어는 ID 검증, 비접촉 액세스 제어, 개인 정보 보호를 위한 자동 얼굴 흐림 처리 등 여러 가지 경우에 중요합니다.
기능
다음 표에서는 Azure AI Face Service에서 사용할 수 있는 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
얼굴 감지 및 분석 | 일반적으로 얼굴 주위에 사각형을 형성하는 경계 상자 좌표를 반환하여 사람의 얼굴을 포함하는 이미지 영역을 식별합니다. |
유사한 얼굴 찾기 | 유사 얼굴 찾기 작업은 대상 얼굴과 일련의 후보 얼굴 간 얼굴 일치를 수행하고 대상 얼굴과 비슷해 보이는 몇 개의 얼굴을 찾습니다. 이는 이미지별 얼굴 검색을 수행하는 데 유용합니다. |
얼굴 그룹화 | 그룹화 작업은 알 수 없는 얼굴을 유사성에 따라 여러 개의 소그룹으로 나눕니다. 각 그룹은 서로 공통점이 없는 여러 개의 고유한 원래 얼굴에 속합니다. 또한 유사성을 찾을 수 없는 얼굴 ID를 포함하는 단일 "messyGroup" 배열을 반환합니다. |
ID | 얼굴 식별은 이미지의 한 면을 보안 리포지토리의 얼굴 세트와 일치시키는 "일 대 다"를 처리할 수 있습니다. 얼굴 데이터가 쿼리 얼굴과 일치하는 정도에 따라 일치 후보가 반환됩니다. |
얼굴 인식 작업 | 최신 기업과 앱은 얼굴 확인("일대일" 일치) 및 얼굴 식별("일대다" 일치)을 포함한 얼굴 인식 기술을 사용하여 사용자가 최신 기업과 앱에서 주장하는 사람인지 확인할 수 있습니다. |
생체 감지 | 생체 감지는 사용자가 실제로 카메라 앞에 있는지 여부를 확인하는 스푸핑 방지 기능입니다. 인쇄된 사진, 녹화된 동영상 또는 사용자 얼굴의 3D 마스크를 사용한 스푸핑 공격을 방지하는 데 사용됩니다. |
사용 사례
다음 표에서는 Azure AI 얼굴 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.
사용 사례 | 설명 |
---|---|
사용자 ID를 확인합니다. | 신뢰할 수 있는 얼굴 이미지에 대해 사람을 확인합니다. 이 확인은 디지털 또는 물리적 속성에 대한 액세스 권한을 부여하는 데 사용할 수 있습니다. 대부분의 경우 신뢰할 수 있는 얼굴 이미지는 여권 또는 운전 면허증과 같은 정부 발급 ID에서 가져오거나 직접 찍은 등록 사진에서 가져올 수 있습니다. 확인 중에 활동성 감지는 이미지가 인쇄된 사진이나 마스크가 아닌 실제 사람에서 제공되는지 확인하는 데 중요한 역할을 할 수 있습니다. |
얼굴 편집 | 개인 정보 보호를 위해 비디오에 녹화된 사용자의 얼굴을 편집하거나 흐리게 처리합니다. |
비접촉 액세스 제어. | 옵트인 얼굴 식별은 카드 또는 티켓과 같은 방법보다 향상된 액세스 제어 환경을 지원함과 동시에 물리적 미디어 공유, 분실 또는 도난으로 인한 디지털 위생 및 보안 위험을 줄일 수 있습니다. 얼굴 인식은 공항, 경기장, 테마파크, 빌딩의 체크 인과 사무실, 병원, 체육관, 클럽 또는 학교의 리셉션 키오스크의 체크 인 루프에서 사용자의 체크 인 프로세스를 지원합니다. |
Azure AI Video Indexer
Azure AI Video Indexer 는 Azure AI 서비스(예: Face, Translator, Azure AI Vision 및 Speech)를 기반으로 하는 Azure AI 서비스의 일부인 클라우드 애플리케이션입니다. 이 애플리케이션을 사용하면 Azure AI Video Indexer 비디오 및 오디오 모델을 사용하여 비디오에서 인사이트를 추출할 수 있습니다.
기능
다음 표에서는 Azure AI Video Indexer 서비스에서 사용할 수 있는 몇 가지 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
다 언어 음성 식별 및 전사 | 오디오의 여러 세그먼트에서 음성 언어를 식별합니다. 미디어 파일의 각 세그먼트를 전사되도록 전송한 다음 전사를 다시 하나의 통합된 전사로 결합합니다. |
얼굴 검색 | 비디오에 나타나는 얼굴을 감지하고 그룹화합니다. |
유명인 식별 | 전 세계 지도자, 배우, 예술가, 운동선수, 연구원, 비즈니스 및 기술 리더와 같은 100만 명 이상의 유명인을 식별합니다. 이러한 유명인에 대한 데이터는 다양한 웹사이트(IMDB, Wikipedia 등)에서도 찾을 수 있습니다. |
계정 기반 얼굴 식별 | 특정 계정에 대한 모델을 학습합니다. 그런 다음, 학습된 모델을 기반으로 비디오에서 얼굴을 인식합니다. |
관찰된 사용자 추적(미리 보기) | 비디오에서 관찰된 사람을 감지하고 비디오 프레임 내 사람의 위치(경계 상자 사용) 및 사람이 표시될 때의 정확한 타임스탬프(시작, 종료)와 신뢰도 같은 정보를 제공합니다. |
오디오 대화 내용 기록 | 음성을 50개가 이상 언어의 텍스트로 변환하고 확장을 허용합니다. |
언어 감지 | 기준 음성 언어를 식별합니다. |
노이즈 감소 | 전화 통신 오디오 또는 시끄러운 녹음을 지웁니다(Skype 필터 기반). |
번역 | 오디오 대본을 다양한 언어로 번역합니다. |
Azure AI Video Indexer 서비스의 더 많은 기능을 검토하려면 Azure AI Video Indexer 설명서를 참조하세요 .
사용 사례
다음 표에서는 Azure AI Video Indexer 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.
사용 사례 | 설명 |
---|---|
Deep search | 비디오에서 추출한 인사이트를 사용하여 비디오 라이브러리 전반에서 검색 환경을 개선할 수 있습니다. 예를 들어 음성 단어와 얼굴을 인덱싱하면 비디오에서 사람이 특정 단어를 말했거나 두 사람이 함께 본 시점을 찾는 검색 환경을 사용할 수 있습니다. 비디오에서 이 인사이트에 기반한 검색은 뉴스 기관, 교육 기관, 방송사, 엔터테인먼트 콘텐츠 소유자, 엔터프라이즈 LOB 앱 및 일반적으로 사용자가 검색해야 하는 비디오 라이브러리가 있는 모든 산업에 적용됩니다. |
콘텐츠 만들기 | Azure AI Video indexer가 콘텐츠에서 추출하는 인사이트를 기반으로 트레일러, 하이라이트 릴, 소셜 미디어 콘텐츠 또는 뉴스 클립을 만듭니다. 사람 및 레이블 모양의 키 프레임, 장면 제작자 및 타임스탬프를 통해 만들기 프로세스가 훨씬 더 원활하고 쉽게 수행되어 콘텐츠를 만들 때 필요한 비디오 부분에 쉽게 접근할 수 있습니다. |
접근성 | 장애가 있는 사람이 콘텐츠를 사용할 수 있게 하거나 다양한 언어를 사용하여 여러 지역에 콘텐츠를 배포하려는 경우 Azure AI Video Indexer에서 제공하는 기록과 번역을 여러 언어로 사용할 수 있습니다. |
수익 창출 | Azure AI Video Indexer는 비디오의 가치를 높이는 데 도움이 될 수 있습니다. 예를 들어 광고 수익(뉴스 미디어, 소셜 미디어 등)에 의존하는 산업은 추출된 인사이트를 광고 서버에 대한 추가 신호로 사용하여 관련 광고를 전달할 수 있습니다. |
콘텐츠 조정 | 텍스트 및 시각적 콘텐츠 조정 모델을 사용하여 부적절한 콘텐츠로부터 사용자를 보호하고 게시하는 콘텐츠가 조직의 가치에 부합하는지 유효성을 검사합니다. 자동으로 특정 비디오를 차단하거나 사용자에게 콘텐츠에 관해 경고할 수 있습니다. |
권장 사항 | 동영상 인사이트는 사용자에게 관련 동영상 순간을 강조하여 사용자 참여를 개선하는 데 사용할 수 있습니다. 추가 메타데이터로 비디오마다 태그를 지정하면 가장 관련성이 높은 비디오를 사용자에게 추천하고 필요 맞는 비디오의 부분을 강조 표시할 수 있습니다. |
다음 단계
- Azure AI 비전이란?
- 학습 경로: Azure AI Services를 사용하여 자연어 처리 솔루션 개발
- 학습 경로: Azure AI Services 시작
- 학습 경로: Microsoft Azure AI Fundamentals: Computer Vision
- 학습 경로: Azure 비전을 사용하여 Computer Vision 솔루션 만들기
- 학습 경로: Azure IoT Edge 및 Azure AI services를 사용하여 이미지 인식 솔루션 만들기