다음을 통해 공유


Azure AI 이미지 및 비디오 처리 기술 선택

Azure AI 서비스는 개발자와 조직이 미리 빌드되고 사용자 지정 가능한 API 및 모델 없이 즉시 사용 가능하고 시장 준비가 되어 있고 책임감 있는 최첨단 지능형 애플리케이션을 만들 수 있도록 지원합니다.

이 문서에서는 시각적 분석 및 이미지 생성, 개체 감지, 이미지 분류 및 얼굴 인식과 같은 비디오 및 이미지 처리 기능을 제공하는 Azure AI 서비스에 대해 설명합니다.

Services

다음 서비스는 Azure AI 서비스에 대한 비디오 및 이미지 처리 기능을 제공합니다.

  • Azure OpenAI

    • 미리 학습된 생성 이미징 모델을 사용하여 자연어에서 이미지 생성을 위해 Azure OpenAI를 사용합니다 . 예를 들어 주문형 사용자 지정 아트가 생성됩니다.
    • 이미지에 대해 구체적이지 않은 광범위한 분석을 수행해야 하는 경우 Azure OpenAI를 사용합니다 . 예를 들어 접근성 설명을 생성합니다.
    • Azure Machine Learning에서 사용할 수 있는 오픈 소스 이미지 생성 모델을 사용하려는 경우 Azure OpenAI를 사용하지 마세요.
    • 양식 추출, 얼굴 인식 또는 도메인 특수 이미지 특성 검색과 같은 특정 유형의 이미지 처리를 수행해야 하는 경우 Azure OpenAI를 사용하지 마세요. 이러한 시나리오의 경우 이러한 용도로 특별히 학습된 AI 솔루션을 사용하거나 빌드합니다.
  • Azure AI Vision

    • 동작 및 기타 이벤트를 감지하려면 기본 OCR(광학 인식), 이미지 분석 또는 기본 비디오 분석이 필요한 경우 Vision 서비스를 사용합니다 .
    • 대규모의 다중 모달 기반 모델이 이미 지원하는 분석에는 Vision 서비스를 사용하지 마세요.
    • Vision 서비스를 사용하여 콘텐츠를 조정하지 마세요. 대신 콘텐츠 안전 서비스를 사용합니다.
  • Azure AI Custom Vision

    • Basic Vision 서비스의 이미지 분석에서 제공할 수 없는 특정 요구 사항이 있는 경우 서비스를 사용합니다 . 예를 들어 비정상적인 개체를 인식하거나, 결함을 제조하거나, 자세한 사용자 지정 분류를 제공하는 것이 좋습니다.
    • 기본 개체 감지 또는 얼굴 감지가 필요한 경우 서비스를 사용하지 마세요. 대신 Face 또는 Vision 서비스를 사용합니다.
    • 기본 시각적 분석에는 서비스를 사용하지 마세요. 대신 Azure OpenAI의 비전 지원 모델 또는 Azure Machine Learning의 오픈 소스 모델을 사용합니다.
  • Azure AI Face

    • 얼굴이 라이브인지, 스푸핑/가짜인지 확인하거나, 유사한 얼굴을 식별, 그룹화 또는 찾아야 하는 경우 Face 서비스를 사용합니다 .
    • Face 서비스를 사용하여 얼굴의 감정을 감지하거나 얼굴에 대한 다른 높은 수준의 추론을 수행하지 마세요. 이러한 작업에는 다중 모달 언어 모델을 대신 사용합니다.
  • Azure AI Video Indexer

    • Azure Video Indexer 서비스를 사용하여 Vision 서비스의 기본 비디오 분석에서 제공할 수 없는 고급 비디오 분석 관련 작업을 수행할 수 있습니다.
    • 사용자 계산, 동작 및 이벤트 감지와 같은 기본 비디오 분석 작업에는 Azure Video Indexer 서비스를 사용하지 마세요. Vision Service의 기본 비디오 분석은 이러한 작업에 더 비용 효율적입니다.

Azure OpenAI

Azure OpenAI 는 최신 세대의 GPT 모델을 포함하여 OpenAI의 강력한 언어 모델에 대한 액세스를 제공합니다. 이러한 이미지는 시각적 분석 및 이미지 세대를 지원하며 DALL-E 는 이미지 생성을 지원합니다.

Azure AI Vision

Azure AI Vision 는 관심 있는 시각적 기능을 기반으로 이미지를 처리하고 정보를 반환하는 고급 알고리즘을 제공합니다. OCR, Face 서비스, 이미지 및 공간 분석의 네 가지 서비스를 제공합니다.

기능

다음 표에서는 Azure AI Vision Service에서 사용할 수 있는 기능 목록을 제공합니다.

기능 설명
OCR(광학 인식) OCR(광학 인식) 서비스는 이미지에서 텍스트를 추출합니다. Read API를 사용하여 사진 및 문서에서 인쇄 및 필기 텍스트를 추출할 수 있습니다. 딥 러닝 기반 모델을 사용하고 다양한 표면 및 배경의 텍스트로 작업합니다. 여기에는 비즈니스 문서, 청구서, 영수증, 포스터, 명함, 문자 및 화이트보드가 포함됩니다. OCR API는 여러 언어로 인쇄된 텍스트 추출을 지원합니다.
이미지 분석 이미지 분석 서비스는 이미지에서 개체, 얼굴 및 자동 생성된 텍스트 설명과 같은 많은 시각적 특징을 추출합니다. Florence 기본 모델을 기반으로 하는 이미지 분석 4.0 사용하여 사용자 지정 이미지 식별자 모델을 만들 수도 있습니다.
동영상 분석 동영상 분석에는 공간 분석 및 동영상 검색과 같은 동영상 관련 기능이 포함됩니다. 공간 분석은 비디오 피드에 대한 사용자의 현재 상태와 이동을 분석하고 다른 시스템에서 응답할 수 있는 이벤트를 생성합니다.

Azure AI Custom Vision

Azure AI Custom Vision service은 이미지 인식 서비스입니다. 이를 통해 자체 이미지 식별자 모델을 빌드, 배포 및 개선할 수 있습니다. 이미지 식별자는 시각적 특성에 따라 이미지에 레이블을 적용합니다. 각 레이블은 분류 또는 개체를 나타냅니다. Custom Vision을 사용하면 고유한 레이블을 지정하고 사용자 지정 모델을 학습하여 검색할 수 있습니다.

Custom Vision 서비스는 기계 학습 알고리즘을 사용하여 사용자 지정 기능에 대한 이미지를 분석합니다. 찾고 있는 시각적 특성이 있는 이미지와 그렇지 않은 이미지 세트를 제출합니다. 그런 다음 제출할 때 이미지에 고유한 레이블(태그)로 레이블을 지정합니다. 알고리즘에서 이 데이터를 학습하고 동일한 해당 이미지에서 자체적으로 테스트하여 정확도를 계산합니다. 모델이 학습되면 테스트하고 다시 학습한 후 이미지 인식 앱에서 사용하여 이미지를 분류하거나 개체를 검색할 수 있습니다. 모델을 내보내서 오프라인에서 사용할 수도 있습니다.

기능

다음 표에서는 Azure AI Custom Vision Service에서 사용할 수 있는 기능 목록을 제공합니다.

기능 설명
이미지 분류 기능이라고 하는 입력 집합을 기반으로 범주 또는 클래스를 예측합니다. 가능한 각 클래스에 대한 확률 점수를 계산하고 개체가 속할 가능성이 가장 높은 클래스를 나타내는 레이블을 반환합니다. 이 모델을 사용하려면 기능 및 해당 레이블로 구성된 데이터가 필요합니다.
물체 감지 이미지에서 개체의 좌표를 가져옵니다. 이 모델을 사용하려면 기능 및 해당 레이블로 구성된 데이터가 필요합니다

사용 사례

다음 표에서는 Azure AI Custom Vision 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.

사용 사례 설명
IoT 디바이스와 함께 Custom Vision을 사용하여 시각적 상태 보고 Custom Vision을 사용하여 시각적 상태를 감지하도록 카메라로 디바이스를 학습시킵니다. 내보낸 ONNX 모델을 사용하여 IoT 디바이스에서 이 검색 시나리오를 실행할 수 있습니다. 시각적 상태는 빈 방 또는 사람이 있는 방, 빈 차도 또는 트럭이 있는 차도 등과 같이 이미지의 콘텐츠를 설명합니다.
카메라 사진에서 로고 인식 사진을 분석하고 특정 로고를 찾습니다.

Azure AI Face

Azure AI 얼굴 서비스 는 이미지에서 사람의 얼굴을 감지, 인식 및 분석하는 AI 알고리즘을 제공합니다. 얼굴 인식 소프트웨어는 ID 검증, 비접촉 액세스 제어, 개인 정보 보호를 위한 자동 얼굴 흐림 처리 등 여러 가지 경우에 중요합니다.

기능

다음 표에서는 Azure AI Face Service에서 사용할 수 있는 기능 목록을 제공합니다.

기능 설명
얼굴 감지 및 분석 일반적으로 얼굴 주위에 사각형을 형성하는 경계 상자 좌표를 반환하여 사람의 얼굴을 포함하는 이미지 영역을 식별합니다.
유사한 얼굴 찾기 유사 얼굴 찾기 작업은 대상 얼굴과 일련의 후보 얼굴 간 얼굴 일치를 수행하고 대상 얼굴과 비슷해 보이는 몇 개의 얼굴을 찾습니다. 이는 이미지별 얼굴 검색을 수행하는 데 유용합니다.
얼굴 그룹화 그룹화 작업은 알 수 없는 얼굴을 유사성에 따라 여러 개의 소그룹으로 나눕니다. 각 그룹은 서로 공통점이 없는 여러 개의 고유한 원래 얼굴에 속합니다. 또한 유사성을 찾을 수 없는 얼굴 ID를 포함하는 단일 "messyGroup" 배열을 반환합니다.
ID 얼굴 식별은 이미지의 한 면을 보안 리포지토리의 얼굴 세트와 일치시키는 "일 대 다"를 처리할 수 있습니다. 얼굴 데이터가 쿼리 얼굴과 일치하는 정도에 따라 일치 후보가 반환됩니다.
얼굴 인식 작업 최신 기업과 앱은 얼굴 확인("일대일" 일치) 및 얼굴 식별("일대다" 일치)을 포함한 얼굴 인식 기술을 사용하여 사용자가 최신 기업과 앱에서 주장하는 사람인지 확인할 수 있습니다.
생체 감지 생체 감지는 사용자가 실제로 카메라 앞에 있는지 여부를 확인하는 스푸핑 방지 기능입니다. 인쇄된 사진, 녹화된 동영상 또는 사용자 얼굴의 3D 마스크를 사용한 스푸핑 공격을 방지하는 데 사용됩니다.

사용 사례

다음 표에서는 Azure AI 얼굴 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.

사용 사례 설명
사용자 ID를 확인합니다. 신뢰할 수 있는 얼굴 이미지에 대해 사람을 확인합니다. 이 확인은 디지털 또는 물리적 속성에 대한 액세스 권한을 부여하는 데 사용할 수 있습니다. 대부분의 경우 신뢰할 수 있는 얼굴 이미지는 여권 또는 운전 면허증과 같은 정부 발급 ID에서 가져오거나 직접 찍은 등록 사진에서 가져올 수 있습니다. 확인 중에 활동성 감지는 이미지가 인쇄된 사진이나 마스크가 아닌 실제 사람에서 제공되는지 확인하는 데 중요한 역할을 할 수 있습니다.
얼굴 편집 개인 정보 보호를 위해 비디오에 녹화된 사용자의 얼굴을 편집하거나 흐리게 처리합니다.
비접촉 액세스 제어. 옵트인 얼굴 식별은 카드 또는 티켓과 같은 방법보다 향상된 액세스 제어 환경을 지원함과 동시에 물리적 미디어 공유, 분실 또는 도난으로 인한 디지털 위생 및 보안 위험을 줄일 수 있습니다. 얼굴 인식은 공항, 경기장, 테마파크, 빌딩의 체크 인과 사무실, 병원, 체육관, 클럽 또는 학교의 리셉션 키오스크의 체크 인 루프에서 사용자의 체크 인 프로세스를 지원합니다.

Azure AI Video Indexer

Azure AI Video Indexer 는 Azure AI 서비스(예: Face, Translator, Azure AI Vision 및 Speech)를 기반으로 하는 Azure AI 서비스의 일부인 클라우드 애플리케이션입니다. 이 애플리케이션을 사용하면 Azure AI Video Indexer 비디오 및 오디오 모델을 사용하여 비디오에서 인사이트를 추출할 수 있습니다.

기능

다음 표에서는 Azure AI Video Indexer 서비스에서 사용할 수 있는 몇 가지 기능 목록을 제공합니다.

기능 설명
다 언어 음성 식별 및 전사 오디오의 여러 세그먼트에서 음성 언어를 식별합니다. 미디어 파일의 각 세그먼트를 전사되도록 전송한 다음 전사를 다시 하나의 통합된 전사로 결합합니다.
얼굴 검색 비디오에 나타나는 얼굴을 감지하고 그룹화합니다.
유명인 식별 전 세계 지도자, 배우, 예술가, 운동선수, 연구원, 비즈니스 및 기술 리더와 같은 100만 명 이상의 유명인을 식별합니다. 이러한 유명인에 대한 데이터는 다양한 웹사이트(IMDB, Wikipedia 등)에서도 찾을 수 있습니다.
계정 기반 얼굴 식별 특정 계정에 대한 모델을 학습합니다. 그런 다음, 학습된 모델을 기반으로 비디오에서 얼굴을 인식합니다.
관찰된 사용자 추적(미리 보기) 비디오에서 관찰된 사람을 감지하고 비디오 프레임 내 사람의 위치(경계 상자 사용) 및 사람이 표시될 때의 정확한 타임스탬프(시작, 종료)와 신뢰도 같은 정보를 제공합니다.
오디오 대화 내용 기록 음성을 50개가 이상 언어의 텍스트로 변환하고 확장을 허용합니다.
언어 감지 기준 음성 언어를 식별합니다.
노이즈 감소 전화 통신 오디오 또는 시끄러운 녹음을 지웁니다(Skype 필터 기반).
번역 오디오 대본을 다양한 언어로 번역합니다.

Azure AI Video Indexer 서비스의 더 많은 기능을 검토하려면 Azure AI Video Indexer 설명서를 참조하세요 .

사용 사례

다음 표에서는 Azure AI Video Indexer 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.

사용 사례 설명
Deep search 비디오에서 추출한 인사이트를 사용하여 비디오 라이브러리 전반에서 검색 환경을 개선할 수 있습니다. 예를 들어 음성 단어와 얼굴을 인덱싱하면 비디오에서 사람이 특정 단어를 말했거나 두 사람이 함께 본 시점을 찾는 검색 환경을 사용할 수 있습니다. 비디오에서 이 인사이트에 기반한 검색은 뉴스 기관, 교육 기관, 방송사, 엔터테인먼트 콘텐츠 소유자, 엔터프라이즈 LOB 앱 및 일반적으로 사용자가 검색해야 하는 비디오 라이브러리가 있는 모든 산업에 적용됩니다.
콘텐츠 만들기 Azure AI Video indexer가 콘텐츠에서 추출하는 인사이트를 기반으로 트레일러, 하이라이트 릴, 소셜 미디어 콘텐츠 또는 뉴스 클립을 만듭니다. 사람 및 레이블 모양의 키 프레임, 장면 제작자 및 타임스탬프를 통해 만들기 프로세스가 훨씬 더 원활하고 쉽게 수행되어 콘텐츠를 만들 때 필요한 비디오 부분에 쉽게 접근할 수 있습니다.
접근성 장애가 있는 사람이 콘텐츠를 사용할 수 있게 하거나 다양한 언어를 사용하여 여러 지역에 콘텐츠를 배포하려는 경우 Azure AI Video Indexer에서 제공하는 기록과 번역을 여러 언어로 사용할 수 있습니다.
수익 창출 Azure AI Video Indexer는 비디오의 가치를 높이는 데 도움이 될 수 있습니다. 예를 들어 광고 수익(뉴스 미디어, 소셜 미디어 등)에 의존하는 산업은 추출된 인사이트를 광고 서버에 대한 추가 신호로 사용하여 관련 광고를 전달할 수 있습니다.
콘텐츠 조정 텍스트 및 시각적 콘텐츠 조정 모델을 사용하여 부적절한 콘텐츠로부터 사용자를 보호하고 게시하는 콘텐츠가 조직의 가치에 부합하는지 유효성을 검사합니다. 자동으로 특정 비디오를 차단하거나 사용자에게 콘텐츠에 관해 경고할 수 있습니다.
권장 사항 동영상 인사이트는 사용자에게 관련 동영상 순간을 강조하여 사용자 참여를 개선하는 데 사용할 수 있습니다. 추가 메타데이터로 비디오마다 태그를 지정하면 가장 관련성이 높은 비디오를 사용자에게 추천하고 필요 맞는 비디오의 부분을 강조 표시할 수 있습니다.

다음 단계