텍스트 읽기를 위한 Azure AI 비전 옵션 살펴보기
Azure AI는 문서와 이미지에서 텍스트를 읽는 두 가지 기능을 제공합니다. 하나는 Azure AI Vision Service, 다른 하나는 Azure AI Document Intelligence에 있습니다. 각 서비스가 제공하는 항목은 겹치게 되지만 각 서비스는 입력 내용에 따라 결과에 최적화됩니다.
- 이미지 분석 OCR(광학 문자 인식):
- 이 기능은 텍스트 양이 적은 일반 구조화되지 않은 문서 또는 텍스트가 포함된 이미지에 사용합니다.
- 결과는 단일 API 호출에서 즉시(동기식) 반환됩니다.
- 개체 감지, 이미지 설명 또는 분류, 스마트 잘린 썸네일 생성 등을 포함하여 텍스트를 추출한 과거 이미지를 분석하는 기능이 있습니다.
- 예를 들어 도로 표지판, 필기 노트 및 상점 표지판이 있습니다.
- 문서 인텔리전스:
- 이 서비스를 사용하여 이미지 및 PDF 문서에서 작은 텍스트에서 대량의 텍스트를 읽을 수 있습니다.
- 이 서비스는 문서의 컨텍스트와 구조를 사용하여 정확도를 향상시킵니다.
- 초기 함수 호출은 후속 호출에서 결과를 검색하는 데 사용해야 하는 비동기 작업 ID를 반환합니다.
- 예를 들어 영수증, 문서 및 청구서가 있습니다.
REST API 또는 클라이언트 라이브러리를 통해 두 기술 모두에 액세스할 수 있습니다. 이 모듈에서는 이미지 분석의 OCR 기능에 초점을 맞춥니다. 문서 인텔리전스에 대해 자세히 알아보려면 이 모듈을 읽는 것이 좋습니다.