Microsoft Syntex 광학 문자 인식 개요
참고
종량제 청구가 설정된 경우 2025년 6월까지 제한된 양의 광학 문자 인식 및 기타 선택한 Syntex 서비스를 비용 없이 사용해 볼 수 있습니다. 자세한 내용 및 제한 사항은 Microsoft Syntex 사용해 보고 해당 서비스 탐색을 참조하세요.
Microsoft Syntex OCR(광학 문자 인식) 서비스를 사용하면 이미지 및 문서에서 인쇄되거나 필기된 텍스트를 추출할 수 있습니다. 이미지의 예로는 포스터, 드로잉 및 제품 레이블이 있습니다. 문서의 예로는 문서, 보고서, 양식 및 청구서가 있습니다.
텍스트는 일반적으로 단어, 텍스트 줄, 단락 또는 텍스트 블록으로 추출되므로 스캔한 텍스트의 디지털 버전에 액세스할 수 있습니다. 추출된 정보는 검색에서 인덱싱되며 DLP(데이터 손실 방지)와 같은 규정 준수 기능에 사용할 수 있습니다.
예를 들어 OCR 서비스를 사용하도록 설정한 다음, 문서 라이브러리에 이미지 파일을 추가합니다. Microsoft Syntex 이미지 파일을 자동으로 검색하고, 관련 텍스트를 추출하고, 이미지의 텍스트를 검색 및 인덱싱에 사용할 수 있게 합니다. 이 기능을 사용하면 찾고 있는 키워드와 구를 빠르고 정확하게 찾을 수 있습니다.
요구 사항 및 제한 사항
지원되는 파일 형식
끝점 | 지원되는 파일 형식 |
---|---|
SharePoint 및 OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf |
Teams, Exchange 및 Windows 디바이스 | .bmp, .png, .jpeg, .jpg, .tiff, and .pdf |
Syntex OCR은 이미지 기반 PDF 외에도 2024년 11월부터 하이브리드 PDF(텍스트 및 이미지 PDF)를 지원합니다. 그 후 새로 업로드된 하이브리드 PDF는 OCR 서비스에서 처리됩니다.
참고
이미지 파일에 OCR을 적용하면 텍스트가 추출된 텍스트 메타데이터 열에 저장됩니다. PDF 또는 TIFF 파일에 OCR을 적용하면 추출된 텍스트는 검색에서 인덱싱되지만 메타데이터 열에서는 사용할 수 없습니다.
지원되는 언어
OCR 서비스는 150개 이상의 언어를 지원합니다.
지원되는 위치 및 솔루션
OCR 서비스는 다음 표와 같이 여러 솔루션을 지원합니다. 규정 준수 솔루션에 대한 자세한 내용은 Microsoft Purview에서 지원되는 위치 및 솔루션을 참조하세요.
위치 | 지원되는 솔루션 |
---|---|
Exchange | 텍스트는 최종 사용자 검색 및 검색 기반 솔루션에 사용할 수 있습니다. 규정 준수 솔루션에 텍스트를 사용할 수 있습니다. |
SharePoint 사이트 | 텍스트는 최종 사용자 검색 및 검색 기반 솔루션에 사용할 수 있습니다. 규정 준수 솔루션에 텍스트를 사용할 수 있습니다. |
OneDrive 계정 | 텍스트는 최종 사용자 검색 및 검색 기반 솔루션에 사용할 수 있습니다. 규정 준수 솔루션에 텍스트를 사용할 수 있습니다. |
Teams 채팅 및 채널 메시지 | 규정 준수 솔루션에 텍스트를 사용할 수 있습니다. |
디바이스 | 규정 준수 솔루션에 텍스트를 사용할 수 있습니다. |
파일 제한 사항
이미지는 50MB 미만이어야 합니다.
이미지는 50 x 50 픽셀 이상이어야 하며 16,000 x 16,000 픽셀보다 크지 않아야 합니다.
OCR을 사용하도록 설정한 후 업로드된 이미지는 검사되는 유일한 이미지입니다.
Office 문서에 포함된 이미지는 지원되지 않습니다.