Omówienie optycznego rozpoznawania znaków w Microsoft Syntex
Uwaga
Do czerwca 2025 r. możesz bezpłatnie wypróbować ograniczoną ilość optycznego rozpoznawania znaków i innych wybranych usług Syntex, jeśli masz skonfigurowane rozliczenia zgodnie z rzeczywistym użyciem . Aby uzyskać informacje i ograniczenia, zobacz Wypróbuj Microsoft Syntex i zapoznaj się z jej usługami.
Usługa optycznego rozpoznawania znaków (OCR) w Microsoft Syntex umożliwia wyodrębnianie tekstu drukowanego lub odręcznego z obrazów i dokumentów. Przykłady obrazów obejmują plakaty, rysunki i etykiety produktów. Przykłady dokumentów obejmują artykuły, raporty, formularze i faktury.
Tekst jest zwykle wyodrębniany jako wyrazy, wiersze tekstowe, akapity lub bloki tekstowe, co umożliwia dostęp do cyfrowej wersji zeskanowanego tekstu. Wyodrębnione informacje są indeksowane w wyszukiwaniu i mogą być dostępne dla funkcji zgodności, takich jak ochrona przed utratą danych (DLP).
Na przykład włączasz usługę OCR, a następnie dodajesz pliki obrazów do biblioteki dokumentów. Microsoft Syntex automatycznie skanuje pliki obrazów, wyodrębnia odpowiedni tekst i udostępnia tekst z obrazów do wyszukiwania i indeksowania. Ta funkcja umożliwia szybkie i dokładne znajdowanie wyszukiwanych słów kluczowych i fraz.
Wymagania i ograniczenia
Obsługiwane typy plików
Punkt końcowy | Obsługiwane typy plików |
---|---|
Program SharePoint i usługa OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf |
Urządzenia z systemem Teams, Exchange i Windows | .bmp, .png, .jpeg, .jpg, .tiff, and .pdf |
Oprócz formatu PDF opartego na obrazach, usługa Syntex OCR będzie obsługiwać hybrydowy plik PDF (tekst i obraz PDF) od listopada 2024 r. Po tym czasie nowo przekazane hybrydowe pliki PDF będą przetwarzane przez usługę OCR.
Uwaga
Po zastosowaniu funkcji OCR do pliku obrazu tekst jest przechowywany w kolumnie Wyodrębnione metadane tekstu. Po zastosowaniu funkcji OCR do pliku PDF lub TIFF wyodrębniony tekst jest indeksowany w wyszukiwaniu, ale nie jest dostępny w kolumnie metadanych.
Obsługiwane języki
Usługa OCR obsługuje ponad 150 języków.
Obsługiwane lokalizacje i rozwiązania
Usługa OCR obsługuje wiele rozwiązań, jak pokazano w poniższej tabeli. Aby uzyskać szczegółowe informacje na temat rozwiązań zgodności, zobacz Obsługiwane lokalizacje i rozwiązania w usłudze Microsoft Purview.
Lokalizacja | Obsługiwane rozwiązanie |
---|---|
Exchange | Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności. |
Witryny programu SharePoint | Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności. |
Konta usługi OneDrive | Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności. |
Komunikat dotyczący czatu i kanału w usłudze Teams | Tekst jest dostępny dla rozwiązań zgodności. |
Urządzeń | Tekst jest dostępny dla rozwiązań zgodności. |
Ograniczenia dotyczące plików
Obrazy muszą być mniejsze niż 50 MB.
Obrazy muszą być co najmniej 50 x 50 pikseli i nie większe niż 16 000 x 16 000 pikseli.
Obrazy przekazane po włączeniu funkcji OCR są jedynymi skanowanymi obrazami.
Obrazy osadzone w dokumentach pakietu Office nie są obsługiwane.