Omówienie optycznego rozpoznawania znaków w programie SharePoint

Artykuł
03/10/2025

Uwaga

Do czerwca 2025 r. możesz bezpłatnie wypróbować ograniczoną ilość optycznego rozpoznawania znaków i innych wybranych usług zawartości, jeśli masz skonfigurowane rozliczenia zgodnie z rzeczywistym użyciem . Aby uzyskać informacje i ograniczenia, zobacz Wypróbuj Microsoft Syntex i zapoznaj się z jej usługami.

Usługa optycznego rozpoznawania znaków (OCR) w programie SharePoint umożliwia wyodrębnianie tekstu drukowanego lub odręcznego z obrazów i dokumentów. Przykłady obrazów obejmują plakaty, rysunki i etykiety produktów. Przykłady dokumentów obejmują artykuły, raporty, formularze i faktury.

Tekst jest zwykle wyodrębniany jako wyrazy, wiersze tekstowe, akapity lub bloki tekstowe, co umożliwia dostęp do cyfrowej wersji zeskanowanego tekstu. Wyodrębnione informacje są indeksowane w wyszukiwaniu i mogą być dostępne dla funkcji zgodności, takich jak ochrona przed utratą danych (DLP).

Na przykład włączasz usługę OCR, a następnie dodajesz pliki obrazów do biblioteki dokumentów. Funkcja automatycznie skanuje pliki obrazów, wyodrębnia odpowiedni tekst i udostępnia tekst z obrazów do wyszukiwania i indeksowania. Ta funkcja umożliwia szybkie i dokładne znajdowanie wyszukiwanych słów kluczowych i fraz.

Wymagania i ograniczenia

Obsługiwane typy plików

Punkt końcowy	Obsługiwane typy plików
Program SharePoint i usługa OneDrive	`.bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf`
Urządzenia z systemem Teams, Exchange i Windows	`.bmp, .png, .jpeg, .jpg, .tiff, and .pdf`

Oprócz formatu PDF opartego na obrazach usługa SharePoint OCR obsługuje hybrydowy plik PDF (tekst i obraz PDF). Nowo przekazane hybrydowe pliki PDF będą przetwarzane przez usługę OCR.

Uwaga

Po zastosowaniu funkcji OCR do pliku obrazu tekst jest przechowywany w kolumnie Wyodrębnione metadane tekstu. Po zastosowaniu funkcji OCR do pliku PDF lub TIFF wyodrębniony tekst jest indeksowany w wyszukiwaniu, ale nie jest dostępny w kolumnie metadanych.

Obsługiwane języki

Usługa OCR obsługuje ponad 150 języków.

Obsługiwane lokalizacje i rozwiązania

Usługa OCR obsługuje wiele rozwiązań, jak pokazano w poniższej tabeli. Aby uzyskać szczegółowe informacje na temat rozwiązań zgodności, zobacz Obsługiwane lokalizacje i rozwiązania w usłudze Microsoft Purview.

Lokalizacja	Obsługiwane rozwiązanie
Exchange	Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności.
Witryny programu SharePoint	Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności.
Konta usługi OneDrive	Tekst jest dostępny dla rozwiązań wyszukiwania i wyszukiwania użytkowników końcowych. Tekst jest dostępny dla rozwiązań zgodności.
Komunikat dotyczący czatu i kanału w usłudze Teams	Tekst jest dostępny dla rozwiązań zgodności.
Urządzeń	Tekst jest dostępny dla rozwiązań zgodności.

Ograniczenia dotyczące plików

Obrazy muszą być mniejsze niż 50 MB.
Obrazy muszą być co najmniej 50 x 50 pikseli i nie większe niż 16 000 x 16 000 pikseli.
Obrazy przekazane po włączeniu funkcji OCR są jedynymi skanowanymi obrazami.
Obrazy osadzone w dokumentach pakietu Office nie są obsługiwane.

Udostępnij za pośrednictwem