Översikt över optisk teckenigenkänning i Microsoft Syntex
Obs!
Till och med juni 2025 kan du prova en begränsad mängd optisk teckenigenkänning och andra valda Syntex-tjänster utan kostnad om du har konfigurerat betala per användning-fakturering . Information och begränsningar finns i Prova Microsoft Syntex och utforska dess tjänster.
Med tjänsten optisk teckenigenkänning (OCR) i Microsoft Syntex kan du extrahera tryckt eller handskriven text från bilder och dokument. Exempel på bilder är affischer, ritningar och produktetiketter. Exempel på dokument är artiklar, rapporter, formulär och fakturor.
Texten extraheras vanligtvis som ord, textrader och stycken eller textblock, vilket ger åtkomst till digital version av den skannade texten. Den extraherade informationen indexeras i sökningen och kan göras tillgänglig för efterlevnadsfunktioner som dataförlustskydd (DLP).
Du kan till exempel aktivera OCR-tjänsten och sedan lägga till bildfiler i dokumentbiblioteket. Microsoft Syntex söker igenom bildfilerna automatiskt, extraherar relevant text och gör texten från bilderna tillgänglig för sökning och indexering. Med den här funktionen kan du snabbt och korrekt hitta de nyckelord och fraser som du letar efter.
Krav och begränsningar
Filtyper som stöds
Slutpunkt | Filtyper som stöds |
---|---|
SharePoint och OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf |
Teams-, Exchange- och Windows-enheter | .bmp, .png, .jpeg, .jpg, .tiff, and .pdf |
Förutom bildbaserad PDF stöder Syntex OCR hybrid-PDF (text plus bild-PDF) från och med november 2024. Efter det bearbetas nyligen uppladdade hybrid-PDF-filer av OCR-tjänsten.
Obs!
När du tillämpar OCR på en bildfil lagras texten i kolumnen Extraherade textmetadata . När du tillämpar OCR på en PDF- eller TIFF-fil indexeras den extraherade texten i sökningen men är inte tillgänglig i metadatakolumnen.
Språk som stöds
OCR-tjänsten stöder mer än 150 språk.
Platser och lösningar som stöds
OCR-tjänsten stöder flera lösningar, enligt följande tabell. Mer information om efterlevnadslösningar finns i Platser och lösningar som stöds i Microsoft Purview.
Plats | Lösning som stöds |
---|---|
Exchange | Text är tillgänglig för slutanvändarsökning och sökdrivna lösningar. Text är tillgänglig för efterlevnadslösningar. |
SharePoint-webbplatser | Text är tillgänglig för slutanvändarsökning och sökdrivna lösningar. Text är tillgänglig för efterlevnadslösningar. |
OneDrive-konton | Text är tillgänglig för slutanvändarsökning och sökdrivna lösningar. Text är tillgänglig för efterlevnadslösningar. |
Teams chatt- och kanalmeddelande | Text är tillgänglig för efterlevnadslösningar. |
Enheter | Text är tillgänglig för efterlevnadslösningar. |
Filbegränsningar
Avbildningar måste vara mindre än 50 MB.
Bilderna måste vara minst 50 x 50 bildpunkter och inte större än 16 000 x 16 000 bildpunkter.
Bilder som laddas upp när OCR har aktiverats är de enda bilder som genomsöks.
Bilder som är inbäddade i Office-dokument stöds inte.