Del via


Oversigt over optisk tegngenkendelse i Microsoft Syntex

Bemærk!

Indtil juni 2025 kan du prøve en begrænset mængde optisk tegngenkendelse og andre valgte Syntex-tjenester uden omkostninger, hvis du har konfigureret fakturering efter forbrug. Du kan finde oplysninger og begrænsninger under Prøv Microsoft Syntex og udforsk dens tjenester.

Tjenesten optisk tegngenkendelse (OCR) i Microsoft Syntex gør det muligt at udtrække trykt eller håndskrevet tekst fra billeder og dokumenter. Eksempler på billeder omfatter plakater, tegninger og produktmærkater. Eksempler på dokumenter omfatter artikler, rapporter, formularer og fakturaer.

Teksten udtrækkes typisk som ord, tekstlinjer og afsnit eller tekstblokke, hvilket giver adgang til digital version af den scannede tekst. De udtrukne oplysninger indekseres i søgningen og kan gøres tilgængelige for funktioner til overholdelse af angivne standarder, f.eks. forebyggelse af datatab (DLP).

Du kan f.eks. aktivere OCR-tjenesten og derefter føje billedfiler til dokumentbiblioteket. Microsoft Syntex scanner automatisk billedfilerne, udtrækker den relevante tekst og gør teksten fra billederne tilgængelig til søgning og indeksering. Med denne funktion kan du hurtigt og præcist finde de nøgleord og udtryk, du leder efter.

Krav og begrænsninger

Understøttede filtyper

Slutpunkt Understøttede filtyper
SharePoint og OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf
Teams-, Exchange- og Windows-enheder .bmp, .png, .jpeg, .jpg, .tiff, and .pdf

Ud over billedbaseret PDF understøtter Syntex OCR hybrid PDF (text plus image PDF) fra november 2024. Derefter behandles nyligt overførte hybride PDF-filer af OCR-tjenesten.

Bemærk!

Når du anvender OCR på en billedfil, gemmes teksten i kolonnen Udtrukne tekstmetadata . Når du anvender OCR på en PDF- eller TIFF-fil, indekseres den udtrukne tekst i søgningen, men den er ikke tilgængelig i metadatakolonnen.

Understøttede sprog

OCR-tjenesten understøtter mere end 150 sprog.

Understøttede placeringer og løsninger

OCR-tjenesten understøtter flere løsninger, som vist i følgende tabel. Du kan finde flere oplysninger om løsninger til overholdelse af angivne standarder under Understøttede placeringer og løsninger i Microsoft Purview.

Sted Understøttet løsning
Exchange Tekst er tilgængelig til slutbrugersøgning og søgebaserede løsninger.
Tekst er tilgængelig for løsninger til overholdelse af angivne standarder.
SharePoint-websteder Tekst er tilgængelig til slutbrugersøgning og søgebaserede løsninger.
Tekst er tilgængelig for løsninger til overholdelse af angivne standarder.
OneDrive-konti Tekst er tilgængelig til slutbrugersøgning og søgebaserede løsninger.
Tekst er tilgængelig for løsninger til overholdelse af angivne standarder.
Teams-chat og kanalmeddelelse Tekst er tilgængelig for løsninger til overholdelse af angivne standarder.
Enheder Tekst er tilgængelig for løsninger til overholdelse af angivne standarder.

Filbegrænsninger

  • Billeder skal være mindre end 50 MB.

  • Billeder skal være mindst 50 x 50 pixel og ikke større end 16.000 x 16.000 pixel.

  • Billeder, der uploades, når OCR er blevet aktiveret, er de eneste billeder, der scannes.

  • Billeder, der er integreret i Office-dokumenter, understøttes ikke.