Yleiskatsaus optisen merkintunnistuksen Microsoft Syntex
Huomautus
Kesäkuuhun 2025 asti voit kokeilla rajoitettua määrää optista merkintunnistusta ja muita valittuja Syntex-palveluita maksutta, jos käytön mukaan laskutukseen on määritetty maksullinen määrä. Lisätietoja ja rajoituksia on kohdassa Microsoft Syntex kokeileminen ja tutustuminen sen palveluihin.
Microsoft Syntex optisen tekstintunnistuspalvelun avulla voit poimia tulostettua tai käsinkirjoitettua tekstiä kuvista ja asiakirjoista. Esimerkkejä kuvista ovat julisteet, piirustukset ja tuote-etiketit. Esimerkkejä asiakirjoista ovat artikkelit, raportit, lomakkeet ja laskut.
Teksti poimitaan yleensä sanoiksi, tekstiriveiksi ja kappaleiksi tai tekstilohkoiksi, mikä mahdollistaa skannatun tekstin digitaalisen version käyttämisen. Poimitut tiedot on indeksoitu haussa, ja ne voidaan antaa yhteensopivuusominaisuuksien, kuten tietojen menetyksen estämisen (DLP) käyttöön.
Voit esimerkiksi ottaa OCR-palvelun käyttöön ja lisätä sitten kuvatiedostoja tiedostokirjastoosi. Microsoft Syntex tarkistaa kuvatiedostot automaattisesti, purkaa asianmukaisen tekstin ja asettaa kuvien tekstin haun ja indeksoimisen käytettäväksi. Tämän ominaisuuden avulla löydät etsimäsi avainsanat ja lauseet nopeasti ja tarkasti.
Vaatimukset ja rajoitukset
Tuetut tiedostotyypit
Päätepiste | Tuetut tiedostotyypit |
---|---|
SharePoint ja OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf |
Teams-, Exchange- ja Windows-laitteet | .bmp, .png, .jpeg, .jpg, .tiff, and .pdf |
Kuvapohjaisen PDF-tiedoston lisäksi Syntex OCR tukee hybridi-PDF:ää (teksti ja kuva PDF) marraskuusta 2024 alkaen. Tämän jälkeen OCR-palvelu käsittelee juuri ladatut hybridi-PDF:t.
Huomautus
Kun käytät OCR-tekstintunnistusta kuvatiedostossa, teksti tallennetaan Poimitun tekstin metatiedot -sarakkeeseen. Kun otat OCR-tekstintunnistuksen käyttöön PDF- tai TIFF-tiedostossa, poimittu teksti indeksoidaan haussa, mutta se ei ole käytettävissä metatietosarakkeessa.
Tuetut kielet
OCR-palvelu tukee yli 150 kieltä.
Tuetut sijainnit ja ratkaisut
OCR-palvelu tukee useita ratkaisuja, kuten seuraavassa taulukossa esitetään. Lisätietoja yhteensopivuusratkaisuista on artikkelissa Microsoft Purview'n tuetut sijainnit ja ratkaisut.
Sijainti | Tuettu ratkaisu |
---|---|
Exchange | Teksti on käytettävissä loppukäyttäjän haku- ja hakupohjaisissa ratkaisuissa. Teksti on saatavilla yhteensopivuusratkaisuille. |
SharePoint-sivustot | Teksti on käytettävissä loppukäyttäjän haku- ja hakupohjaisissa ratkaisuissa. Teksti on saatavilla yhteensopivuusratkaisuille. |
OneDrive-tilit | Teksti on käytettävissä loppukäyttäjän haku- ja hakupohjaisissa ratkaisuissa. Teksti on saatavilla yhteensopivuusratkaisuille. |
Teams-keskustelu- ja kanavaviesti | Teksti on saatavilla yhteensopivuusratkaisuille. |
Laitteet | Teksti on saatavilla yhteensopivuusratkaisuille. |
Tiedostorajoitukset
Kuvien on oltava pienempiä kuin 50 Mt.
Kuvien on oltava vähintään 50 x 50 kuvapistettä, eivätkä ne saa olla suurempia kuin 16 000 x 16 000 kuvapistettä.
OCR-tekstintunnistuksen käyttöönoton jälkeen ladatut kuvat ovat ainoita skannattuja kuvia.
Office-asiakirjoihin upotettuja kuvia ei tueta.