Jaa


Valjastetun mallin avulla voit poimia tietoja Microsoft Syntex

Yksinkertainen asiakirjankäsittelymalli tarjoaa joustavan ja esikoulutetun ratkaisun tietojen poimimiseen perusrakenteisten asiakirjojen perusteella, mukaan lukien seuraavat tiedot:

  • Avain-arvo-parit – Ajattele näitä samankaltaisia tunnisteita ja niitä vastaavia tietoja, kuten "Nimi: Adele Vance".

  • Valintamerkit – Nämä ovat valintaruutuja tai muita merkkejä, jotka ilmaisevat asiakirjan valintoja tai valintoja.

  • Nimetyt entiteetit – Nämä ovat tiettyjä kohteita, kuten asiakirjan tekstissä mainittujen henkilöiden, paikkojen tai organisaatioiden nimiä.

  • Viivakoodit – Nämä ovat koneluettavia tietojen esityksiä, joita voidaan käyttää asiakirjan seuranta- tai tunnistamistarkoituksiin.

Toisin kuin muissa valmiissa malleissa, joissa on kiinteät rakenteet, tämä malli voi tunnistaa avaimet, joita muut saattavat menettää, tarjoten arvokkaan vaihtoehdon mukautetun mallin otsikoinnille ja koulutukselle. Tämä malli tukee myös viivakoodeja ja kielentunnistusta.

Tiedostotyypit

Yksinkertainen asiakirjan käsittely toimii parhaiten sellaisten asiakirjojen kanssa, jotka sisältävät jäsennettyjä tietoja, kuten:

  • Forms – Niissä on usein selkeät kentät ja selitteet, mikä helpottaa avain-arvo-parien poimimista.

  • Laskut – Sisältävät yleensä yhdenmukaiset asettelut, joissa on taulukoita ja avain-arvo-pareja.

  • Kuitit – Laskujen tapaan niillä on jäsennettyjä tietoja, jotka on helppo poimia.

  • Sopimukset – sisältävät hyvin määriteltyjä osia ja lausekkeita, jotka voidaan jäsentää tehokkaasti.

  • Tiliotteet – Sisällytä taulukot ja jäsennetyt tiedot, jotka sopivat erinomaisesti poimimiseen.

Nämä asiakirjat hyötyvät OCR-toiminnoista ja syväoppimisprosesseista, joita käytetään avain-arvo-parien, valintamerkkien, taulukoiden ja nimettyjen entiteettien poimimiseen.

Huomautus

Tällä hetkellä tämä malli on käytettävissä .pdf- ja kuvatiedostotyypeille sekä yli sadalle kielelle. Lisää tuettuja tiedostotyyppejä lisätään tuleviin versioihin.

Jos haluat käyttää yksinkertaista asiakirjankäsittelymallia, toimi seuraavasti:

Vaihe 1: Mallin luominen

Luo yksinkertainen asiakirjan käsittelymalli noudattamalla ohjeita kohdassa Mallin luominen Syntexissä . Viimeistele sitten mallisi seuraavien vaiheiden avulla.

Vaihe 2: Lataa esimerkkitiedosto analysoitavaksi

  1. Valitse Mallit-sivunLisää tiedosto analysoitavaksi -osiosta Lisää tiedosto.

    Näyttökuva uusista malleista -sivulta, jossa näkyy Lisää analysoitava tiedosto -osa.

  2. Valitse Mallia analysoivat tiedostot -sivulla Lisää , jotta löydät tiedoston, jota haluat käyttää.

    Näyttökuva Tiedostot-kohdasta, jolla analysoidaan mallisivua ja jossa näkyy Lisää-painike.

  3. Valitse Lisää tiedosto harjoitustiedostokirjaston sivulta ja valitse sitten Lisää.

    Näyttökuva Lisää tiedosto harjoitustiedostokirjastosta -sivusta.

  4. Valitse Mallia analysoivat tiedostot -sivulla Seuraava.

Vaihe 3: Valitse mallisi poimintatoiminnot

Näet poimintatoiminnon tietosivulla asiakirja-alueen sivun oikealla puolella ja Poiminta-paneelin vasemmalla puolella. Poimintapaneeli näyttää luettelosta poimintatoiminnot, jotka on tunnistettu asiakirjassa.

Näyttökuva poimintatoiminnon tietosivusta ja Poiminta-paneelista.

Tiedostoalueen vihreällä korostetut entiteettikentät ovat kohteita, jotka malli havaitsi tiedostoa analysoidessaan. Kun valitset poimittavan entiteetin, korostettu kenttä muuttuu siniseksi. Jos päätät myöhemmin olla sisällyttämättä entiteettiä, korostettu kenttä muuttuu harmaaksi. Korostukset helpottavat valittujen poimintojen nykyisen tilan näkemistä.

Vihje

Jos haluat lähentää tai loitontaa entiteettikenttiä, käytä hiiren vierityspainiketta tai tiedostoalueen alaosassa olevia zoomausohjausobjekteja.

Valitse poiminta-entiteetti

Voit valita poimintatoiminnon joko asiakirja-alueelta tai Poiminta-paneelista haluamasi vaihtoehdon mukaan.

  • Jos haluat valita poimintatoiminnon asiakirja-alueelta, valitse entiteettikenttä.
  • Jos haluat valita poimintatoiminnon Poiminta-paneelista , valitse Poimi-sarakkeesta vastaava valintaruutu entiteetin nimen oikealla puolella.

Kun valitset poimintatoiminnon, Valitse poiminta-ruutu näkyy tiedostoalueella. Ruudussa näkyy avaimen nimi (poimijalle luotu nimi), tunnistettu arvo (asiakirjan kentän arvo), saraketyyppi ja asetus, jolla entiteetti valitaan poimintatoiminnoksi.

Näyttökuva Poiminta-tietosivun Valitse poiminta -ruudusta.

Avaimen nimeä käytetään sarakkeen nimenä, kun mallia käytetään SharePoint-kirjastossa. Voit halutessasi muuttaa avaimen nimen kuvaavammaksi. Saraketyyppi näyttää, miten tiedot näytetään kirjastossa. Voit muuttaa saraketyyppiä näyttämään, miten haluat tietojen näkyvän. Kun mallia käytetään kirjastossa, voit käyttää sarakemuotoilua määrittämään, miltä haluat sen näyttävän asiakirjassa.

Valitse edelleen muut poimintatoiminnot, joita haluat käyttää. Voit myös lisätä muita tiedostoja analysoitavaksi tätä mallimääritystä varten.

Nimeä poimintatoiminto uudelleen

Voit nimetä poimijan uudelleen kolmella tavalla:

  • Valitse poimintatoiminnon tietosivun asiakirja-alueella entiteettikenttä. Kirjoita Valitse poimintatoiminto? -ruutuun Avaimen nimi -kenttään uusi nimi poiminnalle.

  • Valitse poimintatoiminnon tietosivun Poiminta-paneelista poimintatoiminto, jonka haluat nimetä uudelleen, ja valitse sitten Nimeä uudelleen.

  • Valitse mallin aloitussivun Poimintatoiminnot-osiosta poimintatoiminto, jonka haluat nimetä uudelleen, ja valitse sitten Nimeä uudelleen.

Sivualueen määrittäminen käsittelyä varten

Tässä mallissa voit määrittää, käsitelläänkö tiedoston sivualue koko tiedoston sijaan. Valitse Poiminta-paneelinSivualue-osassa sivu, jonka haluat käsitellä. Sivualue-asetus on oletusarvoisesti tyhjä. Jos sivualuetta ei ole annettu, koko asiakirja käsitellään. Lisätietoja on kohdassa Sivualueen määrittäminen tietojen poimimiseksi tietyiltä sivuilta.

Asiakirjan kielen tunnistaminen

Tässä mallissa voit tunnistaa asiakirjan kielen ja poimia sen sarakkeeseen. Ota kielentunnistus käyttöön Poiminta-paneelinKielentunnistus-osassa . Se näyttää tunnistetun kielen ISO-koodin.

Näyttökuva Poiminta-paneelin Kielentunnistus-osiosta.

Voit myös ottaa kielentunnistuksen käyttöön tai poistaa sen käytöstä mallin Mallin asetukset -paneelista.

Vaihe 4: Mallin käyttäminen

  • Jos haluat tallentaa muutokset ja palata mallin aloitussivulle, valitse Poiminta-paneelistaTallenna ja lopeta.

  • Jos olet valmis käyttämään mallia kirjastossa, valitse tiedostoalueella Seuraava. Valitse Lisää kirjastoon -paneelista kirjasto, johon haluat lisätä mallin, ja valitse sitten Lisää.