Del via


Brug en færdigbygget model til at udtrække oplysninger fra simple dokumenter i SharePoint

Den enkle model til dokumentbehandling tilbyder en fleksibel, forudtrænet løsning til udtrækning af oplysninger fra grundlæggende strukturerede dokumenter, herunder oplysninger som:

  • Nøgleværdipar – Tænk på disse som mærkater og deres tilsvarende oplysninger, f.eks. "Navn: Adele Vance".

  • Markeringsmærker – dette er afkrydsningsfelter eller andre mærker, der angiver valg eller markeringer i et dokument.

  • Navngivne enheder – dette er specifikke elementer, f.eks. navne på personer, steder eller organisationer, der er nævnt i teksten i et dokument.

  • Stregkoder – dette er maskinlæsbare repræsentationer af data, der kan bruges til sporings- eller identifikationsformål i et dokument.

I modsætning til andre færdigbyggede modeller med faste skemaer kan denne model identificere nøgler, som andre kan gå glip af, hvilket giver et værdifuldt alternativ til brugerdefineret modelmærkning og oplæring. Denne model understøtter også stregkoder og registrering af sprog.

Dokumenttyper

Enkel dokumentbehandling fungerer bedst sammen med de dokumenttyper, der indeholder strukturerede oplysninger, f.eks.:

  • Forms – disse har ofte tydelige felter og mærkater, hvilket gør det nemmere at udtrække nøgleværdipar.

  • Fakturaer – indeholder typisk ensartede layout med tabeller og nøgleværdipar.

  • Kvitteringer – på samme måde som fakturaer har de strukturerede data, der nemt kan udtrækkes.

  • Kontrakter – indeholder veldefinerede afsnit og delsætninger, der kan fortolkes effektivt.

  • Bankkontoudtog – indeholder tabeller og strukturerede data, der er ideelle til udtrækning.

Disse dokumenter drager fordel af funktionerne til optisk tegngenkendelse (OCR) og deep learning-processer, der bruges til at udtrække nøgleværdipar, markeringsmærker, tabeller og navngivne enheder.

Bemærk!

Denne model er i øjeblikket tilgængelig til .pdf- og billedfiltyper og på mere end 100 sprog. Der tilføjes flere understøttede filtyper i fremtidige versioner.

Hvis du vil bruge en enkel dokumentbehandlingsmodel, skal du følge disse trin:

Trin 1: Opret modellen

Følg vejledningen i Opret en model i Syntex for at oprette en enkel dokumentbehandlingsmodel. Fortsæt derefter med følgende trin for at fuldføre din model.

Trin 2: Upload en eksempelfil for at analysere

  1. Vælg Tilføj en fil i afsnittet Tilføj en fil, der skal analyseres på siden Modeller.

    Skærmbillede af siden nye modeller, der viser afsnittet Tilføj en fil, der skal analyseres.

  2. På siden Filer for at analysere modellen skal du vælge Tilføj for at finde den fil, du vil bruge.

    Skærmbillede af siden Filer til analyse af modelsiden, der viser knappen Tilføj.

  3. På siden Tilføj en fil fra biblioteket med oplæringsfiler skal du vælge filen og derefter vælge Tilføj.

    Skærmbillede af siden Tilføj en fil fra bibliotekssiden oplæringsfiler.

  4. Vælg Næste på siden Filer for at analysere modellen.

Trin 3: Vælg udtrækninger til din model

På siden med oplysninger om udtrækning kan du se dokumentområdet til højre for siden og panelet Udtrækninger til venstre. Panelet Udtrækninger viser listen over udtrækninger, der er identificeret i dokumentet.

Skærmbillede af siden med oplysninger om udtrækning og panelet Udtrækninger.

De objektfelter, der er fremhævet med grønt i dokumentområdet, er de elementer, der blev registreret af modellen, da den analyserede filen. Når du vælger en enhed, der skal udtrækkes, ændres det fremhævede felt til blåt. Hvis du senere beslutter ikke at inkludere objektet, ændres det fremhævede felt til gråt. Fremhævninger gør det nemmere at se den aktuelle tilstand for de udtrækningsmaskiner, du vælger.

Tip

Hvis du vil zoome ind eller ud for at læse objektfelterne, skal du bruge musens rullehjul eller zoomkontrolelementerne nederst i dokumentområdet.

Vælg en udtrækningsenhed

Du kan vælge en udtrækning enten fra dokumentområdet eller fra panelet Udtrækninger , afhængigt af hvad du foretrækker.

  • Hvis du vil vælge en udtrækning fra dokumentområdet, skal du vælge enhedsfeltet.
  • Hvis du vil vælge en udtrækning fra panelet Udtrækninger , skal du markere det tilsvarende afkrydsningsfelt til højre for enhedsnavnet i kolonnen Udtræk .

Når du vælger en udtrækningsmaskine, vises feltet Udtræksvælger? i dokumentområdet. I feltet vises nøglenavnet (det navn, der genereres for udtrækningen), den registrerede værdi (værdien af feltet i dokumentet), kolonnetypen og muligheden for at vælge enheden som udtrækningsenhed.

Skærmbillede af feltet Vælg udtrækningsfelt på siden med oplysninger om udtrækning.

Nøglenavnet bruges som kolonnenavn, når modellen anvendes på et SharePoint-bibliotek. Du kan ændre nøglenavnet, så det er mere beskrivende, hvis du vil. Kolonnetypen viser, hvordan oplysningerne vises i et bibliotek. Du kan ændre kolonnetypen, så den viser, hvordan oplysningerne skal vises. Når modellen anvendes på et bibliotek, kan du bruge kolonneformatering til at angive, hvordan den skal se ud i dokumentet.

Fortsæt med at vælge andre udtrækningsmaskiner, du vil bruge. Du kan også tilføje andre filer for at analysere denne modelkonfiguration.

Omdøb en udtrækningsfunktion

Du kan omdøbe en udtrækningsmaskine på tre måder:

  • I dokumentområdet på siden med oplysninger om udtrækning skal du vælge enhedsfeltet. Angiv et nyt navn til udtrækningen i feltet Nøglenavn i feltet Udtræksvælger.

  • Vælg den udtrækningsmaskine, du vil omdøbe, på panelet Udtrækninger på siden med oplysninger om udtrækningen, og vælg derefter Omdøb.

  • Vælg den udtrækningsmaskine, du vil omdøbe, i afsnittet Udtrækninger på modellens startside, og vælg derefter Omdøb.

Angiv et sideområde til behandling

I denne model kan du angive, at du vil behandle et interval af sider for en fil i stedet for hele filen. Vælg den side, du vil behandle, i sektionen Sideområde i panelet Udtrækninger. Indstillingen Sideområde er som standard tom. Hvis der ikke er angivet et sideområde, behandles hele dokumentet. Du kan få flere oplysninger under Angiv et sideområde til at udtrække oplysninger fra bestemte sider.

Registrer sproget i et dokument

I denne model kan du registrere sproget i et dokument og udtrække det til en kolonne. I panelet Udtrækninger i afsnittet Sprogregistrering skal du slå sprogregistrering til. Den viser iso-koden for det registrerede sprog.

Skærmbillede af afsnittet Sprogregistrering i panelet Udtrækninger.

Du kan også slå registrering af sprog til eller fra fra panelet Modelindstillinger for modellen.

Trin 4: Anvend modellen

  • Hvis du vil gemme ændringer og vende tilbage til modellens startside, skal du vælge Gem og afslut i panelet Udtrækninger.

  • Hvis du er klar til at anvende modellen på et bibliotek, skal du vælge Næste i dokumentområdet. I panelet Føj til bibliotek skal du vælge det bibliotek, du vil føje modellen til, og derefter vælge Tilføj.

Du kan finde oplysninger om filtyper, sprog, optisk tegngenkendelse og andre overvejelser i forbindelse med denne færdigbyggede model under Krav og begrænsninger for færdigbygget dokumentbehandling i SharePoint.