Del via


Kalibrer en ustrukturert dokumentbehandlingsmodell i Microsoft Syntex

Gjelder for: ✓ Ustrukturert dokumentbehandling

Følg instruksjonene i Opprett en modell i Syntex for å opprette en ustrukturert dokumentbehandlingsmodell i et innholdssenter. Eller følg instruksjonene i Opprett en modell på et lokalt SharePoint-nettsted for å opprette modellen på et lokalt nettsted. Start deretter med denne artikkelen for å begynne å lære opp modellen.

Opprette en klassifier

En klassifier er en type modell som du kan bruke til å automatisere identifikasjon og klassifisering av en dokumenttype.



Du kan for eksempel identifisere alle kontraktfornyelsesdokumenter som legges til i dokumentbiblioteket, for eksempel vist i illustrasjonen nedenfor.

Kontraktfornyelsesdokument.

Ved å opprette en klassifier kan du opprette en ny SharePoint-innholdstype som skal knyttes til modellen.

Når du oppretter klassifieren, må du opprette forklaringer for å definere modellen. Dette trinnet lar deg notere vanlige data som du forventer å konsekvent finne denne dokumenttypen.

Bruk eksempler på dokumenttypen («eksempelfiler») til å «kalibrere» modellen for å identifisere filer som har samme innholdstype.

Hvis du vil opprette en klassifier, må du:

  1. Gi modellen et navn.
  2. Legg til eksempelfilene.
  3. Merk eksempelfilene.
  4. Opprett en forklaring.
  5. Test modellen.

Obs!

Mens modellen bruker en klassifier til å identifisere og klassifisere dokumenttyper, kan du også velge å hente bestemte deler med informasjon fra hver fil som identifiseres av modellen. Gjør dette ved å opprette en uttrekking som skal legges til i modellen. Se Opprette en extractor.

Gi modellen et navn

Det første trinnet for å opprette modellen er å gi den et navn:

  1. Velg Ny fra innholdssenteret, og velg deretter Modell.

  2. Velg Undervisningsmetodesiden Alternativer for modelloppretting.

  3. Velg Nesteundervisningsmetoden: Detaljer-siden.

  4. Skriv inn navnet på modellen i modellnavnfeltet på siden Opprett en modell med undervisningsmetode. Hvis du for eksempel vil identifisere kontraktfornyelsesdokumenter, kan du gi modellen navnet Kontraktfornyelse.

  5. Velg Opprett. Denne handlingen oppretter en hjemmeside for modellen.

    Hjemmeside for klassifiermodell.

Når du oppretter en modell, oppretter du også en ny innholdstype for nettsted. En innholdstype representerer en kategori med dokumenter som har felles kjennetegn og deler en samling med kolonner eller metadataegenskaper for det bestemte innholdet. SharePoint-innholdstyper administreres gjennom innholdstypegalleriet. I dette eksemplet, når du oppretter modellen, oppretter du en ny innholdstype for kontraktfornyelse .

Velg Avanserte innstillinger hvis du vil tilordne denne modellen til en eksisterende virksomhetsinnholdstype i innholdstypegalleriet i SharePoint for å bruke skjemaet. Virksomhetsinnholdstyper lagres i innholdstypehuben i administrasjonssenteret for SharePoint og er syndikert til alle områder i leieren. Vær oppmerksom på at selv om du kan bruke en eksisterende innholdstype til å dra nytte av skjemaet for å hjelpe deg med identifisering og klassifisering, må du fortsatt lære opp modellen til å trekke ut informasjon fra filer den identifiserer.

Avanserte innstillinger.

Legg til eksempelfilene dine

Legg til eksempler på modellens startside for å lære opp modellen til å identifisere dokumenttypen.



Obs!

Du bør bruke de samme filene for både klassifier- og utpakkingsopplæring. Du har alltid muligheten til å legge til flere senere, men vanligvis legger du til et komplett sett med eksempelfiler. Merk noen for å lære opp modellen, og test de gjenværende umerkede for å evaluere modellform.

For opplæringssettet vil du bruke både positive og negative eksempler:

  • Positivt eksempel: Dokumenter som representerer dokumenttypen. Disse inneholder strenger og informasjon som alltid vil være i denne typen dokument.
  • Negativt eksempel: Andre dokumenter som ikke representerer dokumentet du vil klassifisere.

Pass på at du bruker minst fem positive eksempler og minst ett negativt eksempel for å lære opp modellen. Du vil opprette flere for å teste modellen etter opplæringsprosessen.

Slik legger du til eksempelfiler:

  1. Velg Legg til filer i flisen Legg til eksempelfiler på startsiden for modellen.

  2. Velg eksempelfilene fra biblioteket for opplæringsfiler i innholdssenteret på siden Velg eksempelfiler for modellen . Hvis du ikke allerede har lastet dem opp der, velger du å laste dem opp nå ved å klikke Last opp for å kopiere dem til biblioteket for opplæringsfiler.

  3. Når du har valgt eksempelfilene du vil bruke til å lære opp modellen, velger du Legg til.

    Velg eksempelfiler.

Merk eksempelfilene dine

Når du har lagt til eksempelfilene, må du merke dem som positive eller negative eksempler.

  1. Velg Kalibrer klassifier på startsiden for modellen på Klassifiser-filene og kjør opplæringsflisen. Dette trinnet viser etikettsiden som viser en liste over eksempelfilene, med den første filen synlig i visningsprogrammet.

  2. I visningsprogrammet øverst i den første eksempelfilen skal du se tekst som spør om filen er et eksempel på modellen du nettopp opprettet. Hvis det er et positivt eksempel, velger du Ja. Hvis det er et negativt eksempel, velger du Nei.

  3. Velg flere filer du vil bruke som eksempler, fra listen over merkede eksempler til venstre, og merk dem.

    Hjemmesiden for Klassifier.

Obs!

Merk minst fem positive eksempler. Du må også merke minst ett negativt eksempel.

Opprette en forklaring

Neste trinn er at du oppretter en forklaring på Tog-siden. En forklaring hjelper modellen med å forstå hvordan dokumentet gjenkjennes. Kontraktfornyelsesdokumentene inneholder for eksempel alltid en forespørsel om ytterligere tekststreng for fremlegging .

Obs!

Når den brukes med uttrekkere, identifiserer en forklaring strengen du vil trekke ut fra dokumentet.

Slik oppretter du en forklaring:

  1. Velg Tog-fanen på startsiden for modellen for å gå til Tog-siden.

  2. Du skal se en liste over eksempelfilene du har merket tidligere, i delen Opplærte filer på Tog-siden. Velg en av de positive filene fra listen, og den vises i visningsprogrammet.

  3. Velg Ny og deretter Tom i forklaringsdelen.

  4. På siden Opprett en forklaring :
    a. Skriv inn navnet (for eksempel «Avsløringsblokk»).
    B. Velg type. Velg fraselisten i eksemplet, siden du legger til en tekststreng.
    C. Skriv inn strengen i boksen Skriv inn her . Legg til «Forespørsel om ytterligere fremlegging» for eksemplet. Du kan velge Skiller mellom store og små bokstaver hvis strengen må skille mellom store og små bokstaver.
    D. Velg Lagre.

    Opprett forklaring.

  5. Innholdssenteret kontrollerer nå om forklaringen du opprettet, er fullstendig nok til å identifisere de gjenværende merkede eksempelfilene på riktig måte, som positive og negative eksempler. Kontroller evalueringskolonnen etter at opplæringen er fullført, i delen Opplærte filer for å se resultatene. Filene viser verdien Samsvar, hvis forklaringene du opprettet, var nok til å samsvare med det du merket som positivt eller negativt.

    Samsvarsverdi.

    Hvis du får en manglende samsvar for de merkede filene, må du kanskje opprette en ekstra forklaring for å gi modellen mer informasjon for å identifisere dokumenttypen. Hvis det oppstår en feil, velger du filen for å få mer informasjon om hvorfor manglende samsvar oppstod.

Når du har kalibrert en ekstraktor, kan den opplærte ekstraktoren brukes som en forklaring. I Forklaringer-delen vises dette som en modellreferanse.

Skjermbilde av Forklaringer-delen som viser typen modellreferanse.

Test modellen

Hvis du mottok et treff på de merkede eksempelfilene, kan du nå teste modellen på de gjenværende umerkede eksempelfilene som modellen ikke har sett før. Dette trinnet er valgfritt, men et nyttig trinn for å evaluere modellens «egnethet» eller beredskap før du bruker den, ved å teste den på filer modellen ikke har sett før.

  1. Velg Test-fanen på startsiden for modellen. Dette kjører modellen på de umerkede eksempelfilene.

  2. I listen over testfiler vises eksempelfilene dine og viser om modellen forutså at de var positive eller negative. Bruk denne informasjonen til å bestemme effektiviteten til klassifisereren for å identifisere dokumentene dine.

    Test av filer som ikke er merket.

Se også

Opprette en uttrekker

Forklaringstyper

Bruke en modell

Syntex-tilgjengelighetsmodus