Del via


Alternativer for intensjonsgjenkjenning og enhetsuttrekking for intelligente programarbeidsbelastninger

Intensjonsgjenkjenning og enhetsuttrekking er sentrale komponenter i forståelse av naturlig språk.

Intensjonsgjenkjenning innebærer å identifisere brukerens mål eller formål bak inndataene. Hvis en bruker for eksempel sier «Jeg vil bestille en flyreise», er intensjonen å bestille en flyreise. Intensjonsgjenkjenning hjelper agenten med å forstå hvilke handlinger som må utføres basert på brukerens forespørsel.

Enhetsuttrekking innebærer å identifisere og trekke ut bestemte opplysninger fra brukerens inndata. Enheter kan være ting som datoer, navn, steder eller andre relevante data. Eksempel: I setningen «Bestill en flyreise til New York 15. september», «New York» og «15. september» er enheter.

En agent bruker hensikten til å forstå brukerens mål og enhetene for å identifisere de spesifikke detaljene som trengs for å fullføre oppgaven. Intensjonsgjenkjenning og enhetsuttrekking gjør det derfor mulig for agenten å gi nøyaktige og effektive svar på brukerspørringer.

Når du utformer den intelligente programarbeidsbelastningen, må du velge det beste alternativet for intensjonsgjenkjenning og enhetsuttrekking for å sikre at den intelligente programarbeidsbelastningen gir en positiv brukeropplevelse.

Definisjoner

Term Definisjon
Naturlig språkforståelse Naturlig språkforståelse er en delmengde av naturlig språkbehandling i kunstig intelligens som fokuserer på maskinleseforståelse.
Samtalespråkforståelse Samtalespråkforståelse er en funksjon i Azure kunstig intelligens som gjør det mulig å opprette egendefinerte modeller for naturlig språkforståelse.
Storspråkmodell En storspråkmodell er en type modell for kunstig intelligens utformet for å forstå og generere menneskelig språk.
GPT Generativ, forhåndsopplært omformer refererer til en familie av storspråkmodeller som bruker transformatorarkitekturen til å forstå og generere menneskelignende tekst.
Dynamisk sammenkjeding Dynamisk sammenkjeding er en metode for å automatisere utløsere for generative handlinger. I stedet for å manuelt definere alle mulige emner eller utløseruttrykk, lar dynamisk sammenkjeding kunstig intelligens bestemme hvilke emner eller programtilleggshandlinger som må kalles, basert på konteksten for samtalen.

Å velge det riktige alternativet for intensjonsgjenkjenning og enhetsuttrekking i den intelligente programarbeidsbelastningen involverer flere viktige hensyn:

  • Forhåndsbygde kontra egendefinerte enheter: Evaluer om de forhåndsbygde enhetene som leveres av Microsoft Copilot Studio, oppfyller dine behov. Forhåndsbygde enheter dekker vanlige informasjonstyper som datoer, tall og navn. Hvis programmet krever domenespesifikk kunnskap, må du kanskje opprette egendefinerte enheter.

  • Kompleksiteten til brukerinndata: Vurder kompleksiteten og variasjonen i brukerinndata. For enkle scenarioer kan forhåndsbygde enheter være tilstrekkelig. For mer komplekse samhandlinger kan egendefinerte enheter og avanserte konfigurasjoner som regulære uttrykk (regex) være nødvendig.

  • Utfylling av spor: Bestem om programmet ditt krever proaktiv utfylling av spor, der agent aktivt søker etter og fyller ut manglende informasjon fra brukerinnganger. Utfylling av spor kan forbedre brukeropplevelsen ved å redusere behovet for oppfølgingsspørsmål.

  • Ytelse og skalerbarhet: Vurder ytelsen og skalerbarheten til den valgte metoden. Egendefinerte enheter og komplekse konfigurasjoner krever ofte mer prosessorkraft og kan påvirke svartiden.

  • Enkelt vedlikehold: Vurder hvor enkelt det er å vedlikeholde og oppdatere enhetene dine. Forhåndsbygde enheter er enklere å administrere, mens egendefinerte enheter krever kontinuerlige justeringer etter hvert som programmet utvikles.

Velg mellom standard naturlig språkforståelse, Azure CLU eller dynamisk lenking

I Copilot Studio kan emne- eller handlingsutløsing oppnås ved å bruke standard naturlig språkforståelse-modellen, kombinere eller overstyre den med en egendefinert Azure CLU-modell, eller ved å erstatte naturlig språkforståelse-modellen fullstendig med dynamisk sammenkjeding, en GPT-modell basert på storspråkmodeller.

Standardmodell for naturlig språkforståelse Egendefinert Azure CLU-modell Dynamisk sammenkjeding
Fordel Standard, bruksklar modell som leveres forhåndsopplært, med mange forhåndsdefinerte enhetstyper.

Konfigurasjon gjøres ved å legge til utløseruttrykk og egendefinerte enheter (lukkede lister med verdier og synonymer eller regulære uttrykk).
Støtter flere språk, med modeller.

Støtter tilpasning av intensjonsutløsende modell for bedre intensjonsgjenkjenning eller for å håndtere spesifikke bransjekrav.

Tillater kompleks enhetsuttrekking (f.eks. av samme type).

Enhetsuttrekking kan også bruke Copilot Studio standard naturlig språkforståelse.
Bruker en stor GPT-språkmodell og leveres forhåndstrent på et bredere spekter av data.

Kan håndtere flere intensjoner og koble sammen emner og/eller programtillegg.

Genererer automatisk spørsmål for manglende inndata og svarer på komplekse enheter og spørsmål fra samtalekonteksten.

Konfigurasjon gjøres ved å beskrive emner, programtilleggshandlinger, inndata og utdata.
Ulempe Gjenkjenning av én intensjon per spørring.

Kan ikke utvides. Du kan ikke endre modellens virkemåte eller finjustere modellen. Den leveres som den er.

Sporfylling av flere enheter av samme type i samme spørring krever avklaring for hver enkelt (for eksempel fra- og til-byer).
Gjenkjenning av én intensjon per spørring.

Konfigurasjon gjøres i Azure mot ekstra kostnad.

Har egne tjenestegrenser som må evalueres.

Azure CLU-intensjoner og Copilot Studio-emner må holdes nøye synkronisert.
Siden det er en generativ KI-funksjon, er lisensforbrenningsfrekvensen for meldinger høyere enn for vanlig emneutløsing.

Utløseruttrykk og sporfylling

Når du utvikler intelligente programarbeidsbelastninger, bør du bruke opprinnelige funksjoner til å forbedre gjenkjenning av intensjoner og effektivisere samtaler. Begynn med å identifisere emneutløseruttrykk fra eksisterende databaser for vanlige spørsmål og nettpratutskrifter for å sikre at forventede uttrykk er relevante og nøyaktige. Vurder hvordan du vil bruke enheter, for eksempel om du skal bruke regulære uttrykk til å finne ordre-ID-er, forhåndsbygde enheter for e-postmeldinger eller lukkede lister for operasjonstyper med synonymer. Planlegg også hvordan du skal teste emneutløsere med eksempeluttrykk for å validere og finjustere nøyaktigheten av prosessene for intensjonsgjenkjenning og enhetsuttrekking. Mer informasjon i Vurderinger ved utrulling og testing.

Utløseruttrykk

Utløseruttrykk lærer oppp agentens naturlig språk-modell. De hjelper agenten med å gjenkjenne og reagere nøyaktig på brukerens ytringer ved å definere spesifikke uttrykk som utløser bestemte emner. Riktig konfigurasjon av disse utløseruttrykkene sikrer at agenten kan identifisere brukerens hensikt riktig og svare på riktig måte. Når agenten er usikker på hvilket emne som skal utløses, kan det foreslå opptil tre potensielle emnekandidater (systememne med flere emner) eller falle tilbake til et standardsvar hvis ingen emner er identifisert. Denne mekanismen bidrar til å opprettholde flyten av samtalen og sikrer at agenten kan håndtere et bredt spekter av brukerinnganger effektivt.

Enhetsuttrekking og utfylling av spor

Enhetsuttrekking og sporfylling er viktige komponenter i utviklingen av effektive agenter. Disse prosessene gjør det mulig for agent å innhente og bruke informasjon effektivt ved å identifisere og trekke ut relevante detaljer fra brukerspørringer.

Enhetsuttrekking innebærer å analysere brukerens inndata for å identifisere bestemte informasjonsdeler. I spørringen «Jeg vil bestille tre store, blå t-skjorter» må agentens modell for naturlig språkforståelse for eksempel trekke ut følgende enheter:

  • Antall: 3
  • Farge: Blå
  • Størrelse: Stor
  • Elementtype: T-skjorte

Sporfylling er prosessen med å bruke disse ekstraherte enhetene til å fylle ut den nødvendige informasjonen for en gitt oppgave. I dette eksemplet gjenkjenner agenten emnet som en ordre og fyller ut de nødvendige sporene med de ekstraherte enhetene. Agenten er i stand til å forstå brukerens forespørsel uten å stille flere spørsmål, noe som effektiviserer samhandlingen.

Enhetsuttrekking og utfylling av spor gjør det mulig for agenter å håndtere komplekse spørringer mer effektivt, noe som gir nøyaktige og kontekstuelt relevante svar og forbedrer brukeropplevelsen.

Finn ut mer:

Ingegrere Microsoft Copilot Studio med Azure CLU

Integrering av en CLU-modell med en Copilot Studio-agent kan forbedre agentens funksjoner. Denne integreringen innebærer å tilordne Azure CLU-intensjoner til Copilot Studio-emner, slik at agent kan forstå og svare på brukerens intensjoner mer nøyaktig. I tillegg kan Copilot Studio forhåndsbygde enheter brukes sammen med Azure CLU-enheter, noe som gir et robust rammeverk for enhetsuttrekking.

Når du vurderer denne integreringen, er det viktig å vurdere om den intelligente programarbeidsbelastningen krever Azure CLU. Azure CLU støtter for eksempel flere språk, bransjespesifikke ordbøker og kompleks enhetsuttrekking, noe som kan være avgjørende for programmet. Egendefinerte enhetsuttrekkinger med Azure CLU kan også aktivere stille eller «heldig» utfylling av spor, noe som gjør at agenten kan håndtere scenarioer som å identifisere både kilde- og destinasjonsbyer i ett enkelt uttrykk uten å stille oppfølgingsspørsmål.

Et annet viktig aspekt er å sikre at Azure CLU-tjenestekvotene og -grensene stemmer overens med agentens bruk. Hvis du for eksempel forventer færre enn 1000 oppringinger som krever intensjonsgjenkjenning per minutt, kan du konfigurere Azure CLU ved hjelp av S-nivået. Denne konfigurasjonen sikrer at din agent kan håndtere den forventede arbeidsbelastningen uten å overskride servicegrenser eller pådra seg uventede kostnader.

Finn ut mer:

Vurderinger for emnestrukturer

Effektiv strukturering av emner er viktig for å skape naturlige og sømløse samtaler. Emner er diskrete samtalebaner som, når de kombineres, tillater brukere å samhandle med agenten jevnt. Her er noen viktige hensyn ved utforming av emnestrukturer:

  • Utløserbaserte emner: Disse emnene aktiveres basert på brukerytringer og fungerer som inngangspunkter. Definer klare utløseruttrykk for disse emnene. Hvis utløseruttrykk overlapper hverandre på tvers av flere emner, bør du vurdere å implementere et oppsamlingsemne som kan omdirigere til det aktuelle emnet etter å ha stilt avklarende spørsmål. Med enhetsuttrekking og utfylling av spor kan disse avklarende spørsmålene hoppes over hvis den nødvendige informasjonen allerede er oppgitt.

  • Omdirigeringsbaserte emner: Disse emnene utløses av omdirigeringshandlinger, aktiviteter eller hendelser og kan kalles opp av flere andre emner. De bør utformes for å være gjenbrukbare og modulære, med inngangs- og utgangsvariabler for å lette sømløs integrering i ulike samtalebaner.

  • Emner med dobbel utløser: Noen emner kan utløses enten gjennom intensjonsgjenkjenning eller ved en eksplisitt omdirigering. Denne fleksibiliteten muliggjør mer dynamiske og responsive samtaler.

  • Samtalefremming og basis: Opprett basisemner for situasjoner der ingen samsvarende emner utløses av brukerens spørring. Disse emnene kan tilby generelle svar eller foreslå relevante emner for å opprettholde samtaleflyten.

Utformingstilnærming:

  • Egendefinerte emner for viktige scenarioer: Utvikle noen egendefinerte emner for viktige scenarioer med relevante utløseruttrykk og omdirigeringer. Bruk en overordnet/underordnet emnestruktur til å behandle komplekse samhandlinger. For ugjenkjente intensjoner, implementer generative svar og reservemekanismer.

  • Tvetydighetsemner: Planlegg å bruke tvetydighetsemner for operasjoner som krever avklarende spørsmål. Brukerkontooperasjoner kan for eksempel trenge en avklaring om operasjonstypen (for eksempel opprette, låse opp, avbryte) og det involverte systemet (for eksempel SAP, ServiceNow, Microsoft).

  • Unngå duplisering: Hvis du vil unngå duplisering av innhold, kan du opprette gjenbrukbare emner for dialogbaner som må gjentas. Disse gjenbrukbare emnene kan kalles opp av et overordnet emne, og når samtalen er fullført, kan den gjenoppta logikken i det overordnede emnet.

Finn ut mer:

Håndtere ukjente intensjoner

Effektiv håndtering av ukjente intensjoner sikrer en jevn brukeropplevelse. Ukjente intensjoner oppstår når agenten ikke forstår en brukers ytring og mangler tilstrekkelig tillit til å utløse et eksisterende emne. Her er noen forslag for å håndtere disse scenarioene:

  • Administrere ugjenkjente intensjoner: Rett i utgangspunktet ugjenkjente intensjoner til systememne om samtalefremming, som søker etter svar på offentlige nettsteder og bedriftsressurser som SharePoint-nettsteder. Hvis ingen relevant informasjon blir funnet, kan systemet falle tilbake til en ChatGPT-lignende opplevelse ved hjelp av en egendefinert systemspørring med Azure OpenAI GPT-4-modellen. Denne fremgangsmåten sikrer at brukere får nyttige svar selv når spørringer ikke er planlagt.

  • Integrasjon med eksterne systemer: Vurder om du integrerer med eksterne systemer som en del av reserveplanen. For eksempel integrering med Azure OpenAI GPT-4-modellen ved hjelp av HTTP-forespørsler for å gi en kompatibel ChatGPT-lignende opplevelse.

  • Overvåking av reservebruk: Gå regelmessig gjennom prosentandelen av samtaler som går til reserven. Bruk denne innsikten til å supplere eksisterende emner eller opprette nye, slik at agenten kontinuerlig forbedrer forståelses- og responsfunksjonene.

  • Basisemne og genererte svar: Basissystememnene utløses når det ikke identifiseres noe samsvarende emne. Hvis Genererte svar er aktivert, utløses emnet for samtaleforbedring først ved ukjente intensjonshendelser, etterfulgt av basisemne etter behov. Denne lagdelte tilnærmingen hjelper deg med å håndtere ukjente hensikter effektivt.

  • Bruk samtalefremming og basisløsning: Bruk generative svar til å søke i ulike datakilder eller integrere med andre systemer, for eksempel Azure Cognitive Service for Language. Denne tjenesten kan håndtere store mengder spørsmål-og-svar-par og inkluderer en småpratmodell for tilfeldige spørsmål.

  • Kjernescenarioer og egendefinerte emner: Kontroller at kjernescenarioer og emner er veldefinerte og håndteres gjennom egendefinerte emner. Definer resultatene av disse emnene tydelig for å opprettholde en strukturert og effektiv samtaleflyt.

Lokalisering og språk

Når du bygger en agent, bør du vurdere språkene og markedene din intelligente programarbeidsbelastning må støtte. Lokalisering og språkstøtte er kritiske faktorer for å sikre at den intelligente programarbeidsbelastningen oppfyller behovene til ulike brukerbaser. Her er noen foreslåtte fremgangsmåter:

  • En agent per språk: Denne tilnærmingen innebærer å opprette en egen agent for hvert språk. Det sikrer at hver agent er fullt optimalisert for sitt spesifikke språk. Det kan imidlertid være ressurskrevende å vedlikeholde flere agenter.

  • Én agent for flere språk (konfigurerte oversettelser): Med denne tilnærmingen støtter én enkelt agent flere språk, med oversettelser som en del av agentkonfigurasjonen. Denne tilnærmingen krever oppdatering av oversettelser hver gang agenten oppdateres eller nytt innhold legges til. Det gir en balanse mellom ressurseffektivitet og språkstøtte, men krever nøye administrasjon av oversettelsesoppdateringer.

  • En agent for flere språk (sanntidsoversettelser): Denne metoden bruker en reléagent for å gi sanntidsoversettelser ved kjøretid. Det muliggjør rask utrulling av flere språk og reduserer behovet for hyppige oversettelsesoppdateringer. Det introduserer imidlertid en avhengighet av reléagent og et sanntidsoversettelseslag, for eksempel Azure Service Copilot og Azure Cognitive Services Translator.

Nøkkelvurderinger:

  • Språk og markeder: Språkene og markedene agenten din må støtte, påvirker lokaliseringsstrategien din.

  • En- eller flerspråklig agent: Bestem om du vil utvikle en enkelt agent som støtter flere språk, eller separate agenter for hvert språk. Denne avgjørelsen avhenger av faktorer som ressurstilgjengelighet, vedlikeholdsfunksjoner og kompleksiteten til de involverte språkene.

  • Oversettelsestiming: Vurder om oversettelser skal angis i konfigurasjonsfasen eller leveres i sanntid ved kjøretid. Konfigurerte oversettelser gir stabilitet og kontroll, mens sanntidsoversettelser gir fleksibilitet og rask utrulling.

Finn ut mer: