Spraakfuncties configureren
Dit artikel beschrijft de functies die beschikbaar zijn in Copilot Studio voor interactieve spraak respons met Dynamics 365 klantenservice.
Om uw agent gereed te maken voor spraakdiensten, zie Integreer een spraakgestuurde agent met Dynamics 365 klantenservice.
Zie Interactieve spraak respons gebruiken in uw agents voor een overzicht van de spraakservices.
Spraak- en DTMP-modaliteit
Een agent met spraakfunctie verschilt van een agent met chatfunctie. De spraakgestuurde agent bevat specifieke spraaksysteemonderwerpen voor het verwerken van spraakscenario's. Een chatgebaseerde agent gebruikt standaard de tekstmodaliteit. Een spraakgestuurde agent maakt gebruik van de spraak- en DTMF-modaliteit. De twee modaliteiten zijn niet compatibel met elkaar.
Met Optimaliseren voor spraak kunt u spraakgestuurde agenten in verschillende modaliteiten gebruiken en zorgt u ervoor dat spraakgerelateerde functies correct worden geschreven.
Optimaliseren voor spraak
Als u uw agent niet met de Spraaksjabloon bent gestart, moet u de optie Optimaliseren voor spraak in de instellingen van agent inschakelen.
Open agent en ga naar instellingen>Spraak.
Selecteer Optimaliseren voor spraak. De optie Spraak gebruiken als primaire auteursmodus is ook standaard ingesteld.
Uw agent krijgt de volgende updates wanneer u de opties Optimaliseren voor spraak en Spraak gebruiken als primaire Auteursmodus inschakelt:
- De mogelijkheid om spraakfuncties te ontwerpen wanneer wordt overgeschakeld van tekst naar Spraak en DTMF.
- De spraaksysteemonderwerpen Stiltedetectie, Spraak niet herkend en Drukken op onbekend toetsenblok worden automatisch toegevoegd om spraakgerelateerde scenario's af te handelen.
- Verhoog de nauwkeurigheid met agent data (standaard ingeschakeld), waarmee de nauwkeurigheid van spraakherkenning wordt verbeterd.
- Er is geen wijziging in de bestaande agent-stroom, zoals het Hoofdmenu onderwerp om conversaties te starten met toegewezen DTMF-triggers.
Belangrijk
- Met de instelling Optimaliseren voor spraak worden alleen de mogelijkheden voor spraakgestuurd schrijven gewijzigd, niet de kanaalinstelling. Schakel het Telefonie kanaal in voor een volledig spraakgestuurde agent.
- Als u bovendien Optimaliseren voor spraak instelt op een agent die oorspronkelijk niet was geconfigureerd voor spraakfuncties, betekent dit dat de agent niet de Hoofdmenu (preview) onderwerp heeft. Indien nodig moet u dat onderwerp opnieuw maken.
Optimalisatie voor spraak uitschakelen
U kunt Optimaliseren voor spraak uitschakelen in agent-auteurs als u het kanaal Telefonie niet inschakelt. Nadat u Optimaliseren voor spraak hebt uitgeschakeld, krijgt u de volgende wijzigingen:
- Geen agent-auteurschap voor spraakfuncties, zoals DTMF en barge-in.
- De standaard tekstmodaliteit wordt ingesteld.
- Geen verbetering in spraakherkenning, aangezien er geen spraakherkenning is.
- Geen spraaksysteemonderwerpen of globaal DTMF-onderwerp.
Notitie
Sommige onderwerpen kunnen tijdens het publiceren fouten melden als in andere onderwerpen naar het uitgeschakelde DTMF-onderwerp wordt verwezen.
- Er verandert niets aan uw agent-stroom en kanaalinstellingen, omdat het uitschakelen van optimalisatie het telefoniekanaal niet uitschakelt.
- Het in- of uitschakelen van de optie Optimaliseren voor spraak wordt pas van kracht nadat u uw agent hebt gepubliceerd. Als agent per ongeluk wordt in- of uitgeschakeld en er wordt geschakeld tussen modaliteiten, hebt u nog tijd om dit te verhelpen.
Belangrijk
Als uw telefoniekanalen zijn ingeschakeld, kan het uitschakelen van Optimaliseren voor spraak uw agent verstoren, omdat alle DTMF-triggers automatisch worden uitgeschakeld.
Spraak gebruiken als uw primaire auteursmodus
De Spraak- en DTMF-modaliteit moet worden geselecteerd voor elk knooppunt bij het ontwerpen van spraakfuncties. U kunt de auteursvoorkeur agent selecteren als gebruik stem als primaire auteur. Deze instelling zorgt ervoor dat alle invoervelden de juiste modaliteit hebben. Als u Optimaliseren voor spraak al hebt ingeschakeld, wordt de optie Spraak gebruiken als primaire auteursmodus standaard ingeschakeld.
Berichtbeschikbaarheid
Het gebruik van de tekst- of spraakmodaliteit kan uw kanaal op verschillende manieren beïnvloeden.
Tekstmodaliteit | Spraakmodaliteit | Agent tekst- en spraakkanaal |
---|---|---|
Bericht beschikbaar | Bericht leeg | Bericht beschikbaar |
Bericht leeg | Bericht beschikbaar | Bericht niet beschikbaar |
Aangepaste automatische spraakherkenning
Spraakgestuurde agenten voor een specifiek domein, zoals medisch of financieel, zien mogelijk dat gebruikers financiële termen of medisch jargon gebruiken. Sommige termen en jargon zijn voor de spraakgestuurde agent lastig om te zetten van spraak naar tekst.
Om ervoor te zorgen dat de spraakinvoer nauwkeurig wordt herkend, kunt u de spraakherkenning verbeteren:
Open agent en selecteer instellingen>Spraak.
Selecteer Verhoog de nauwkeurigheid met agent-gegevens om de standaardinstellingen voor automatische spraakherkenning van agent in te schakelen.
Selecteer Opslaan om uw wijzigingen op te slaan.
Publiceer uw agent om de nieuwe wijzigingen te zien.
Referentie voor stemopties op agentniveau
Op de pagina met agent details instellingen kunt u time-outs configureren voor verschillende spraakgerelateerde functies. De instellingen die op deze pagina worden toegepast, worden de standaardinstellingen voor onderwerpen die in uw agent zijn gemaakt.
Wijzigingen aanbrengen in de time-outopties op agentniveau:
Open agent en selecteer instellingen>Spraak.
Selecteer de gewenste instellingen en Aanpassen de standaardinstellingen van agent.
Selecteer Opslaan om uw wijzigingen op te slaan.
Instellingen op agentniveau
In de volgende tabel wordt elke optie vermeld en hoe deze zich verhoudt tot instellingen op knooppuntniveau.
Spraakgestuurde sectie op agentniveau | Instelling | Omschrijving | Default value | Overschrijven op knooppuntniveau |
---|---|---|---|---|
DTMF | Time-out tussen cijfers | Maximale toegestane tijd (milliseconden) tijdens het wachten op de volgende DTMF-toetsinvoer. Past meercijferige DTMF-invoer alleen toe als gebruikers niet voldoen aan de maximale invoerlengte. | 3000 ms | Vraagknooppunt met spraakeigenschappen voor Meercijferige DTMF-invoer |
DTMF | Time-out bij beëindiging | Maximale duur (milliseconden) voor het wachten op een DTMF-beëindigingstoets. De limiet is van toepassing wanneer de gebruiker de maximale invoerlengte heeft bereikt en niet op de beëindigingstoets heeft gedrukt. Geldt alleen voor meercijferige DTMF-invoer. Nadat de limiet is verstreken en de afsluitende DTMF-sleutel niet is aangekomen, beëindigt agent de herkenning en retourneert het resultaat tot die tijd aanwijzen. Als dit is ingesteld op "doorgaan zonder te wachten", wacht agent niet op de beëindigingssleutel. Agent wordt direct geretourneerd nadat de gebruiker de maximale lengte heeft ingevoerd. |
2000 ms | Vraagknooppunt met spraakeigenschappen voor Meercijferige DTMF-invoer |
Stiltedetectie | Time-out voor stiltedetectie | Maximale toegestane stilte (milliseconden) tijdens het wachten op gebruikersinvoer. Limiet is van toepassing wanneer agent geen gebruikersinvoer detecteert. Standaard is dit 'geen stilte-time-out'. agent wacht oneindig op de invoer van de gebruiker. Stiltedetectie voor spraak keer de periode nadat de stem klaar is met spreken. |
Geen time-out voor stilte | Vraagknooppunt met spraakeigenschappen voor Meercijferige DTMF-invoer Systeemonderwerp (stiltedetectie trigger eigenschappen) voor Configureer stiltedetectie en time-outs |
Spraakverzameling | Time-out voor einde uiting | De limiet is van toepassing wanneer de gebruiker pauzeert tijdens of na het spreken. Als de pauze langer duurt dan de time-outlimiet, gaat agent ervan uit dat de gebruiker klaar is met spreken. De maximale waarde voor de time-out voor het einde van de uiting is 3000 milliseconden. Alles boven 3000 ms wordt teruggebracht tot 3000 milliseconden. |
1500 ms | Vraagknooppunt met spraakeigenschappen |
Spraakverzameling | Time-out voor spraakherkenning | Bepaalt hoeveel tijd de agent de gebruiker toestaat voor invoer nadat deze begint te spreken. De standaardwaarde is 12000 milliseconden (ongeveer 12 seconden). Geen time-out voor herkenning betekent oneindige tijd. Agent stelt de vraag opnieuw. Als er geen respons is, overschrijdt de spraak Time-out voor spraakherkenning. | 12,000 ms | Vraagknooppunt met spraakeigenschappen |
Latentieberichten | Vertragingsbericht verzenden | Bepaalt hoe lang agent wacht voordat het latentiebericht wordt afgeleverd nadat een achtergrondbewerkingsaanvraag is gestart. De timing wordt ingesteld in milliseconden. | 500 ms | Eigenschappen van actieknooppunten voor langlopende bewerking |
Latentieberichten | Minimale afspeeltijd | Het latentiebericht wordt gedurende een minimale hoeveelheid tijd afgespeeld, zelfs als de achtergrondbewerking wordt voltooid terwijl het bericht wordt afgespeeld. De timing wordt ingesteld in milliseconden. | 5000 ms | Eigenschappen voor actieknooppunten voor langlopende bewerking |
Spraakgevoeligheid | Gevoeligheid | Bepaalt hoe het systeem de detectie van spraak en achtergrondgeluid in evenwicht brengt. Verlaag de gevoeligheid voor lawaaiige omgevingen, openbare ruimtes en handsfree bediening. Verhoog de gevoeligheid voor rustige omgevingen, gebruikers die zacht praten of de detectie van spraakopdrachten. De standaardinstelling is 0,5. | 0.5 | Er bestaan geen overschrijvingen op knooppuntniveau voor dit besturingselement. |
Inbreken inschakelen
Door barge-in in te schakelen, kunnen uw agent-gebruikers uw agent onderbreken. Deze functie kan handig zijn als u niet wilt dat de agent-gebruiker het hele bericht hoort. Bellers kunnen de menuopties bijvoorbeeld al kennen, omdat ze deze in het verleden hebben gehoord. Met barge-in kan de agent-gebruiker de gewenste optie invoeren, zelfs als agent nog niet alle opties heeft opgesomd.
Scenario's voor het uitschakelen van inbreken
- Schakel barge-in uit als u onlangs een agent-bericht hebt bijgewerkt of als het nalevingsbericht niet mag worden onderbroken.
- Schakel barge-in uit voor het eerste agent-bericht om ervoor te zorgen dat agent-gebruikers op de hoogte zijn van nieuwe of essentiële informatie.
Specificaties
Barge-in ondersteunt DTMF-gebaseerde en spraakgebaseerde onderbrekingen van de agent-gebruiker.
Inbreken kan met elk bericht in één batch worden beheerd. Plaats
barge-in-disabled
-knooppunten op volgorde vóór elk knooppunt waar inbreken is toegestaan. Anders wordt uitgeschakeld inbreken behandeld als een bericht dat inbreken toegestaan is.Zodra één batchwachtrij is voltooid, wordt de automatische instelling voor inbreken opnieuw ingesteld voor de volgende batch en beheerd door de vlag voor inbreken bij elk volgend bericht. U kunt knooppunten van uitgeschakeld inbreken plaatsen zodra de reeks opnieuw begint.
Fooi
Als er opeenvolgende berichtknooppunten zijn, gevolgd door een vraagknooppunt, worden spraakberichten voor deze knooppunten gedefinieerd als één batch. Eén batch begint met een berichtknooppunt en stopt bij het vraagknooppunt, dat wacht op de invoer van de gebruiker.
Schakel barge-in niet uit voor lange berichten, vooral niet als u verwacht dat agent-gebruikers vaak met agent zullen communiceren. Als uw agent-gebruiker de menuopties al kent, kunt u hem of haar zelf laten bepalen waar hij of zij naartoe wil.
Inbreken instellen
Met een Bericht- of Vraag-knooppunt geselecteerd stelt u de gewenste modaliteit in op Spraak en DTMF.
Selecteer het pictogram Meer (…) van het knooppunt en selecteer vervolgens Eigenschappen.
Voor Bericht-knooppunten wordt het paneel Eigenschappen van activiteit verzenden geopend aan de zijkant van het ontwerpcanvas.
Selecteer Inbreken toestaan.
Voor Vraag-knooppunten wordt het paneel Vraageigenschappen geopend. Selecteer vervolgens Spraak.
Selecteer via de Spraak-eigenschappen Inbreken toestaan.
Sla het onderwerp op om uw wijzigingen door te voeren.
Stiltedetectie en time-outs configureren
Met stiltedetectie kunt u configureren hoe lang agent moet wachten op invoer van de gebruiker en welke actie er moet worden ondernomen als er geen invoer wordt ontvangen. Stiltedetectie is het meest bruikbaar in respons voor een vraag op knooppuntniveau of wanneer agent wacht op een triggerzin om een nieuwe onderwerp te beginnen.
U kunt de standaardtime-outs voor onderwerpen configureren.
De standaardwaarden voor een knooppunt overschrijven:
Selecteer het pictogram Meer (…) van het knooppunt en selecteer vervolgens Eigenschappen.
Het paneel Vraageigenschappen wordt geopend.
Selecteer Spraak en pas de volgende instellingen aan:
Optie Time-out voor stiltedetectie Omschrijving Gebruik de instelling agent Node gebruikt de globale instelling voor stiltedetectie. Uitschakelen voor dit knooppunt Agent wacht oneindig op een respons. Aanpassen in milliseconden Agent wacht een bepaalde tijd voordat de vraag wordt herhaald.
Terugvalactie
U kunt bepaalde gedragingen configureren als een terugvalactie:
- Hoe vaak moet agent een vraag herhalen?
- Wat er in het bericht moet staan waarin de vraag opnieuw wordt gesteld
- Wat de agent moet doen na een bepaald aantal herhalingen
Spraakinvoer
Voor spraakinvoer kunt u het volgende opgeven:
- Time-out einde uiting: Hoe lang de agent wacht nadat de gebruiker klaar is met spreken
- Time-out spraakherkenning: Hoeveel tijd de agent aan de gebruiker geeft nadat deze begint te reageren
Om het detectiegedrag voor stilte te configureren wanneer uw agent wacht op een triggerzin, Aanpassen, gebruikt u de instellingen in Aan stilte systeemonderwerp.
Een bericht over latentie toevoegen voor langlopende bewerkingen
Bij langdurige backendbewerkingen kan uw agent een bericht naar gebruikers sturen om hen op de hoogte te stellen van de langere processen. Agenten op een berichtenkanaal kunnen ook een latentiebericht verzenden.
Audio afspelen van latentiebericht | Latentiebericht in chat |
---|---|
Blijft herhalen totdat de bewerking is voltooid. | Wordt slechts één keer verzonden wanneer de opgegeven latentie is bereikt. |
In Copilot Studio kan uw agent een bericht herhalen na het activeren van een Power Automate flow:
Selecteer het pictogram Meer (…) van het knooppunt en selecteer vervolgens Eigenschappen. Het paneel Actie-eigenschappen wordt geopend.
Selecteer Een bericht verzenden.
Voer in het gedeelte Bericht in wat u wilt dat agent zegt. U kunt SSML gebruiken om het geluid van het bericht te wijzigen. Agent herhaalt het bericht totdat de stroom voltooid is.
U kunt Aanpassen aangeven hoe lang de agent moet wachten voordat het bericht onder de sectie Vertraging wordt herhaald. U kunt een minimale wachttijd instellen, zelfs als de stroom is voltooid.
Gespreksbeëindiging configureren
Om uw agent zo te configureren dat het gesprek wordt beëindigd en opgehangen, voegt u een nieuw knooppunt (+) toe en selecteert u onderwerp management>Conversatie beëindigen.
Spraaksynthese opmaken met SSML
U kunt SSML (Speech Synthesis Markup Language) gebruiken om te wijzigen hoe de code agent klinkt wanneer berichten hardop worden voorgelezen. U kunt bijvoorbeeld de toonhoogte of frequentie van de gesproken woorden, de snelheid en het volume wijzigen.
SSML gebruikt tags om de tekst die u wilt wijzigen in te sluiten, vergelijkbaar met HTML. U kunt de volgende tags gebruiken in Copilot Studio:
SSML-tag | Omschrijving | Koppeling naar documentatie van spraakservice |
---|---|---|
<audio src="_URL to an audio file_"/> |
Voeg de URL toe aan een audiobestand binnen de tag. Het bestand moet toegankelijk zijn voor de gebruiker agent. | Opgenomen audio toevoegen |
<break /> |
Pauzes of onderbrekingen tussen woorden invoegen. Voeg onderbrekingsopties in de tag in. | Een pauze toevoegen |
<emphasis> Tekst die u wilt wijzigen</emphasis> |
Nadrukniveaus toevoegen aan woorden of zinsdelen. Voeg nadrukopties toe in de openingstag. Voeg de afsluitingstag toe na de tekst die u wilt wijzigen. | De nadrukopties aanpassen |
<prosody> Tekst die u wilt wijzigen</prosody> |
Wijzigingen in toonhoogte, contour, bereik, snelheid en volume opgeven. Voeg prosodieopties toe in de openingstag. Voeg de afsluitingstag toe na de tekst die u wilt wijzigen. | Prosodieopties aanpassen |
<lang xml:lang="xx-XX"> Tekst die u wilt wijzigen</lang> |
Aanpassen de spreektaal binnen hetzelfde bericht bij gebruik van een meertalige neurale stem. | Aanpassen spreektalen |
Een tag zoeken en gebruiken
SSML gebruikt tags om de tekst die u wilt wijzigen in te sluiten, zoals HTML.
U kunt de volgende tags gebruiken in Copilot Studio:
Met een Bericht- of Vraag-knooppunt geselecteerd wijzigt u de modus in Spraak en DTMF.
Selecteer het menu SSML-tags en selecteer een tag.
Het berichtvenster wordt gevuld met de tag. Als er al tekst in het berichtvenster staat, wordt de code van de tag aan het einde van uw bericht toegevoegd.
Omring de tekst die u wilt wijzigen met de openings- en sluitingstags. U kunt meerdere tags combineren en afzonderlijke delen van het bericht aanpassen met afzonderlijke tags.
Fooi
U kunt SSML-tags die niet in het helpmenu verschijnen handmatig invoeren. Zie De synthese verbeteren met Speech Synthesis Markup Language voor meer informatie over andere tags die u kunt gebruiken.
Een gesprek doorschakelen naar een vertegenwoordiger of een extern telefoonnummer
U kunt de oproep doorschakelen naar een extern telefoonnummer via agent. In Copilot Studio wordt blinde doorschakeling naar een PSTN-telefoonnummer en het nummer voor directe routering ondersteund.
Doorschakelen naar een extern telefoonnummer:
Voeg in het onderwerp dat u wilt wijzigen een nieuw knooppunt (+) toe. Selecteer in het knooppuntmenu Onderwerpbeheer en vervolgens Gesprek overdragen.
Selecteer onder Overdrachtstype Doorschakelen naar extern telefoonnummer en voer het overdrachtsnummer in.
(Optioneel) Voeg een SIP UUI-header toe aan het telefoongesprek.
Deze header is een reeks
key=value
-paren, zonder spaties of speciale tekens, die door externe systemen kunnen worden gelezen.Selecteer het pictogram Meer (…) van het knooppunt en selecteer vervolgens Eigenschappen. Het paneel Gesprekseigenschappen overdragen wordt geopend.
Voer onder SIP UUI-header de informatie in die u wilt verzenden bij het doorverbinden van gesprekken. Variabelen worden niet ondersteund bij het doorverbinden naar een extern telefoonnummer.
Let op
Alleen de eerste 128 tekens in de reeks worden verzonden.
De header accepteert alleen cijfers, letters, isgelijktekens (
=
) en puntkomma's (;
). Alle andere tekens, zoals spaties, accolades en haakjes, of formules worden niet ondersteund en kunnen ervoor zorgen dat de overdracht mislukt.
Fooi
Voeg een +
toe aan uw telefoonnummer voor de bijbehorende landcode.
Uitgaand overdrachtsverkeer met SIP UUI voor het doeltelefoonnummer moet directe routering gebruiken. Telefoonnummers van het openbare telefoonnetwerk (PSTN) ondersteunen geen SIP UUI-headeroverdrachten.
Voor informatie over het overdragen aan een vertegenwoordiger, zie Expliciete triggers.
Spraakvariabelen gebruiken
Copilot Studio biedt ondersteuning aan het invullen van variabelen. U kunt vooraf gedefinieerde variabelen gebruiken of aangepaste variabelen maken.
Notitie
- Zie Werken met variabelen voor meer informatie over hoe u variabelen gebruikt en maakt in Copilot Studio.
- Zie Variabelen voor spraakgestuurde agenten voor informatie over aanvullende activiteits- en conversatievariabelen die beschikbaar zijn voor spraakgestuurde agenten.
Een spraakgestuurde agent in Copilot Studio ondersteunt contextvariabelen. Met deze variabelen kunt u uw agent-gesprekken integreren met Dynamics 365 klantenservice bij het doorverbinden van een gesprek.
Voor meer informatie over contextvariabelen in Dynamics 365 klantenservice, zie Contextvariabelen voor Copilot Studio bots.
Deze integratie ondersteunt deze scenario's met de volgende variabelen wanneer u doorschakelt:
Variabele | Type | Omschrijving |
---|---|---|
System.Activity.From.Name |
String | De beller-ID van de agent-gebruiker |
System.Activity.Recipient.Name |
String | Het nummer dat wordt gebruikt om te bellen of Verbinden naar agent |
System.Conversation.SipUuiHeaderValue |
String | SIP-headerwaarde bij overdracht via een telefoonnummer voor directe routering |
System.Activity.UserInputType |
String | Of de agent-gebruiker DTMF of spraak in het gesprek heeft gebruikt |
System.Activity.InputDTMFKey |
String | De ruwe DTMF-invoer van de agent-gebruiker |
System.Conversation.OnlyAllowDTMF |
Booleaans | Spraak negeert spraakinvoer als deze is ingesteld op true |
System.Activity.SpeechRecognition.Confidence |
Aantal | De betrouwbaarheidswaarde (tussen 0 en 1) van de laatste spraakherkenningsgebeurtenis |
System.Activity.SpeechRecognition.MinimalFormattedText |
String | Resultaten van spraakherkenning (als onbewerkte tekst) voordat in Copilot Studio het speciale model voor het begrijpen van natuurlijke taal is toegepast |
Notitie
- Het publiceren van een agent met grote trigger-zinnen en entiteitsgroottes duurt langer.
- Als meerdere gebruikers tegelijkertijd dezelfde agent publiceren, wordt uw publicatieactie geblokkeerd. Je moet de agent opnieuw publiceren nadat anderen hun bestaande agent-bewerkingen hebben voltooid.
Voor meer informatie over de basisprincipes van publiceren, zie Belangrijke concepten - Uw agent publiceren en implementeren.