Dela via


Namnområde Microsoft::CognitiveServices::Speech

Sammanfattning

Medlemmar Beskrivningar
uppräkning PropertyId Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0.
uppräkning Utdataformat.
uppräkning ProfanityOption Tar bort svordomar (svordomar) eller ersätter bokstäver med profana ord med stjärnor. Har lagts till i version 1.5.0.
uppräkning ResultReason Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.
uppräkning AnnulleringReason Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.
uppräkning AnnulleringErrorCode Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.
uppräkningen NoMatchReason Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.
uppräkning ActivityJSONType Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.
uppräkning SpeechSynthesisOutputFormat Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.
uppräkning streamstatus Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.
uppräkning ServicePropertyChannel Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.
uppräkning av VoiceProfileType Definierar röstprofiltyper.
uppräkning RecognitionFactorScope Definierar omfånget som en igenkänningsfaktor tillämpas på.
uppräkningspronunciationAssessmentGradingSystem Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.
enum PronunciationAssessmentGranularity Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0.
enum SynthesisVoiceType Definierar typen av syntesröster som lagts till i version 1.16.0.
enum SynthesisVoiceGender Definierar könet för syntesröster som lagts till i version 1.17.0.
uppräkning SpeechSynthesisBoundaryType Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.
uppräkning SegmentationStrategy Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".
klass AsyncRecognizer AsyncRecognizer abstrakt basklass.
klassen AudioDataStream Representerar ljuddataström som används för att använda ljuddata som en ström. Har lagts till i version 1.4.0.
klassen AutoDetectSourceLanguageConfig Klass som definierar källkonfiguration för automatisk identifiering Uppdaterad i 1.13.0.
klassen AutoDetectSourceLanguageResult Innehåller automatiskt identifierat källspråkresultat som lagts till i 1.8.0.
klassen BaseAsyncRecognizer BaseAsyncRecognizer-klass.
klassen CancellationDetails Innehåller detaljerad information om varför ett resultat avbröts.
klass ClassLanguageModel Representerar en lista över grammatiker för dynamiska grammatikscenarier. Har lagts till i version 1.7.0.
klassen Anslutning Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en identifierare autonomt anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Det är valfritt att använda Anslutning. Den är avsedd för scenarier där finjustering av programmets beteende baserat på anslutningsstatus behövs. Användare kan också anropa Open() för att initiera en tjänstanslutning manuellt innan de påbörjar igenkänningen på den identifierare som är associerad med den här anslutningen. När du har startat en igenkänning kan det hända att det inte går att anropa Open() eller Close(). Detta påverkar inte identifieraren eller den pågående igenkänningen. Anslutningen kan ta bort av olika skäl. Identifieraren försöker alltid att återupprätta anslutningen efter behov för att garantera pågående åtgärder. I alla dessa fall anger anslutna/frånkopplade händelser ändringen av anslutningsstatusen. Uppdaterad i version 1.17.0.
klassen ConnectionEventArgs Innehåller data för ConnectionEvent. Har lagts till i version 1.2.0.
klassen ConnectionMessage ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Taltjänsten kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.10.0.
klassen ConnectionMessageEventArgs Innehåller data för ConnectionMessageEvent.
klassen EmbeddedSpeechConfig Klass som definierar inbäddad talkonfiguration (offline).
klassen EventArgs Basklass för händelseargument.
klassen EventSignal Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser.
klassen EventSignalBase Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser.
klassen Grammatik Representerar basklass grammatik för anpassning av taligenkänning. Har lagts till i version 1.5.0.
klassen GrammarList Representerar en lista över grammatiker för dynamiska grammatikscenarier. Har lagts till i version 1.7.0.
klassen GrammarPhrase Representerar en fras som kan talas av användaren. Har lagts till i version 1.5.0.
klassen HybridSpeechConfig Klass som definierar hybridkonfigurationer (moln och inbäddade) för taligenkänning eller talsyntes.
klassen KeywordRecognitionEventArgs Klass för de händelser som KeywordRecognizer.
klassen KeywordRecognitionModel Representerar nyckelordsigenkänningsmodellen som används med StartKeywordRecognitionAsync-metoder.
klassen KeywordRecognitionResult Klass som definierar de resultat som genereras av KeywordRecognizer.
klassen KeywordRecognizer Typ av identifierare som är specialiserad på att endast hantera nyckelordsaktivering.
klassen NoMatchDetails Innehåller detaljerad information för NoMatch-igenkänningsresultat.
klassen PersonalVoiceSynthesisRequest Klass som definierar talsyntesbegäran för personlig röst (aka.ms/azureai/personal-voice). Den här klassen är i förhandsversion och kan komma att ändras. Har lagts till i version 1.39.0.
klassen PhraseListGrammar Representerar en fraslista grammatik för dynamiska grammatikscenarier. Har lagts till i version 1.5.0.
klassen PronunciationAssessmentConfig Klass som definierar uttalsutvärderingskonfiguration som lagts till i 1.14.0.
klassen PronunciationAssessmentResult Klass för uttalsutvärderingsresultat.
klassen PronunciationContentAssessmentResult Klass för resultat av innehållsutvärdering.
klassen PropertyCollection Klass för att hämta eller ange ett egenskapsvärde från en egenskapssamling.
klassen RecognitionEventArgs Innehåller data för RecognitionEvent.
klassen RecognitionResult Innehåller detaljerad information om resultatet av en igenkänningsåtgärd.
klassen Recognizer Känna igen basklass.
klassen SessionEventArgs Basklass för sessionshändelseargument.
klassen SmartHandle Smart handtagsklass.
klassen SourceLanguageConfig Klass som definierar konfiguration av källspråk, tillagd i 1.8.0.
klassen SourceLanguageRecognizer Klass för källspråksidentkännare. Du kan använda den här klassen för fristående språkidentifiering. Har lagts till i version 1.17.0.
klassen SpeechConfig Klass som definierar konfigurationer för tal-/avsiktsigenkänning eller talsyntes.
klassen SpeechRecognitionCanceledEventArgs Klassen för taligenkänning avbröt händelseargument.
klassen SpeechRecognitionEventArgs Klass för argument för taligenkänningshändelser.
klassen SpeechRecognitionModel Information om taligenkänningsmodell.
klassen SpeechRecognitionResult Basklass för taligenkänningsresultat.
klassen SpeechRecognizer Klass för taligenkänning.
klassen SpeechSynthesisBookmarkEventArgs Klass för talsyntesbokmärkeshändelseargument. Har lagts till i version 1.16.0.
klassen SpeechSynthesisCancellationDetails Innehåller detaljerad information om varför ett resultat avbröts. Har lagts till i version 1.4.0.
klassen SpeechSynthesisEventArgs Klass för talsynteshändelseargument. Har lagts till i version 1.4.0.
klassen SpeechSynthesisRequest Klass som definierar talsyntesbegäran. Den här klassen är i förhandsversion och kan komma att ändras. Har lagts till i version 1.37.0.
klassen SpeechSynthesisResult Innehåller information om resultatet från text-till-tal-syntes. Har lagts till i version 1.4.0.
klassen SpeechSynthesisVisemeEventArgs Klass för talsyntes viseme-händelseargument. Har lagts till i version 1.16.0.
klassen SpeechSynthesisWordBoundaryEventArgs Klass för talsyntesens ordgränshändelseargument. Har lagts till i version 1.7.0.
klassen SpeechSynthesizer Klass för talsyntes. Uppdaterad i version 1.14.0.
klassen SpeechTranslationModel Information om talöversättningsmodell.
klassen SynthesisVoicesResult Innehåller information om resultatet från röstlistan över talsynteser. Har lagts till i version 1.16.0.
klassen VoiceInfo Innehåller information om syntesröstinformation uppdaterad i version 1.17.0.

Medlemmar

enum PropertyId

Värden Beskrivningar
SpeechServiceConnection_Key Prenumerationsnyckeln för Cognitive Services Speech Service. Om du använder en avsiktsigenkänning måste du ange LUIS-slutpunktsnyckeln för din specifika LUIS-app. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint Cognitive Services Speech Service-slutpunkten (url). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromEndpoint. Obs! Den här slutpunkten är inte samma som slutpunkten som används för att hämta en åtkomsttoken.
SpeechServiceConnection_Region Cognitive Services Speech Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token Cognitive Services Speech Service-auktoriseringstoken (även kallad åtkomsttoken). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type Auktoriseringstypen För Cognitive Services Speech Service. Används för närvarande inte.
SpeechServiceConnection_EndpointId Slutpunkts-ID:t för Cognitive Services Custom Speech eller Custom Voice Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetEndpointId. Obs! Slutpunkts-ID:t är tillgängligt i den anpassade talportalen, som visas under Slutpunktsinformation.
SpeechServiceConnection_Host Cognitive Services Speech Service-värden (url). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName Värdnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyPort Porten för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyUserName Användarnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyPassword Lösenordet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_Url URL-strängen som skapats från talkonfigurationen. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. OBS! Har lagts till i version 1.5.0.
SpeechServiceConnection_ProxyHostBypass Anger listan över värdar för vilka proxyservrar inte ska användas. Den här inställningen åsidosätter alla andra konfigurationer. Värdnamn avgränsas med kommatecken och matchas på ett skiftlägesokänsligt sätt. Jokertecken stöds inte.
SpeechServiceConnection_TranslationToLanguages Listan över kommaavgränsade språk som används som målöversättningsspråk. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::AddTargetLanguage och SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice Namnet på cognitive service-texten till taltjänstens röst. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::SetVoiceName. Obs! Giltiga röstnamn finns här.
SpeechServiceConnection_TranslationFeatures Översättningsfunktioner. För internt bruk.
SpeechServiceConnection_IntentRegion Language Understanding Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode Igenkänningsläget för Cognitive Services Speech Service. Kan vara "INTERACTIVE", "CONVERSATION", "DICTATION". Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt.
SpeechServiceConnection_RecoLanguage Det talade språket som ska kännas igen (i BCP-47-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId Sessions-ID: t. Det här ID:t är en universellt unik identifierare (även kallad UUID) som representerar en specifik bindning av en ljudindataström och den underliggande taligenkänningsinstansen som den är bunden till. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Frågeparametrarna som tillhandahålls av användare. De skickas till tjänsten som URL-frågeparametrar. Har lagts till i version 1.5.0.
SpeechServiceConnection_RecoBackend Strängen för att ange den serverdel som ska användas för taligenkänning. tillåtna alternativ är online och offline. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är offlinealternativet endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelName Namnet på den modell som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelKey Den här egenskapen är inaktuell.
SpeechServiceConnection_RecoModelIniFile Sökvägen till ini-filen för modellen som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthLanguage Det talade språket som ska syntetiseras (t.ex. en-US) har lagts till i version 1.4.0.
SpeechServiceConnection_SynthVoice Namnet på TTS-rösten som ska användas för talsyntes som lagts till i version 1.4.0.
SpeechServiceConnection_SynthOutputFormat Strängen för att ange TTS-utdataljudformatet Har lagts till i version 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Anger om du använder komprimerat ljudformat för talsyntesljudöverföring. Den här egenskapen påverkar bara när SpeechServiceConnection_SynthOutputFormat är inställt på ett pcm-format. Om den här egenskapen inte har angetts och GStreamer är tillgänglig använder SDK komprimerat format för syntetiserad ljudöverföring och avkodar den. Du kan ställa in den här egenskapen på "false" för att använda raw pcm-format för överföring på kabel. Har lagts till i version 1.16.0.
SpeechServiceConnection_SynthBackend Strängen för att ange TTS-serverdelen. giltiga alternativ är online och offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths för att ställa in syntesens serverdel till offline. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Datafilens sökvägar för offlinesyntesmotorn. endast giltigt när syntesserverdelen är offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthOfflineVoice Namnet på den offline-TTS-röst som ska användas för talsyntes Under normala omständigheter bör du inte använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::SetSpeechSynthesisVoice och EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthModelKey Den här egenskapen är inaktuell.
SpeechServiceConnection_VoicesListEndpoint Röstlistan api-slutpunkt (URL) för Cognitive Services Speech Service-röster. Under normala omständigheter behöver du inte ange den här egenskapen. SDK skapar den baserat på region/värd/slutpunkt för SpeechConfig. Har lagts till i version 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs Det initiala tidsgränsvärdet för tystnad (i millisekunder) som används av tjänsten. Har lagts till i version 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs Tidsgränsvärdet för sluttystnad (i millisekunder) som används av tjänsten. Har lagts till i version 1.5.0.
SpeechServiceConnection_EnableAudioLogging Ett booleskt värde som anger om ljudloggning är aktiverat i tjänsten eller inte. Ljud- och innehållsloggar lagras antingen i Microsoft-ägd lagring eller i ditt eget lagringskonto som är länkat till din Cognitive Services-prenumeration (BYOS)-aktiverad Speech-resurs (Bring Your Own Storage). Har lagts till i version 1.5.0.
SpeechServiceConnection_LanguageIdMode ID-läget för taltjänstens anslutningsspråk. Kan vara "AtStart" (standard) eller "Kontinuerlig". Se dokumentet Language Identification. Lades till i 1.25.0.
SpeechServiceConnection_TranslationCategoryId Översättningskategori-ID för taltjänstens anslutning.
SpeechServiceConnection_AutoDetectSourceLanguages Automatiskt identifiera källspråk som lagts till i version 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult Resultatet för automatisk identifiering av källspråket har lagts till i version 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse Det begärda utdataformatet för Cognitive Services Speech Service-svar (enkelt eller detaljerat). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse Den begärda svarsnivån för Cognitive Services Speech Service utdata för svordomar. Används för närvarande inte.
SpeechServiceResponse_ProfanityOption Den begärda inställningen för Cognitive Services Speech Service-svar ger ut svordomar. Tillåtna värden är "maskerade", "borttagna" och "råa". Har lagts till i version 1.5.0.
SpeechServiceResponse_PostProcessingOption Ett strängvärde som anger vilket alternativ efter bearbetning som ska användas av tjänsten. Tillåtna värden är "TrueText". Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Ett booleskt värde som anger om tidsstämplar på ordnivå ska inkluderas i svarsresultatet. Har lagts till i version 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold Antalet gånger ett ord måste vara i partiella resultat för att returneras. Har lagts till i version 1.5.0.
SpeechServiceResponse_OutputFormatOption Ett strängvärde som anger alternativet utdataformat i svarsresultatet. Endast intern användning. Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestSnr Ett booleskt värde som anger om SNR (signal till brus-förhållande) ska inkluderas i svarsresultatet. Har lagts till i version 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Ett booleskt värde att begära för att stabilisera partiella översättningsresultat genom att utelämna ord i slutet. Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestWordBoundary Ett booleskt värde som anger om WordBoundary-händelser ska begäras. Har lagts till i version 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Ett booleskt värde som anger om skiljetecken ska begäras i WordBoundary Events. Standardvärdet är sant. Har lagts till i version 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Ett booleskt värde som anger om meningsgränsen ska begäras i WordBoundary Events. Standardvärdet är falskt. Har lagts till i version 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio Ett booleskt värde som anger om SDK ska synkronisera händelser med syntesmetadata (t.ex. ordgräns, viseme osv.) till ljuduppspelningen. Detta börjar gälla först när ljudet spelas upp via SDK:et. Standardvärdet är sant. Om värdet är falskt utlöser SDK:t händelserna när de kommer från tjänsten, vilket kan vara osynkroniserat med ljuduppspelningen. Har lagts till i version 1.31.0.
SpeechServiceResponse_JsonResult Cognitive Services Speech Service-svarsutdata (i JSON-format). Den här egenskapen är endast tillgänglig för igenkänningsresultatobjekt.
SpeechServiceResponse_JsonErrorDetails Information om Cognitive Services Speech Service-fel (i JSON-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs Svarstiden för igenkänning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för tal/översättning/avsikt. Detta mäter svarstiden mellan när en ljudinmatning tas emot av SDK:et och det ögonblick då slutresultatet tas emot från tjänsten. SDK beräknar tidsskillnaden mellan det sista ljudfragmentet från ljudindata som bidrar till slutresultatet och den tid då slutresultatet tas emot från taltjänsten. Har lagts till i version 1.3.0.
SpeechServiceResponse_RecognitionBackend Serverdelen för igenkänning. Skrivskyddad, tillgänglig för taligenkänningsresultat. Detta anger om molnigenkänning (online) eller inbäddad (offline) användes för att producera resultatet.
SpeechServiceResponse_SynthesisFirstByteLatencyMs Talsyntesens första bytesvarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för bearbetning och det ögonblick då det första byteljudet är tillgängligt. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs Talsyntesen alla bytes svarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och det ögonblick då hela ljudet syntetiseras. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs Underkörningstiden för talsyntes i millisekunder. Skrivskyddad, tillgänglig för resultat i SynthesisCompleted-händelser. Detta mäter den totala underkörningstiden från PropertyId::AudioConfig_PlaybackBufferLengthInMs fylls i för att syntesen ska slutföras. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs Svarstid för talsyntesanslutning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och när HTTP/WebSocket-anslutningen upprättas. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs Svarstiden för talsyntesnätverket i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter nätverkets tur och retur-tid. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs Svarstiden för talsyntestjänsten i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter bearbetningstiden för tjänsten för att syntetisera det första bytet av ljud. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisBackend Anger vilken serverdel som syntesen är klar med. Skrivskyddad, tillgänglig för talsyntesresultat, förutom resultatet i SynthesisStarted-händelsen Som lagts till i version 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults Avgör om mellanliggande resultat innehåller talaridentifiering.
CancellationDetails_Reason Avbokningsorsaken. Används för närvarande inte.
CancellationDetails_ReasonText Annulleringstexten. Används för närvarande inte.
CancellationDetails_ReasonDetailedText Detaljerad text om annullering. Används för närvarande inte.
LanguageUnderstandingServiceResponse_JsonResult Language Understanding Service-svarsutdata (i JSON-format). Tillgänglig via IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture Enhetsnamnet för ljudinspelning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromMicrophoneInput. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_NumberOfChannelsForCapture Antalet kanaler för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_SampleRateForCapture Exempelfrekvensen (i Hz) för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_BitsPerSampleForCapture Antalet bitar av varje exempel för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_AudioSource Ljudkällan. Tillåtna värden är "Mikrofoner", "Fil" och "Stream". Har lagts till i version 1.3.0.
AudioConfig_DeviceNameForRender Enhetsnamnet för ljudåtergivning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromSpeakerOutput. Har lagts till i version 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Uppspelningsbuffertlängd i millisekunder, standardvärdet är 50 millisekunder.
AudioConfig_AudioProcessingOptions Alternativ för ljudbearbetning i JSON-format.
Speech_LogFilename Filnamnet för att skriva loggar. Har lagts till i version 1.4.0.
Speech_SegmentationSilenceTimeoutMs En varaktighet för upptäckt tystnad, mätt i millisekunder, varefter tal till text avgör att en talad fras har avslutats och genererar ett slutligt identifierat resultat. Att konfigurera den här tidsgränsen kan vara användbart i situationer där talade indata är betydligt snabbare eller långsammare än vanligt och standardsegmenteringsbeteendet ger konsekvent resultat som är för långa eller för korta. Timeoutvärden för segmentering som är olämpligt höga eller låga kan påverka tal-till-text-noggrannhet negativt. Den här egenskapen bör konfigureras noggrant och det resulterande beteendet bör verifieras noggrant som avsett.
Speech_SegmentationMaximumTimeMs Den maximala längden på en talad fras när du använder segmenteringsstrategin "Tid". När längden på en talad fras närmar sig det här värdet börjar Speech_SegmentationSilenceTimeoutMs minskas tills tidsgränsen för frasens tystnad nås eller så når frasen maximal längd.
Speech_SegmentationStrategy Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".
Conversation_ApplicationId Identifierare som används för att ansluta till serverdelstjänsten. Har lagts till i version 1.5.0.
Conversation_DialogType Typ av dialogruta som du vill ansluta till. Har lagts till i version 1.7.0.
Conversation_Initial_Silence_Timeout Tidsgränsen för att lyssna har lagts till i version 1.5.0.
Conversation_From_Id Från id som ska användas för taligenkänningsaktiviteter som lagts till i version 1.5.0.
Conversation_Conversation_Id ConversationId för sessionen. Har lagts till i version 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Kommaavgränsad lista över anpassade röstdistributions-ID:er. Har lagts till i version 1.8.0.
Conversation_Speech_Activity_Template Mall för talaktivitet, stämpelegenskaper i mallen för aktiviteten som genereras av tjänsten för tal. Har lagts till i version 1.10.0.
Conversation_ParticipantId Din deltagaridentifierare i den aktuella konversationen. Har lagts till i version 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp Tidsstämpeln som är associerad med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Tidsstämpeln är ett 64-bitarsvärde med en upplösning på 90 kHz. Det är samma som tidsstämpeln för presentationen i en MPEG-transportström. Se https://en.wikipedia.org/wiki/Presentation_timestamp har lagts till i version 1.5.0.
DataBuffer_UserId Användar-ID:t som är associerat med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Har lagts till i version 1.5.0.
PronunciationAssessment_ReferenceText Referenstexten för ljudet för uttalsutvärdering. För detta och följande uttalsutvärderingsparametrar, se tabellen parametrar för uttalsutvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create or PronunciationAssessmentConfig::SetReferenceText. Har lagts till i version 1.14.0.
PronunciationAssessment_GradingSystem Punktsystemet för uttalspoängkalibrering (FivePoint eller HundredMark). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_Granularity Uttalsutvärderingskornigheten (Phoneme, Word eller FullText). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_EnableMiscue Definierar om du aktiverar felberäkning. När detta är aktiverat jämförs de uttalade orden med referenstexten och markeras med utelämnande/infogning baserat på jämförelsen. Standardinställningen är False. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_PhonemeAlphabet Uttalsutvärderingens fonetikalfabet. Giltiga värden är "SAPI" (standard) och "IPA" Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetPhonemeAlphabet. Har lagts till i version 1.20.0.
PronunciationAssessment_NBestPhonemeCount Uttalsutvärderingen nbest phoneme count. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetNBestPhonemeCount. Har lagts till i version 1.20.0.
PronunciationAssessment_EnableProsodyAssessment Om du vill aktivera prosody-utvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::EnableProsodyAssessment. Har lagts till i version 1.33.0.
PronunciationAssessment_Json Json-strängen med uttalsbedömningsparametrar Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_Params Uttalsutvärderingsparametrar. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. Har lagts till i version 1.14.0.
PronunciationAssessment_ContentTopic Innehållsavsnittet för uttalsutvärderingen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::EnableContentAssessmentWithTopic. Har lagts till i version 1.33.0.
SpeakerRecognition_Api_Version Serverdels-API-version för talarigenkänning. Den här egenskapen läggs till för att tillåta testning och användning av tidigare versioner av API:er för talarigenkänning, i förekommande fall. Har lagts till i version 1.18.0.
SpeechTranslation_ModelName Namnet på en modell som ska användas för talöversättning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
SpeechTranslation_ModelKey Den här egenskapen är inaktuell.
KeywordRecognition_ModelName Namnet på en modell som ska användas för nyckelordsigenkänning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
KeywordRecognition_ModelKey Den här egenskapen är inaktuell.
EmbeddedSpeech_EnablePerformanceMetrics Aktivera samlingen av inbäddade talprestandamått som kan användas för att utvärdera en enhets förmåga att använda inbäddat tal. Insamlade data ingår i resultat från specifika scenarier som taligenkänning. Standardinställningen är "false". Observera att mått kanske inte är tillgängliga från alla inbäddade talscenarier.
SpeechSynthesisRequest_Pitch Tonhöjden i det syntetiserade talet.
SpeechSynthesisRequest_Rate Frekvensen för det syntetiserade talet.
SpeechSynthesisRequest_Volume Volymen för det syntetiserade talet.

Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0.

uppräkningsformat

Värden Beskrivningar
Enkel
Detaljerad

Utdataformat.

enum ProfanityOption

Värden Beskrivningar
Maskerade Ersätter bokstäver med olämpliga ord med stjärntecken.
Avlägsnad Tar bort olämpliga ord.
Gör inget med olämpliga ord.

Tar bort svordomar (svordomar) eller ersätter bokstäver med profana ord med stjärnor. Har lagts till i version 1.5.0.

enum ResultReason

Värden Beskrivningar
NoMatch Anger att tal inte kunde identifieras. Mer information finns i nomatchdetails-objektet.
Annullerad Anger att igenkänningen avbröts. Mer information finns med hjälp av objektet CancellationDetails.
RecognizingSpeech Anger att talresultatet innehåller hypotestext.
RecognizedSpeech Anger att talresultatet innehåller slutlig text som har identifierats. Taligenkänningen är nu klar för den här frasen.
Känna igenIntent Anger att avsiktsresultatet innehåller hypotestext och avsikt.
RecognizedIntent Anger att avsiktsresultatet innehåller slutlig text och avsikt. Taligenkänning och avsiktsbestämning är nu slutförda för den här frasen.
ÖversättningSpeech Anger att översättningsresultatet innehåller hypotestext och dess översättningar.
TranslatedSpeech Anger att översättningsresultatet innehåller slutlig text och motsvarande översättningar. Taligenkänning och översättning är nu klara för den här frasen.
SyntetiseraAudio Anger att det syntetiserade ljudresultatet innehåller en mängd ljuddata som inte är noll.
SynthesizingAudioCompleted Anger att det syntetiserade ljudet nu är klart för den här frasen.
RecognizingKeyword Anger att talresultatet innehåller (overifierad) nyckelordstext. Har lagts till i version 1.3.0.
RecognizedKeyword Anger att nyckelordsigenkänningen har slutförts och att det angivna nyckelordet identifieras. Har lagts till i version 1.3.0.
SynthesizingAudioStarted Anger att talsyntesen nu har startats Tillagd i version 1.4.0.
ÖversättningParticipantSpeech Anger att transkriptionsresultatet innehåller hypotestext och dess översättningar för andra deltagare i konversationen. Har lagts till i version 1.8.0.
TranslatedParticipantSpeech Anger att transkriptionsresultatet innehåller slutlig text och motsvarande översättningar för andra deltagare i konversationen. Taligenkänning och översättning är nu klara för den här frasen. Har lagts till i version 1.8.0.
TranslatedInstantMessage Anger att transkriptionsresultatet innehåller snabbmeddelandet och motsvarande översättningar. Har lagts till i version 1.8.0.
TranslatedParticipantInstantMessage Anger att transkriptionsresultatet innehåller snabbmeddelandet för andra deltagare i konversationen och motsvarande översättningar. Har lagts till i version 1.8.0.
RegistreraVoiceProfile Anger att röstprofilen registreras och att kunderna behöver skicka mer ljud för att skapa en röstprofil. Har lagts till i version 1.12.0.
EnrolledVoiceProfile Röstprofilen har registrerats. Har lagts till i version 1.12.0.
RecognizedSpeakers Anger lyckad identifiering av vissa talare. Har lagts till i version 1.12.0.
RecognizedSpeaker Anger att en talare har verifierats. Har lagts till i version 1.12.0.
ResetVoiceProfile Anger att en röstprofil har återställts. Har lagts till i version 1.12.0.
DeletedVoiceProfile Anger att en röstprofil har tagits bort. Har lagts till i version 1.12.0.
VoicesListRetrieved Anger att röstlistan har hämtats. Har lagts till i version 1.16.0.

Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.

uppräkning AnnulleringReason

Värden Beskrivningar
Fel Anger att ett fel uppstod under taligenkänningen.
EndOfStream Anger att slutet på ljudströmmen har nåtts.
CancelledByUser Anger att begäran avbröts av användaren. Har lagts till i version 1.14.0.

Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.

uppräkning CancellationErrorCode

Värden Beskrivningar
NoError Inget fel. Om CancellationReason är EndOfStream är CancellationErrorCode inställt på NoError.
AuthenticationFailure Anger ett autentiseringsfel. Ett autentiseringsfel uppstår om prenumerationsnyckeln eller auktoriseringstoken är ogiltig, har upphört att gälla eller inte matchar den region som används.
BadRequest Anger att en eller flera igenkänningsparametrar är ogiltiga eller att ljudformatet inte stöds.
TooManyRequests Anger att antalet parallella begäranden överskred antalet tillåtna samtidiga transkriptioner för prenumerationen.
Förbjuden Anger att den kostnadsfria prenumeration som används av begäran tog slut på kvoten.
ConnectionFailure Anger ett anslutningsfel.
ServiceTimeout Anger ett timeout-fel vid väntan på svar från tjänsten.
ServiceError Anger att ett fel returneras av tjänsten.
ServiceUnavailable Anger att tjänsten för närvarande inte är tillgänglig.
RuntimeError Anger ett oväntat körningsfel.
ServiceRedirectTemporary Anger att Speech Service tillfälligt begär en återanslutning till en annan slutpunkt.
ServiceRedirectPermanent Anger att Speech Service permanent begär en återanslutning till en annan slutpunkt.
EmbeddedModelError Anger att modellen för inbäddat tal (SR eller TTS) inte är tillgänglig eller skadad.

Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.

uppräkning NoMatchReason

Värden Beskrivningar
NotRecognized Anger att tal identifierades, men inte kändes igen.
InitialSilenceTimeout Anger att starten av ljudströmmen endast innehöll tystnad och att tjänstens tidsgräns överst i väntan på tal.
InitialBabbleTimeout Anger att starten av ljudströmmen endast innehöll brus, och att tjänstens tidsgräns överst i väntan på tal.
KeywordNotRecognized Anger att det upptäckta nyckelordet har avvisats av nyckelordsverifieringstjänsten. Har lagts till i version 1.5.0.
EndSilenceTimeout Anger att ljudströmmen endast innehöll tystnad efter den senast identifierade frasen.

Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.

enum ActivityJSONType

Värden Beskrivningar
Noll
Objekt
Samling
Sträng
Dubbel
UInt
Int
Boolesk

Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.

enum SpeechSynthesisOutputFormat

Värden Beskrivningar
Raw8Khz8BitMonoMULaw raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet.
Audio16Khz16KbpsMonoSiren audio-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet.
Audio16Khz32KBitRateMonoMp3 audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48khz-16bit-mono-opus Tillagd i version 1.16.0
Webm16Khz16BitMonoOpus webm-16khz-16bit-mono-opus har lagts till i version 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus Har lagts till i version 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24khz-16bit-mono-truesilk Tillagd i version 1.17.0
Raw8Khz8BitMonoALaw raw-8khz-8bit-mono-alaw Tillagd i version 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw tillagd i version 1.17.0
Webm24Khz16Bit24KbpsMonoOpus webm-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec i en WebM-container, med bithastighet på 24 kbit/s, optimerat för IoT-scenario. (Lades till i 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus audio-16khz-16bit-32kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 32kbps. (Lades till i 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus audio-24khz-16bit-48kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 48kbps. (Lades till i 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus audio-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 24kbps. (Lades till i 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Raw PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Raw PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0)
AmrWb16000Hz amr-wb-16000hz AMR-WB ljud vid 16kHz samplingshastighet. (Lades till i 1.24.0)
G72216Khz64Kbps g722-16khz-64kbps G.722 ljud vid 16kHz samplingshastighet och 64kbps bithastighet. (Lades till i 1.38.0)

Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.

enum StreamStatus

Värden Beskrivningar
Okänd Statusen för ljuddataströmmen är okänd.
NoData Ljuddataströmmen innehåller inga data.
PartialData Ljuddataströmmen innehåller partiella data från en talarbegäran.
AllData Ljuddataströmmen innehåller alla data i en talarbegäran.
Annullerad Ljuddataströmmen avbröts.

Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.

enum ServicePropertyChannel

Värden Beskrivningar
UriQueryParameter Använder URI-frågeparameter för att skicka egenskapsinställningar till tjänsten.
HttpHeader Använder HttpHeader för att ange en nyckel/ett värde i ett HTTP-huvud.

Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.

enum VoiceProfileType

Värden Beskrivningar
TextIndependentIdentification Textoberoende talaridentifiering.
TextDependentVerification Textberoende talarverifiering.
TextIndependentVerification Oberoende textverifiering.

Definierar röstprofiltyper.

enum RecognitionFactorScope

Värden Beskrivningar
PartialPhrase En igenkänningsfaktor gäller för grammatiker som kan refereras till som enskilda partiella fraser.

Definierar omfånget som en igenkänningsfaktor tillämpas på.

enum PronunciationAssessmentGradingSystem

Värden Beskrivningar
FivePoint Fempunktskalibrering.
Hundrastämplar Hundra mark.

Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.

enum PronunciationAssessmentGranularity

Värden Beskrivningar
Fonem Visar poängen för den fullständiga text-, ord- och fonemnivån.
Ord Visar poängen på den fullständiga text- och ordnivån.
FullText Visar endast poängen på den fullständiga textnivån.

Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0.

enum SynthesisVoiceType

Värden Beskrivningar
OnlineNeural Neural röst online.
OnlineStandard Standardröst online.
OfflineNeural Neural röst offline.
OfflineStandard Standardröst offline.

Definierar typen av syntesröster som lagts till i version 1.16.0.

uppräkning SynthesisVoiceGender

Värden Beskrivningar
Okänd Kön okänt.
Kvinnlig Kvinnlig röst.
Manlig Mansröst.

Definierar könet för syntesröster som lagts till i version 1.17.0.

uppräkning SpeechSynthesisBoundaryType

Värden Beskrivningar
Ord Ordgräns.
Interpunktion Skiljeteckengräns.
Mening Meningsgräns.

Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.

enum SegmentationStrategy

Värden Beskrivningar
Standard Använd standardstrategin och inställningarna som bestäms av Speech Service. Används i de flesta situationer.
Tid Använder en tidsbaserad strategi där mängden tystnad mellan tal används för att avgöra när ett slutligt resultat ska genereras.
Semantisk Använder en AI-modell för att avskräcka från slutet av en talad fras baserat på frasens innehåll.

Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".