Dela via


Namnområde Microsoft::CognitiveServices::Speech

Sammanfattning

Medlemmar Beskrivningar
enum PropertyId Definierar talegenskaps-ID:t. Ändrades i version 1.4.0.
uppräkning OutputFormat Utdataformat.
enum ProfanityOption Tar bort svordomar (svordomar) eller ersätter bokstäver med olämpliga ord med stjärnor. Har lagts till i version 1.5.0.
enum ResultReason Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.
uppräkning AnnulleringReason Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.
uppräkning CancellationErrorCode Definierar felkod om CancellationReason är Fel. Har lagts till i version 1.1.0.
enum NoMatchReason Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.
enum ActivityJSONType Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.
enum SpeechSynthesisOutputFormat Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.
enum StreamStatus Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.
enum ServicePropertyChannel Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.
enum VoiceProfileType Definierar röstprofiltyper.
enum RecognitionFactorScope Definierar omfånget som en igenkänningsfaktor tillämpas på.
enum PronunciationAssessmentGradingSystem Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.
enum PronunciationAssessmentGranularity Definierar uttalsutvärderingens kornighet. standardvärdet är Phoneme. Har lagts till i version 1.14.0.
enum SynthesisVoiceType Definierar typen av syntesröster som har lagts till i version 1.16.0.
enum SynthesisVoiceGender Definierar könet för syntesröster som lagts till i version 1.17.0.
enum SpeechSynthesisBoundaryType Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.
klass AsyncRecognizer AsyncRecognizer abstrakt basklass.
klass AudioDataStream Representerar ljuddataström som används för att använda ljuddata som en ström. Har lagts till i version 1.4.0.
class AutoDetectSourceLanguageConfig Klass som definierar automatisk identifieringskällans konfiguration Uppdaterad i 1.13.0.
class AutoDetectSourceLanguageResult Innehåller automatiskt identifierat källspråkresultat som lagts till i 1.8.0.
class BaseAsyncRecognizer BaseAsyncRecognizer-klass.
class CancellationDetails Innehåller detaljerad information om varför ett resultat avbröts.
class ClassLanguageModel Representerar en lista över grammatik för dynamiska grammatikscenarier. Har lagts till i version 1.7.0.
class Connection Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en recognizer autonom anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar i anslutningsstatusen. Det är valfritt att använda Anslutning. Den är avsedd för scenarier där finjustering av programmets beteende baserat på anslutningsstatus behövs. Användare kan också anropa Open() för att manuellt initiera en tjänstanslutning innan de påbörjar igenkänning på den identifierare som är associerad med den här anslutningen. När du har startat en igenkänning kan det hända att det inte går att anropa Open() eller Close(). Detta påverkar inte identifieraren eller den pågående igenkänningen. Anslutningen kan ta bort av olika anledningar. Identifieraren försöker alltid att återupprätta anslutningen efter behov för att garantera pågående åtgärder. I alla dessa fall anger anslutna/frånkopplade händelser ändringen av anslutningsstatusen. Uppdaterad i version 1.17.0.
klass ConnectionEventArgs Innehåller data för ConnectionEvent. Har lagts till i version 1.2.0.
class ConnectionMessage ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Speech Service kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.10.0.
class ConnectionMessageEventArgs Innehåller data för ConnectionMessageEvent.
class EmbeddedSpeechConfig Klass som definierar inbäddad (offline) talkonfiguration.
klass EventArgs Basklass för händelseargument.
klass EventSignal Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser.
klass EventSignalBase Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser.
klass grammatik Representerar basklass grammatik för anpassning av taligenkänning. Har lagts till i version 1.5.0.
klass GrammarList Representerar en lista över grammatik för dynamiska grammatikscenarier. Har lagts till i version 1.7.0.
klass GrammarPhrase Representerar en fras som kan talas av användaren. Har lagts till i version 1.5.0.
klass HybridSpeechConfig Klass som definierar hybridkonfigurationer (moln och inbäddade) för taligenkänning eller talsyntes.
class KeywordRecognitionEventArgs Klass för de händelser som genereras av KeywordRecognizer.
class KeywordRecognitionModel Representerar nyckelordsigenkänningsmodellen som används med StartKeywordRecognitionAsync-metoder.
class KeywordRecognitionResult Klass som definierar de resultat som genereras av KeywordRecognizer.
class KeywordRecognizer Typ av identifierare som är specialiserad på att endast hantera nyckelordsaktivering.
klass NoMatchDetails Innehåller detaljerad information för NoMatch-igenkänningsresultat.
klass PhraseListGrammar Representerar en fraslista för dynamiska grammatikscenarier. Har lagts till i version 1.5.0.
class PronunciationAssessmentConfig Klass som definierar uttalsutvärderingskonfiguration tillagd i 1.14.0.
class PronunciationAssessmentResult Klass för uttalsutvärderingsresultat.
class PronunciationContentAssessmentResult Klass för resultat av innehållsutvärdering.
klass PropertyCollection Klass för att hämta eller ange ett egenskapsvärde från en egenskapssamling.
class RecognitionEventArgs Innehåller data för RecognitionEvent.
class RecognitionResult Innehåller detaljerad information om resultatet av en igenkänningsåtgärd.
klassigenkänning Känna igen basklass.
klass SessionEventArgs Basklass för sessionshändelseargument.
klass SmartHandle Smart referensklass.
klass SourceLanguageConfig Klass som definierar källspråkskonfiguration, tillagd i 1.8.0.
klass SourceLanguageRecognizer Klass för källspråkskännare. Du kan använda den här klassen för fristående språkidentifiering. Har lagts till i version 1.17.0.
klass SpeechConfig Klass som definierar konfigurationer för tal-/avsiktsigenkänning eller talsyntes.
class SpeechRecognitionCanceledEventArgs Klass för avbrutna händelseargument för taligenkänning.
class SpeechRecognitionEventArgs Klass för argument för taligenkänningshändelser.
klass SpeechRecognitionModel Information om taligenkänningsmodellen.
class SpeechRecognitionResult Basklass för taligenkänningsresultat.
klass SpeechRecognizer Klass för taligenkänning.
klass SpeechSynthesisBookmarkEventArgs Klass för talsyntesens argument för bokmärkeshändelser. Har lagts till i version 1.16.0.
klass SpeechSynthesisCancellationDetails Innehåller detaljerad information om varför ett resultat avbröts. Har lagts till i version 1.4.0.
klass SpeechSynthesisEventArgs Klass för talsynteshändelseargument. Har lagts till i version 1.4.0.
klass SpeechSynthesisResult Innehåller information om resultat från text till tal-syntes. Har lagts till i version 1.4.0.
klass SpeechSynthesisVisemeEventArgs Klass för talsyntesens viseme-händelseargument. Har lagts till i version 1.16.0.
klass SpeechSynthesisWordBoundaryEventArgs Klass för talsyntesens ordgränshändelseargument. Har lagts till i version 1.7.0.
klass SpeechSynthesizer Klass för talsyntes. Uppdaterad i version 1.14.0.
klass SpeechTranslationModel Information om talöversättningsmodell.
klass SynthesisVoicesResult Innehåller information om resultatet från röstlistan med talsynteser. Har lagts till i version 1.16.0.
klass VoiceInfo Innehåller information om syntesröstinformation uppdaterad i version 1.17.0.

Medlemmar

enum PropertyId

Värden Beskrivningar
SpeechServiceConnection_Key Prenumerationsnyckeln för Cognitive Services Speech Service. Om du använder en avsiktsigenkänning måste du ange LUIS-slutpunktsnyckeln för din specifika LUIS-app. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint Slutpunkten för Cognitive Services Speech Service (URL). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromEndpoint. Obs! Den här slutpunkten är inte samma som slutpunkten som används för att hämta en åtkomsttoken.
SpeechServiceConnection_Region Cognitive Services Speech Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token Cognitive Services Speech Service-auktoriseringstoken (även kallat åtkomsttoken). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type Cognitive Services Speech Service-auktoriseringstyp. Används för närvarande inte.
SpeechServiceConnection_EndpointId Slutpunkts-ID för Cognitive Services Custom Speech eller Custom Voice Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetEndpointId. Obs! Slutpunkts-ID:t är tillgängligt i Custom Speech Portal, som visas under Slutpunktsinformation.
SpeechServiceConnection_Host Cognitive Services Speech Service-värden (URL). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName Värdnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyPort Porten för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyUserName Användarnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyPassword Lösenordet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_Url URL-strängen som skapats från talkonfigurationen. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. Obs! Tillagd i version 1.5.0.
SpeechServiceConnection_TranslationToLanguages Listan över kommaavgränsade språk som används som målöversättningsspråk. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::AddTargetLanguage och SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice Namnet på cognitive service-texten till taltjänstens röst. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::SetVoiceName. Obs! Giltiga röstnamn finns här.
SpeechServiceConnection_TranslationFeatures Översättningsfunktioner. För internt bruk.
SpeechServiceConnection_IntentRegion Regionen Language Understanding Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode Igenkänningsläget för Cognitive Services Speech Service. Kan vara "INTERACTIVE", "CONVERSATION", "DICTATION". Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt.
SpeechServiceConnection_RecoLanguage Det talade språket som ska kännas igen (i BCP-47-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId Sessions-ID: t. Det här ID:t är en universellt unik identifierare (även kallad UUID) som representerar en specifik bindning av en ljudindataström och den underliggande taligenkänningsinstansen som den är bunden till. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Frågeparametrarna som tillhandahålls av användarna. De skickas till tjänsten som URL-frågeparametrar. Har lagts till i version 1.5.0.
SpeechServiceConnection_RecoBackend Strängen för att ange den serverdel som ska användas för taligenkänning. tillåtna alternativ är online och offline. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är offlinealternativet endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelName Namnet på modellen som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelKey Dekrypteringsnyckeln för modellen som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelIniFile Sökvägen till ini-filen för modellen som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthLanguage Det talade språket som ska syntetiseras (t.ex. en-US) har lagts till i version 1.4.0.
SpeechServiceConnection_SynthVoice Namnet på TTS-rösten som ska användas för talsyntes Tillagd i version 1.4.0.
SpeechServiceConnection_SynthOutputFormat Strängen för att ange TTS-utdataljudformatet Har lagts till i version 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Anger om du använder komprimerat ljudformat för talsyntesens ljudöverföring. Den här egenskapen påverkar bara när SpeechServiceConnection_SynthOutputFormat har angetts till pcm-format. Om den här egenskapen inte har angetts och GStreamer är tillgänglig använder SDK komprimerat format för syntetiserad ljudöverföring och avkodar den. Du kan ställa in den här egenskapen på "false" för att använda raw pcm-format för överföring på tråd. Har lagts till i version 1.16.0.
SpeechServiceConnection_SynthBackend Strängen som anger TTS-serverdelen. giltiga alternativ är online och offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths för att ställa in syntesserverdelen till offline. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Datafilsökvägarna för offlinesyntesmotorn. endast giltigt när syntesserverdelen är offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthOfflineVoice Namnet på den offline-TTS-röst som ska användas för talsyntes Under normala omständigheter bör du inte använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::SetSpeechSynthesisVoice och EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthModelKey Dekrypteringsnyckeln för rösten som ska användas för talsyntes. Under normala omständigheter bör du inte använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::SetSpeechSynthesisVoice. Har lagts till i version 1.19.0.
SpeechServiceConnection_VoicesListEndpoint Röstlistan för Api-slutpunkten (URL) för Cognitive Services Speech Service-röster. Under normala omständigheter behöver du inte ange den här egenskapen. SDK skapar den baserat på regionen/värden/slutpunkten för SpeechConfig. Har lagts till i version 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs Det initiala tidsgränsvärdet för tystnad (i millisekunder) som används av tjänsten. Har lagts till i version 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs Tidsgränsvärdet för sluttydnad (i millisekunder) som används av tjänsten. Har lagts till i version 1.5.0.
SpeechServiceConnection_EnableAudioLogging Ett booleskt värde som anger om ljudloggning är aktiverat i tjänsten eller inte. Ljud- och innehållsloggar lagras antingen i Microsoft-ägd lagring eller i ditt eget lagringskonto som är länkat till din Cognitive Services-prenumeration (BYOS)-aktiverad Speech-resurs (Bring Your Own Storage). Har lagts till i version 1.5.0.
SpeechServiceConnection_LanguageIdMode ID-läget för taltjänstens anslutningsspråk. Kan vara "AtStart" (standard) eller "Kontinuerlig". Se dokumentet Språkidentifiering . Lade till i 1.25.0.
SpeechServiceConnection_AutoDetectSourceLanguages Källspråken för automatisk identifiering har lagts till i version 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult Resultatet för automatiskt identifiera källspråk har lagts till i version 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse Det begärda utdataformatet för Cognitive Services Speech Service-svar (enkelt eller detaljerat). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse Den begärda svarsnivån för Cognitive Services Speech Service ger ut svordomar. Används för närvarande inte.
SpeechServiceResponse_ProfanityOption Den begärda inställningen för svarssvordomar i Cognitive Services Speech Service. Tillåtna värden är "maskerade", "borttagna" och "råa". Har lagts till i version 1.5.0.
SpeechServiceResponse_PostProcessingOption Ett strängvärde som anger vilket alternativ för efterbearbetning som ska användas av tjänsten. Tillåtna värden är "TrueText". Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Ett booleskt värde som anger om tidsstämplar på ordnivå ska inkluderas i svarsresultatet. Har lagts till i version 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold Antalet gånger ett ord måste vara i partiella resultat för att returneras. Har lagts till i version 1.5.0.
SpeechServiceResponse_OutputFormatOption Ett strängvärde som anger alternativet utdataformat i svarsresultatet. Endast internt bruk. Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestSnr Ett booleskt värde som anger om SNR (signal till brus-förhållande) ska inkluderas i svarsresultatet. Har lagts till i version 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Ett booleskt värde att begära för att stabilisera partiella översättningsresultat genom att utelämna ord i slutet. Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestWordBoundary Ett booleskt värde som anger om WordBoundary-händelser ska begäras. Har lagts till i version 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Ett booleskt värde som anger om skiljetecken ska begäras i WordBoundary Events. Standardvärdet är true. Har lagts till i version 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Ett booleskt värde som anger om meningsgränsen ska begäras i WordBoundary Events. Standardvärdet är false. Har lagts till i version 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio Ett booleskt värde som anger om SDK ska synkronisera händelser för syntesmetadata (t.ex. ordgräns, viseme osv.) till ljuduppspelningen. Detta träder endast i kraft när ljudet spelas upp via SDK: et. Standardvärdet är true. Om värdet är falskt utlöser SDK händelserna när de kommer från tjänsten, vilket kan vara osynkroniserat med ljuduppspelningen. Har lagts till i version 1.31.0.
SpeechServiceResponse_JsonResult Cognitive Services Speech Service-svarsutdata (i JSON-format). Den här egenskapen är endast tillgänglig för igenkänningsresultatobjekt.
SpeechServiceResponse_JsonErrorDetails Felinformation för Cognitive Services Speech Service (i JSON-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs Svarstiden för igenkänning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för tal/översättning/avsikt. Detta mäter svarstiden mellan när en ljudinmatning tas emot av SDK och det ögonblick då slutresultatet tas emot från tjänsten. SDK beräknar tidsskillnaden mellan det sista ljudfragmentet från ljudindata som bidrar till slutresultatet och den tid då slutresultatet tas emot från taltjänsten. Har lagts till i version 1.3.0.
SpeechServiceResponse_RecognitionBackend Igenkänningsserverdelen. Skrivskyddad, tillgänglig för taligenkänningsresultat. Detta anger om molnigenkänning (online) eller inbäddad (offline) användes för att generera resultatet.
SpeechServiceResponse_SynthesisFirstByteLatencyMs Talsyntesen första bytefördröjningen i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och det ögonblick då det första byteljudet är tillgängligt. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs Talsyntesen innehåller alla bytes svarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och när hela ljudet syntetiseras. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs Underkörningstiden för talsyntes i millisekunder. Skrivskyddad, tillgänglig för resultat i SynthesisCompleted-händelser. Detta mäter den totala underkörningstiden från PropertyId::AudioConfig_PlaybackBufferLengthInMs fylls i för att syntesen ska slutföras. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs Svarstid för talsyntesanslutning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och när HTTP/WebSocket-anslutningen upprättas. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs Svarstiden för talsyntesnätverket i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter nätverkets tur och retur-tid. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs Svarstiden för talsyntestjänsten i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter bearbetningstiden för tjänsten för att syntetisera den första byte av ljud. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisBackend Anger vilken serverdel som syntesen är klar med. Skrivskyddad, tillgänglig för talsyntesresultat, förutom resultatet i SynthesisStarted-händelsen Som lagts till i version 1.17.0.
CancellationDetails_Reason Avbokningsorsaken. Används för närvarande inte.
CancellationDetails_ReasonText Annulleringstexten. Används för närvarande inte.
CancellationDetails_ReasonDetailedText Den detaljerade texten om annulleringen. Används för närvarande inte.
LanguageUnderstandingServiceResponse_JsonResult Language Understanding Service-svarsutdata (i JSON-format). Tillgängligt via IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture Enhetsnamnet för ljudinspelning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromMicrophoneInput. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_NumberOfChannelsForCapture Antalet kanaler för ljudinspelning. Endast internt bruk. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_SampleRateForCapture Exempelfrekvensen (i Hz) för ljudinspelning. Endast internt bruk. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_BitsPerSampleForCapture Antalet bitar av varje exempel för ljudinspelning. Endast internt bruk. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_AudioSource Ljudkällan. Tillåtna värden är "Mikrofoner", "Fil" och "Stream". Har lagts till i version 1.3.0.
AudioConfig_DeviceNameForRender Enhetsnamnet för ljudåtergivning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromSpeakerOutput. Har lagts till i version 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Uppspelningsbuffertens längd i millisekunder är standardvärdet 50 millisekunder.
AudioConfig_AudioProcessingOptions Alternativ för ljudbearbetning i JSON-format.
Speech_LogFilename Filnamnet för att skriva loggar. Har lagts till i version 1.4.0.
Speech_SegmentationSilenceTimeoutMs En varaktighet för identifierad tystnad, mätt i millisekunder, varefter tal till text avgör att en talad fras har avslutats och genererar ett slutligt identifierat resultat. Att konfigurera den här tidsgränsen kan vara användbart i situationer där talade indata är betydligt snabbare eller långsammare än vanligt och standardsegmenteringsbeteendet ger konsekvent resultat som är för långa eller för korta. Timeoutvärden för segmentering som är olämpligt höga eller låga kan påverka tal-till-text-noggrannheten negativt. Den här egenskapen bör konfigureras noggrant och det resulterande beteendet bör verifieras noggrant som avsett.
Conversation_ApplicationId Identifierare som används för att ansluta till serverdelstjänsten. Har lagts till i version 1.5.0.
Conversation_DialogType Typ av dialogserverdel att ansluta till. Har lagts till i version 1.7.0.
Conversation_Initial_Silence_Timeout Tidsgränsen för tystnad har lagts till i version 1.5.0.
Conversation_From_Id Från ID som ska användas för taligenkänningsaktiviteter Tillagt i version 1.5.0.
Conversation_Conversation_Id ConversationId för sessionen. Har lagts till i version 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Kommaavgränsad lista över anpassade röstdistributions-ID:t. Har lagts till i version 1.8.0.
Conversation_Speech_Activity_Template Mall för talaktivitet, stämpelegenskaper i mallen för aktiviteten som genereras av tjänsten för tal. Har lagts till i version 1.10.0.
Conversation_ParticipantId Din deltagaridentifierare i den aktuella konversationen. Har lagts till i version 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp Tidsstämpeln som är associerad med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Tidsstämpeln är ett 64-bitarsvärde med en upplösning på 90 kHz. Det är samma som tidsstämpeln för presentationen i en MPEG-transportström. Se https://en.wikipedia.org/wiki/Presentation_timestamp Tillagd i version 1.5.0.
DataBuffer_UserId Användar-ID:t som är associerat med databufferten som skrivs av klienten när du använder indataströmmar för Pull/Push-ljud. Har lagts till i version 1.5.0.
PronunciationAssessment_ReferenceText Referenstexten för ljudet för uttalsutvärdering. För detta och följande uttalsutvärderingsparametrar, se tabellen Utvärderingsparametrar för uttal. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create or PronunciationAssessmentConfig::SetReferenceText. Har lagts till i version 1.14.0.
PronunciationAssessment_GradingSystem Punktsystemet för uttalspoängkalibrering (FivePoint eller HundredMark). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_Granularity Uttalsutvärderingens kornighet (Phoneme, Word eller FullText). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_EnableMiscue Definierar om felberäkning ska aktiveras. När detta är aktiverat jämförs de uttalade orden med referenstexten och markeras med utelämnande/infogande baserat på jämförelsen. Standardinställningen är False. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_PhonemeAlphabet Uttalsutvärderingens fonetikalbet. Giltiga värden är "SAPI" (standard) och "IPA" Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetPhonemeAlphabet. Har lagts till i version 1.20.0.
PronunciationAssessment_NBestPhonemeCount Uttalsutvärderingen nbest phoneme count. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetNBestPhonemeCount. Har lagts till i version 1.20.0.
PronunciationAssessment_EnableProsodyAssessment Om du vill aktivera prosody-utvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::EnableProsodyAssessment. Har lagts till i version 1.33.0.
PronunciationAssessment_Json Json-strängen för uttalsutvärderingsparametrar Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_Params Utvärderingsparametrar för uttal. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. Har lagts till i version 1.14.0.
PronunciationAssessment_ContentTopic Innehållsavsnittet för uttalsutvärderingen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::EnableContentAssessmentWithTopic. Har lagts till i version 1.33.0.
SpeakerRecognition_Api_Version Serverdels-API-versionen för talarigenkänning. Den här egenskapen läggs till för att tillåta testning och användning av tidigare versioner av API:er för talarigenkänning, i förekommande fall. Har lagts till i version 1.18.0.
SpeechTranslation_ModelName Namnet på en modell som ska användas för talöversättning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
SpeechTranslation_ModelKey Dekrypteringsnyckeln för en modell som ska användas för talöversättning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
KeywordRecognition_ModelName Namnet på en modell som ska användas för nyckelordsigenkänning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
KeywordRecognition_ModelKey Dekrypteringsnyckeln för en modell som ska användas för nyckelordsigenkänning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
EmbeddedSpeech_EnablePerformanceMetrics Aktivera insamling av inbäddade talprestandamått som kan användas för att utvärdera en enhets förmåga att använda inbäddat tal. Insamlade data ingår i resultat från specifika scenarier som taligenkänning. Standardinställningen är "false". Observera att mått kanske inte är tillgängliga från alla inbäddade talscenarier.

Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0.

enum OutputFormat

Värden Beskrivningar
Enkla
Detaljerad

Utdataformat.

enum ProfanityOption

Värden Beskrivningar
Maskerade Ersätter bokstäver med olämpliga ord med star tecken.
Borttaget Tar bort olämpliga ord.
Rådata Gör inget för att svordomar.

Tar bort svordomar (svordomar) eller ersätter bokstäver med olämpliga ord med stjärnor. Har lagts till i version 1.5.0.

enum ResultReason

Värden Beskrivningar
NoMatch Anger att tal inte kunde identifieras. Mer information finns i nomatchdetails-objektet.
Avbrutna Anger att igenkänningen avbröts. Mer information finns med objektet CancellationDetails.
RecognizingSpeech Anger att talresultatet innehåller hypotestext.
RecognizedSpeech Anger att talresultatet innehåller slutlig text som har identifierats. Taligenkänningen är nu klar för den här frasen.
Känna igenIntent Anger att avsiktsresultatet innehåller hypotestext och avsikt.
RecognizedIntent Anger att avsiktsresultatet innehåller slutgiltig text och avsikt. Taligenkänning och avsiktsbestämning är nu slutförda för den här frasen.
ÖversättningSpeech Anger att översättningsresultatet innehåller hypotestext och dess översättningar.
TranslatedSpeech Anger att översättningsresultatet innehåller slutlig text och motsvarande översättningar. Taligenkänning och översättning är nu slutförda för den här frasen.
SynthesizingAudio Anger att det syntetiserade ljudresultatet innehåller en mängd ljuddata som inte är noll.
SynthesizingAudioCompleted Anger att det syntetiserade ljudet nu är klart för den här frasen.
RecognizingKeyword Anger att talresultatet innehåller (overifierad) nyckelordstext. Har lagts till i version 1.3.0.
RecognizedKeyword Anger att nyckelordsigenkänningen har slutförts med att identifiera det angivna nyckelordet. Har lagts till i version 1.3.0.
SynthesizingAudioStarted Anger att talsyntesen nu har startats Tillagd i version 1.4.0.
ÖversättningParticipantSpeech Anger att transkriptionsresultatet innehåller hypotestext och dess översättningar för andra deltagare i konversationen. Har lagts till i version 1.8.0.
TranslatedParticipantSpeech Anger att transkriptionsresultatet innehåller slutlig text och motsvarande översättningar för andra deltagare i konversationen. Taligenkänning och översättning är nu slutförda för den här frasen. Har lagts till i version 1.8.0.
TranslatedInstantMessage Anger att transkriptionsresultatet innehåller snabbmeddelandet och motsvarande översättningar. Har lagts till i version 1.8.0.
TranslatedParticipantInstantMessage Anger att transkriptionsresultatet innehåller snabbmeddelandet för andra deltagare i konversationen och motsvarande översättningar. Har lagts till i version 1.8.0.
RegistreraVoiceProfile Anger att röstprofilen håller på att registreras och att kunderna behöver skicka mer ljud för att skapa en röstprofil. Har lagts till i version 1.12.0.
EnrolledVoiceProfile Röstprofilen har registrerats. Har lagts till i version 1.12.0.
RecognizedSpeakers Anger lyckad identifiering av vissa talare. Har lagts till i version 1.12.0.
RecognizedSpeaker Anger att en talare har verifierats. Har lagts till i version 1.12.0.
ResetVoiceProfile Anger att en röstprofil har återställts. Har lagts till i version 1.12.0.
DeletedVoiceProfile Anger att en röstprofil har tagits bort. Har lagts till i version 1.12.0.
VoicesListRetrieved Anger att röstlistan har hämtats. Har lagts till i version 1.16.0.

Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.

enum CancellationReason

Värden Beskrivningar
Fel Anger att ett fel uppstod under taligenkänningen.
EndOfStream Anger att slutet på ljudströmmen har nåtts.
CancelledByUser Anger att begäran avbröts av användaren. Har lagts till i version 1.14.0.

Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.

uppräkning CancellationErrorCode

Värden Beskrivningar
NoError Inget fel. Om CancellationReason är EndOfStream är CancellationErrorCode inställt på NoError.
AuthenticationFailure Anger ett autentiseringsfel. Ett autentiseringsfel uppstår om prenumerationsnyckeln eller auktoriseringstoken är ogiltig, har upphört att gälla eller inte matchar den region som används.
BadRequest Anger att en eller flera igenkänningsparametrar är ogiltiga eller att ljudformatet inte stöds.
TooManyRequests Anger att antalet parallella begäranden överskred antalet tillåtna samtidiga transkriptioner för prenumerationen.
Förbjudet Anger att den kostnadsfria prenumerationen som används av begäran fick slut på kvot.
ConnectionFailure Anger ett anslutningsfel.
ServiceTimeout Anger ett timeout-fel vid väntan på svar från tjänsten.
ServiceError Anger att ett fel returneras av tjänsten.
ServiceUnavailable Anger att tjänsten inte är tillgänglig för tillfället.
RuntimeError Anger ett oväntat körningsfel.
ServiceRedirectTemporary Anger att Speech Service tillfälligt begär en återanslutning till en annan slutpunkt.
ServiceRedirectPermanent Anger att Speech Service permanent begär en återanslutning till en annan slutpunkt.
EmbeddedModelError Anger att modellen för inbäddat tal (SR eller TTS) inte är tillgänglig eller skadad.

Definierar felkoden om CancellationReason är Error. Har lagts till i version 1.1.0.

enum NoMatchReason

Värden Beskrivningar
NotRecognized Anger att tal upptäcktes, men inte kändes igen.
InitialSilenceTimeout Anger att starten av ljudströmmen endast innehöll tystnad och att tjänstens tidsgräns överst i väntan på tal.
InitialBabbleTimeout Anger att starten av ljudströmmen endast innehöll brus och att tjänstens tidsgräns överst på grund av tal.
KeywordNotRecognized Anger att det upptäckta nyckelordet har avvisats av nyckelordsverifieringstjänsten. Har lagts till i version 1.5.0.
EndSilenceTimeout Anger att ljudströmmen endast innehöll tystnad efter den senast identifierade frasen.

Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte känns igen.

enum ActivityJSONType

Värden Beskrivningar
Null
Objekt
Matris
Sträng
Double
Uint
Int
Boolesk

Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.

enum SpeechSynthesisOutputFormat

Värden Beskrivningar
Raw8Khz8BitMonoMULaw raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet.
Audio16Khz16KbpsMonoSiren audio-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet.
Audio16Khz32KBitRateMonoMp3 audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48khz-16bit-mono-opus Tillagd i version 1.16.0
Webm16Khz16BitMonoOpus webm-16khz-16bit-mono-opus Tillagd i version 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus Tillagd i version 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24khz-16bit-mono-truesilk Tillagd i version 1.17.0
Raw8Khz8BitMonoALaw raw-8khz-8bit-mono-alaw Tillagd i version 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw Tillagd i version 1.17.0
Webm24Khz16Bit24KbpsMonoOpus webm-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec i en WebM-container, med bithastighet på 24 kbit/s, optimerat för IoT-scenario. (Lades till i 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus audio-16khz-16bit-32kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 32 kbit/s. (Lades till i 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus audio-24khz-16bit-48kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 48kbps. (Lades till i 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus audio-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 24 kbit/s. (Lades till i 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Raw PCM ljud vid 22050Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup, med RIFF-rubrik. (Lades till i 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Raw PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0)
AmrWb16000Hz amr-wb-16000hz AMR-WB ljud vid 16kHz samplingshastighet. (Lades till i 1.24.0)

Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.

enum StreamStatus

Värden Beskrivningar
Okänt Statusen för ljuddataströmmen är okänd.
NoData Ljuddataströmmen innehåller inga data.
PartialData Ljuddataströmmen innehåller partiella data från en talarbegäran.
Alldata Ljuddataströmmen innehåller alla data från en talarbegäran.
Avbrutna Ljuddataströmmen avbröts.

Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.

enum ServicePropertyChannel

Värden Beskrivningar
UriQueryParameter Använder URI-frågeparameter för att skicka egenskapsinställningar till tjänsten.
HttpHeader Använder HttpHeader för att ange en nyckel/ett värde i ett HTTP-huvud.

Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.

enum VoiceProfileType

Värden Beskrivningar
TextIndependentIdentification Textoberoende talaridentifiering.
TextDependentVerification Textberoende talarverifiering.
TextIndependentVerification Textoberoende verifiering.

Definierar röstprofiltyper.

enum RecognitionFactorScope

Värden Beskrivningar
PartialPhrase En igenkänningsfaktor gäller för grammatik som kan refereras till som enskilda partiella fraser.

Definierar omfånget som en igenkänningsfaktor tillämpas på.

enum PronunciationAssessmentGradingSystem

Värden Beskrivningar
FivePoint Kalibrering med fem punkter.
Hundramärke Hundra mark.

Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.

enum PronunciationAssessmentGranularity

Värden Beskrivningar
Fonem Visar poängen på den fullständiga text-, ord- och fonetiknivån.
Word Visar poängen på den fullständiga text- och ordnivån.
Fulltext Visar endast poängen på den fullständiga textnivån.

Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0.

enum SynthesisVoiceType

Värden Beskrivningar
OnlineNeural Neural röst online.
OnlineStandard Standardröst online.
OfflineNeural Neural röst offline.
OfflineStandard Offlinestandardröst.

Definierar typen av syntesröster som lagts till i version 1.16.0.

enum SynthesisVoiceGender

Värden Beskrivningar
Okänt Kön okänt.
Kvinna Kvinnlig röst.
Man Mansröst.

Definierar könet för syntesröster som lagts till i version 1.17.0.

enum SpeechSynthesisBoundaryType

Värden Beskrivningar
Word Word gräns.
Skiljetecken Skiljeteckengräns.
Mening Meningsgräns.

Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.