Sdílet prostřednictvím


Obor názvů Microsoft::CognitiveServices::Speech

Shrnutí

Členové Popisy
id vlastnosti výčtu Definuje ID vlastností řeči. Změněno ve verzi 1.4.0.
výčtu OutputFormat Výstupní formát
výčtu ProfanityOption Odebere vulgární slova (na sobě) nebo nahradí písmena vulgárních slov hvězdičkami. Přidáno ve verzi 1.5.0.
výčtu ResultReason Určuje možné důvody, proč se může vygenerovat výsledek rozpoznávání.
výčtu CancellationReason Definuje možné důvody, proč může být výsledek rozpoznávání zrušen.
výčtu CancellationErrorCode Definuje kód chyby v případě, že CancellationReason je Chyba. Přidáno ve verzi 1.1.0.
výčtu NoMatchReason Definuje možné důvody, proč se výsledek rozpoznávání nemusí rozpoznat.
výčtu activityJSONType Definuje možné typy pro hodnotu JSON aktivity. Přidáno ve verzi 1.5.0.
výčtu SpeechSynthesisOutputFormat Definuje možné formáty zvuku syntézy řeči. Aktualizováno ve verzi 1.19.0.
výčtu StreamStatus Definuje možný stav zvukového datového streamu. Přidáno ve verzi 1.4.0.
výčtu ServicePropertyChannel Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.5.0.
výčtu VoiceProfileType Definuje typy hlasových profilů.
výčtu RecognitionFactorScope Definuje obor, na který se použije faktor rozpoznávání.
výčtu VýslovnostAssessmentGradingSystem Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.14.0.
výslovnostAssessmentGranularity Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.14.0.
výčtu SynthesisVoiceType Definuje typ syntézy hlasů přidaných ve verzi 1.16.0.
výčtu SynthesisVoiceGender Definuje pohlaví syntézy hlasů přidaných ve verzi 1.17.0.
výčtu SpeechSynthesisBoundaryType Definuje typ hranice události syntézy řeči přidané ve verzi 1.21.0.
výčtu SegmentationStrategy Strategie používaná k určení, kdy mluvená fráze skončila, a konečný rozpoznaný výsledek by se měl vygenerovat. Povolené hodnoty jsou Default( Výchozí), Time (Čas) a Sémantic (Sémantické).
třídy AsyncRecognizer AsyncRecognizer abstraktní základní třída.
třída AudioDataStream Představuje datový proud zvuku používaný pro provoz zvukových dat jako datového proudu. Přidáno ve verzi 1.4.0.
třída AutoDetectSourceLanguageConfig Třída, která definuje konfiguraci zdroje automatické detekce aktualizována ve verzi 1.13.0.
třída AutoDetectSourceLanguageResult Obsahuje automaticky rozpoznaný výsledek zdrojového jazyka přidaný ve verzi 1.8.0.
třída BaseAsyncRecognizer BaseAsyncRecognizer – třída.
třída CancellationDetails Obsahuje podrobné informace o tom, proč byl výsledek zrušen.
třída ClassLanguageModel Představuje seznam gramatik pro scénáře dynamické gramatiky. Přidáno ve verzi 1.7.0.
třídy Connection Připojení je třída proxy pro správu připojení ke službě Speech zadaného rozpoznávání. Ve výchozím nastavení služba Recognizer v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití připojení je volitelné. Je určen pro scénáře, kdy je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open() a ručně zahájit připojení služby před spuštěním rozpoznávání v nástroji Recognizer přidruženém k tomuto připojení. Po spuštění rozpoznávání může volání Open() nebo Close() selhat. To nebude mít vliv na rozpoznávání ani na průběžné rozpoznávání. Připojení může dojít k poklesu z různých důvodů, služba Recognizer se vždy pokusí připojení obnovit podle potřeby, aby se zajistily probíhající operace. Ve všech těchto případech události Connected/Disconnected označují změnu stavu připojení. Aktualizováno ve verzi 1.17.0.
třída ConnectionEventArgs Poskytuje data pro ConnectionEvent. Přidáno ve verzi 1.2.0.
třída ConnectionMessage ConnectionMessage představuje implementaci konkrétních zpráv odesílaných a přijatých ze služby Speech. Tyto zprávy jsou k dispozici pro účely ladění a neměly by se používat pro případy použití v produkčním prostředí se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté ze služby Speech se můžou bez předchozího upozornění měnit. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.10.0.
třída ConnectionMessageEventArgs Poskytuje data pro ConnectionMessageEvent.
třída EmbeddedSpeechConfig Třída, která definuje vloženou (offline) konfiguraci řeči.
třídy EventArgs Základní třída pro argumenty události.
třídy EventSignal Klienti se můžou připojit k signálu události pro příjem událostí nebo se odpojit od signálu události, aby přestali přijímat události.
třída EventSignalBase Klienti se můžou připojit k signálu události pro příjem událostí nebo se odpojit od signálu události, aby přestali přijímat události.
třídy Grammar Představuje gramatiku základní třídy pro přizpůsobení rozpoznávání řeči. Přidáno ve verzi 1.5.0.
třída GrammarList Představuje seznam gramatik pro scénáře dynamické gramatiky. Přidáno ve verzi 1.7.0.
třídy GrammarPhrase Představuje frázi, kterou může uživatel vyslovit. Přidáno ve verzi 1.5.0.
třída HybridSpeechConfig Třída, která definuje hybridní (cloudové a vložené) konfigurace pro rozpoznávání řeči nebo syntézu řeči.
třída KeywordRecognitionEventArgs Třída událostí vynechaných KeywordRecognizer.
třída KeywordRecognitionModel Představuje model rozpoznávání klíčových slov používaný s metodami StartKeywordRecognitionAsync.
třída KeywordRecognitionResult Třída, která definuje výsledky generované KeywordRecognizer.
třídy KeywordRecognizer Typ rozpoznávání, který je specializovaný pouze na zpracování aktivace klíčových slov.
třída NoMatchDetails Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch.
třída PersonalVoiceSynthesisRequest Třída, která definuje žádost o syntézu řeči pro osobní hlas (aka.ms/azureai/personal-voice). Tato třída je ve verzi Preview a může se změnit. Přidáno ve verzi 1.39.0.
třída PhraseListGrammar Představuje gramatiku seznamu frází pro scénáře dynamické gramatiky. Přidáno ve verzi 1.5.0.
třída VýslovnostAssessmentConfig Třída, která definuje konfiguraci posouzení výslovnosti Přidaná v 1.14.0.
třída VýslovnostAssessmentResult Třída pro výsledky hodnocení výslovnosti
třída VýslovnostContentAssessmentResult Třída pro výsledky posouzení obsahu
třída PropertyCollection Třída pro načtení nebo nastavení hodnoty vlastnosti z kolekce vlastností.
třídy RecognitionEventArgs Poskytuje data pro RecognitionEvent.
třídy RecognitionResult Obsahuje podrobné informace o výsledku operace rozpoznávání.
rozpoznávání tříd Základní třída služby Recognizer
třída SessionEventArgs Základní třída pro argumenty událostí relace.
třída SmartHandle Třída inteligentního úchytu
třída SourceLanguageConfig Třída, která definuje konfiguraci zdrojového jazyka přidanou do verze 1.8.0.
třída SourceLanguageRecognizer Třída pro rozpoznávání zdrojového jazyka Tuto třídu můžete použít pro detekci samostatného jazyka. Přidáno ve verzi 1.17.0.
třída SpeechConfig Třída, která definuje konfigurace pro rozpoznávání řeči nebo záměru nebo syntézu řeči.
třída SpeechRecognitionCanceledEventArgs Třída pro zrušené argumenty události rozpoznávání řeči
třída SpeechRecognitionEventArgs Třída pro argumenty události rozpoznávání řeči
třída SpeechRecognitionModel Informace o modelu rozpoznávání řeči
třída SpeechRecognitionResult Základní třída pro výsledky rozpoznávání řeči
třídy SpeechRecognizer Třída pro rozpoznávání řeči
třída SpeechSynthesisBookmarkEventArgs Třída pro argumenty události záložky syntézy řeči Přidáno ve verzi 1.16.0.
třída SpeechSynthesisCancellationDetails Obsahuje podrobné informace o tom, proč byl výsledek zrušen. Přidáno ve verzi 1.4.0.
třída SpeechSynthesisEventArgs Třída pro argumenty událostí syntézy řeči Přidáno ve verzi 1.4.0.
třída SpeechSynthesisRequest Třída, která definuje požadavek syntézy řeči. Tato třída je ve verzi Preview a může se změnit. Přidáno ve verzi 1.37.0.
třída SpeechSynthesisResult Obsahuje informace o výsledku syntézy textu na řeč. Přidáno ve verzi 1.4.0.
třída SpeechSynthesisVisemeEventArgs Třída pro argumenty událostí syntézy řeči viseme Přidáno ve verzi 1.16.0.
třída SpeechSynthesisWordBoundaryEventArgs Třída pro argumenty událostí hranice slova syntézy řeči Přidáno ve verzi 1.7.0.
třídy SpeechSynthesizer Třída syntetizátoru řeči Aktualizováno ve verzi 1.14.0.
třída SpeechTranslationModel Informace o modelu překladu řeči
třída SynthesisVoicesResult Obsahuje informace o výsledku ze seznamu hlasových syntetizátorů řeči. Přidáno ve verzi 1.16.0.
třída VoiceInfo Obsahuje informace o syntéze hlasových informací aktualizovány ve verzi 1.17.0.

Členové

enum PropertyId

Hodnoty Popisy
SpeechServiceConnection_Key Klíč předplatného služby Cognitive Services Speech. Pokud používáte rozpoznávání záměru, musíte zadat klíč koncového bodu LUIS pro vaši konkrétní aplikaci LUIS. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint Koncový bod služby Cognitive Services Speech Service (url). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromEndpoint. POZNÁMKA: Tento koncový bod není stejný jako koncový bod použitý k získání přístupového tokenu.
SpeechServiceConnection_Region Oblast služby Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token Autorizační token služby Cognitive Services Speech (neboli přístupový token). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type Typ autorizace služby Cognitive Services Speech. Aktuálně se nepoužívá.
SpeechServiceConnection_EndpointId ID koncového bodu služby Cognitive Services Custom Speech nebo Custom Voice Service. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetEndpointId. POZNÁMKA: ID koncového bodu je k dispozici na portálu Custom Speech, který je uvedený v části Podrobnosti o koncovém bodu.
SpeechServiceConnection_Host Hostitel služby Cognitive Services Speech Service (url). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName Název hostitele proxy serveru sloužícího k připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_ProxyPort Port proxy serveru sloužícího k připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_ProxyUserName Uživatelské jméno proxy serveru použitého pro připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_ProxyPassword Heslo proxy serveru používaného pro připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_Url Řetězec adresy URL vytvořený z konfigurace řeči. Tato vlastnost je určena jen pro čtení. Sada SDK ji interně používá. POZNÁMKA: Přidáno ve verzi 1.5.0.
SpeechServiceConnection_ProxyHostBypass Určuje seznam hostitelů, pro které by se neměly používat proxy servery. Toto nastavení přepíše všechny ostatní konfigurace. Názvy hostitelů jsou odděleny čárkami a odpovídají nerozlišeným způsobem. Zástupné dokumentace nejsou podporovány.
SpeechServiceConnection_TranslationToLanguages Seznam jazyků oddělených čárkami, které se používají jako cílové jazyky překladu Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechTranslationConfig::AddTargetLanguage a SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice Název hlasu služby Cognitive Service Text do služby Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechTranslationConfig::SetVoiceName. POZNÁMKA: Platné hlasové názvy najdete zde.
SpeechServiceConnection_TranslationFeatures Funkce překladu Pro interní použití.
SpeechServiceConnection_IntentRegion Oblast služby Language Understanding Service. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode Režim rozpoznávání služby Speech služby Cognitive Services. Může být INTERAKTIVNÍ, KONVERZACE, DIKTOVÁNÍ. Tato vlastnost je určena jen pro čtení. Sada SDK ji interně používá.
SpeechServiceConnection_RecoLanguage Mluvený jazyk, který se má rozpoznat (ve formátu BCP-47). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId ID relace. Toto ID je univerzální jedinečný identifikátor (neboli UUID), který představuje určitou vazbu zvukového vstupního streamu a základní instanci rozpoznávání řeči, ke které je vázán. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Parametry dotazu poskytované uživateli. Předají se službě jako parametry dotazu adresy URL. Přidáno ve verzi 1.5.0.
SpeechServiceConnection_RecoBackend Řetězec k určení back-endu, který se má použít pro rozpoznávání řeči; povolené možnosti jsou online a offline. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době je offline možnost platná pouze při použití EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_RecoModelName Název modelu, který se má použít pro rozpoznávání řeči. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době platí pouze v případě, že se používá EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_RecoModelKey Tato vlastnost je zastaralá.
SpeechServiceConnection_RecoModelIniFile Cesta k souboru ini modelu, který se má použít pro rozpoznávání řeči. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době platí pouze v případě, že se používá EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthLanguage Mluvený jazyk, který má být syntetizován (např. en-US) přidán ve verzi 1.4.0.
SpeechServiceConnection_SynthVoice Název hlasu TTS, který se má použít pro syntézu řeči přidaný ve verzi 1.4.0.
SpeechServiceConnection_SynthOutputFormat Řetězec pro zadání výstupního zvukového formátu TTS přidaný ve verzi 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Označuje, jestli pro přenos zvuku syntézy řeči používáte komprimovaný zvukový formát. Tato vlastnost má vliv pouze v případě, že je SpeechServiceConnection_SynthOutputFormat nastavena na formát pcm. Pokud tato vlastnost není nastavena a GStreamer je k dispozici, SDK použije komprimovaný formát pro syntetizovaný přenos zvuku a dekóduje ho. Tuto vlastnost můžete nastavit na "false" pro použití nezpracovaného formátu pcm pro přenos na drátě. Přidáno ve verzi 1.16.0.
SpeechServiceConnection_SynthBackend Řetězec určující back-end TTS; platné možnosti jsou online a offline. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte EmbeddedSpeechConfig::FromPath nebo EmbeddedSpeechConfig::FromPaths k nastavení syntézy back-endu do offline režimu. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Cesty k datovým souborům pro modul pro offline syntézu; platí pouze v offline režimu syntézy back-endu. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte EmbeddedSpeechConfig::FromPath nebo EmbeddedSpeechConfig::FromPaths. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthOfflineVoice Název hlasu TTS offline, který se má použít pro syntézu řeči za normálních okolností, neměli byste tuto vlastnost používat přímo. Místo toho použijte EmbeddedSpeechConfig::SetSpeechSynthesisVoice a EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthModelKey Tato vlastnost je zastaralá.
SpeechServiceConnection_VoicesListEndpoint Koncový bod rozhraní API (URL) služby Cognitive Services Speech Service vypíše. Za normálních okolností nemusíte tuto vlastnost zadávat, sada SDK ji sestaví na základě oblasti, hostitele nebo koncového bodu SpeechConfig. Přidáno ve verzi 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs Počáteční hodnota časového limitu ticha (v milisekundách), kterou služba používá. Přidáno ve verzi 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs Hodnota časového limitu koncového ticha (v milisekundách), kterou služba používá. Přidáno ve verzi 1.5.0.
SpeechServiceConnection_EnableAudioLogging Logická hodnota určující, jestli je ve službě povolené protokolování zvuku, nebo ne. Protokoly zvuku a obsahu se ukládají buď v úložišti vlastněné Microsoftem, nebo ve vašem vlastním účtu úložiště propojeném s vaším předplatným služeb Cognitive Services (byOS) s povoleným prostředkem služby Speech (Bring Your Own Storage). Přidáno ve verzi 1.5.0.
SpeechServiceConnection_LanguageIdMode Režim identifikátoru jazyka připojení služby Speech. Může to být "AtStart" (výchozí) nebo "Continuous". Viz dokument identifikace jazyka . Přidáno ve verzi 1.25.0.
SpeechServiceConnection_TranslationCategoryId ID kategorie překladu připojení služby Speech.
SpeechServiceConnection_AutoDetectSourceLanguages Auto detect source languages Added in version 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult Výsledek automatického zjišťování zdrojového jazyka byl přidán ve verzi 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse Požadovaný formát výstupu odpovědi služby Cognitive Services Speech Service (jednoduchý nebo podrobný). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse Požadovaná úroveň odpovědi služby Cognitive Services Speech Service na výstupu vulgárních výrazů. Aktuálně se nepoužívá.
SpeechServiceResponse_ProfanityOption Požadované nastavení vulgárních vulgárních výrazů služby Cognitive Services Speech Service Povolené hodnoty jsou maskované, odebrané a nezpracované. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_PostProcessingOption Řetězcová hodnota určující, kterou možnost následného zpracování má služba používat. Povolené hodnoty jsou TrueText. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Logická hodnota určující, jestli se mají do výsledku odpovědi zahrnout časová razítka na úrovni slova. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold Počet, kolikrát musí být slovo v částečných výsledcích, které se mají vrátit. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_OutputFormatOption Řetězcová hodnota určující možnost výstupního formátu ve výsledku odpovědi. Pouze interní použití. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_RequestSnr Logická hodnota určující, jestli se má do výsledku odpovědi zahrnout SNR (poměr signálu k šumu). Přidáno ve verzi 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Logická hodnota požadavku na stabilizaci částečných výsledků překladu vynecháním slov na konci. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_RequestWordBoundary Logická hodnota určující, zda se mají požadovat události WordBoundary. Přidáno ve verzi 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Logická hodnota určující, zda se má v událostech WordBoundary vyžadovat interpunkční hranice. Výchozí hodnota je true. Přidáno ve verzi 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Logická hodnota určující, jestli se má ve wordboundárních událostech požadovat hranice věty. Výchozí hodnota je false. Přidáno ve verzi 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio Logická hodnota určující, jestli má sada SDK synchronizovat události syntézy metadat (např. hranice slova, viseme atd.) s přehráváním zvuku. Tato akce se projeví jenom v případě, že se zvuk přehraje prostřednictvím sady SDK. Výchozí hodnota je true. Pokud je nastavená hodnota false, sada SDK aktivuje události, které pocházejí ze služby, což může být mimo synchronizaci s přehráváním zvuku. Přidáno ve verzi 1.31.0.
SpeechServiceResponse_JsonResult Výstup odpovědi služby Cognitive Services Speech Service (ve formátu JSON) Tato vlastnost je k dispozici pouze u objektů výsledků rozpoznávání.
SpeechServiceResponse_JsonErrorDetails Podrobnosti o chybě služby Cognitive Services Speech (ve formátu JSON) Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs Latence rozpoznávání v milisekundách. Jen pro čtení, k dispozici pro konečné výsledky řeči, překladu nebo záměru. Tím se měří latence mezi tím, kdy sada SDK přijímá zvukový vstup, a okamžikem přijetí konečného výsledku ze služby. Sada SDK vypočítá časový rozdíl mezi posledním zvukovým fragmentem ze zvukového vstupu, který přispívá ke konečnému výsledku, a časem přijetí konečného výsledku ze služby Speech. Přidáno ve verzi 1.3.0.
SpeechServiceResponse_RecognitionBackend Back-end rozpoznávání. Jen pro čtení, které je k dispozici ve výsledcích rozpoznávání řeči. Označuje, jestli se k vytvoření výsledku použilo rozpoznávání cloudu (online) nebo integrovaného (offline).
SpeechServiceResponse_SynthesisFirstByteLatencyMs Latence syntézy řeči v milisekundách. Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří latence mezi zahájením zpracování syntézy a okamžikem, kdy je k dispozici první bajtový zvuk. Přidáno ve verzi 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs Syntéza řeči všechny bajty latence v milisekundách. Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří latence mezi tím, kdy se syntéza začne zpracovávat, a okamžik, kdy je syntetizován celý zvuk. Přidáno ve verzi 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs Doba podtečení syntézy řeči v milisekundách. Jen pro čtení, které jsou k dispozici ve výsledcích v událostech SynthesisCompleted. Tím se měří celková doba podtečení z PropertyId::AudioConfig_PlaybackBufferLengthInMs je vyplněna k dokončení syntézy. Přidáno ve verzi 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs Latence připojení syntézy řeči v milisekundách. Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří latence mezi zahájením zpracování syntézy a okamžikem vytvoření připojení HTTP/WebSocket. Přidáno ve verzi 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs Latence sítě syntézy řeči v milisekundách. Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří doba odezvy sítě. Přidáno ve verzi 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs Latence služby syntézy řeči v milisekundách. Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří doba zpracování služby, která syntetizuje první bajt zvuku. Přidáno ve verzi 1.26.0.
SpeechServiceResponse_SynthesisBackend Označuje, kterým back-endem je syntéza dokončena. Jen pro čtení, dostupné u výsledků syntézy řeči s výjimkou výsledku v události SynthesisStarted přidané ve verzi 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults Určuje, zda přechodné výsledky obsahují identifikaci mluvčího.
CancellationDetails_Reason Důvod zrušení. Aktuálně se nepoužívá.
CancellationDetails_ReasonText Text zrušení Aktuálně se nepoužívá.
CancellationDetails_ReasonDetailedText Podrobný text o zrušení Aktuálně se nepoužívá.
LanguageUnderstandingServiceResponse_JsonResult Výstup odpovědi služby Language Understanding Service (ve formátu JSON) K dispozici prostřednictvím IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture Název zařízení pro záznam zvuku. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte AudioConfig::FromMicrophoneInput. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_NumberOfChannelsForCapture Počet kanálů pro zachytávání zvuku Pouze interní použití. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_SampleRateForCapture Vzorkovací frekvence (v Hz) pro zachytávání zvuku. Pouze interní použití. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_BitsPerSampleForCapture Počet bitů každého vzorku pro zachytávání zvuku Pouze interní použití. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_AudioSource Zdroj zvuku. Povolené hodnoty jsou "Mikrofony", "File" a "Stream". Přidáno ve verzi 1.3.0.
AudioConfig_DeviceNameForRender Název zařízení pro vykreslování zvuku. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte AudioConfig::FromSpeakerOutput. Přidáno ve verzi 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Délka vyrovnávací paměti přehrávání v milisekundách, výchozí hodnota je 50 milisekund.
AudioConfig_AudioProcessingOptions Možnosti zpracování zvuku ve formátu JSON
Speech_LogFilename Název souboru pro zápis protokolů. Přidáno ve verzi 1.4.0.
Speech_SegmentationSilenceTimeoutMs Doba trvání zjištěného ticha měřená v milisekundách, po které řeč na text určí, že mluvená fráze skončila a vygeneruje konečný rozpoznaný výsledek. Konfigurace tohoto časového limitu může být užitečná v situacích, kdy je mluvený vstup výrazně rychlejší nebo pomalejší než obvykle a výchozí chování segmentace konzistentně přináší výsledky, které jsou příliš dlouhé nebo příliš krátké. Hodnoty časového limitu segmentace, které jsou nevhodné nebo nízké, mohou negativně ovlivnit přesnost řeči na text; tato vlastnost by měla být pečlivě nakonfigurovaná a výsledné chování by mělo být důkladně ověřeno podle očekávání.
Speech_SegmentationMaximumTimeMs Maximální délka mluvené fráze při použití strategie segmentace "Čas". Jak se délka mluvené fráze blíží této hodnotě, začne se Speech_SegmentationSilenceTimeoutMs snižovat, dokud nedojde k dosažení časového limitu ticha fráze nebo dosažení maximální délky fráze.
Speech_SegmentationStrategy Strategie používaná k určení, kdy mluvená fráze skončila, a konečný rozpoznaný výsledek by se měl vygenerovat. Povolené hodnoty jsou Default( Výchozí), Time (Čas) a Sémantic (Sémantické).
Conversation_ApplicationId Identifikátor použitý k připojení k back-endové službě. Přidáno ve verzi 1.5.0.
Conversation_DialogType Typ back-endu dialogového okna, ke kterému se chcete připojit. Přidáno ve verzi 1.7.0.
Conversation_Initial_Silence_Timeout Časový limit ticha pro naslouchání přidaný ve verzi 1.5.0
Conversation_From_Id Id, které se má použít pro aktivity rozpoznávání řeči přidané ve verzi 1.5.0.
Conversation_Conversation_Id ConversationId pro relaci. Přidáno ve verzi 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Čárkami oddělený seznam vlastních ID nasazení hlasu Přidáno ve verzi 1.8.0.
Conversation_Speech_Activity_Template Šablona aktivity řeči, vlastnosti razítka v šabloně o aktivitě vygenerované službou pro řeč. Přidáno ve verzi 1.10.0.
Conversation_ParticipantId Identifikátor účastníka v aktuální konverzaci. Přidáno ve verzi 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp Časové razítko přidružené k vyrovnávací paměti dat zapsané klientem při použití datových proudů vstupu pull/push. Časové razítko je 64bitová hodnota s rozlišením 90 kHz. Je to stejné jako časové razítko prezentace v přenosovém streamu MPEG. Viz https://en.wikipedia.org/wiki/Presentation_timestamp Přidáno ve verzi 1.5.0.
DataBuffer_UserId ID uživatele přidružené k vyrovnávací paměti dat zapsané klientem při použití datových proudů vstupu vyžádat/odeslat. Přidáno ve verzi 1.5.0.
PronunciationAssessment_ReferenceText Referenční text zvuku pro vyhodnocení výslovnosti. Informace o tomto a následujících parametrech posouzení výslovnosti najdete v tabulce parametry posouzení výslovnosti. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::Create nebo VýslovnostAssessmentConfig::SetReferenceText. Přidáno ve verzi 1.14.0.
PronunciationAssessment_GradingSystem Bodový systém pro kalibraci skóre výslovnosti (FivePoint nebo HundredMark). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_Granularity Členitost vyhodnocení výslovnosti (Phoneme, Word nebo FullText). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_EnableMiscue Definuje, jestli povolíte výpočet chybného zadání. Když je tato možnost povolená, výrazná slova se budou porovnávat s referenčním textem a budou označena vynecháním a vložením na základě porovnání. Výchozí nastavení je False. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_PhonemeAlphabet Výslovnostní abeceda fomesu. Platné hodnoty jsou SAPI (výchozí) a IPA za normálních okolností, neměli byste tuto vlastnost používat přímo. Místo toho použijte VýslovnostAssessmentConfig::SetPhonemeAlphabet. Přidáno ve verzi 1.20.0.
PronunciationAssessment_NBestPhonemeCount Hodnocení výslovnosti nbest phoneme count. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::SetNBestPhonemeCount. Přidáno ve verzi 1.20.0.
PronunciationAssessment_EnableProsodyAssessment Zda povolit hodnocení prosody. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::EnableProsodyAssessment. Přidáno ve verzi 1.33.0.
PronunciationAssessment_Json Řetězec json pro výslovnost parametrů hodnocení za normálních okolností byste neměli tuto vlastnost používat přímo. Místo toho použijte VýslovnostAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_Params Parametry posouzení výslovnosti Tato vlastnost je určena jen pro čtení. Sada SDK ji interně používá. Přidáno ve verzi 1.14.0.
PronunciationAssessment_ContentTopic Téma obsahu hodnocení výslovnosti Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte VýslovnostAssessmentConfig::EnableContentAssessmentWithTopic. Přidáno ve verzi 1.33.0.
SpeakerRecognition_Api_Version Verze rozhraní API pro rozpoznávání mluvčího Tato vlastnost se přidá, aby bylo možné testovat a používat předchozí verze rozhraní API pro rozpoznávání mluvčího, pokud je to možné. Přidáno ve verzi 1.18.0.
SpeechTranslation_ModelName Název modelu, který se má použít pro překlad řeči. Tuto vlastnost nepoužívejte přímo. V současné době platí pouze v případě, že se používá EmbeddedSpeechConfig.
SpeechTranslation_ModelKey Tato vlastnost je zastaralá.
KeywordRecognition_ModelName Název modelu, který se má použít k rozpoznávání klíčových slov. Tuto vlastnost nepoužívejte přímo. V současné době platí pouze v případě, že se používá EmbeddedSpeechConfig.
KeywordRecognition_ModelKey Tato vlastnost je zastaralá.
EmbeddedSpeech_EnablePerformanceMetrics Povolte kolekci vložených metrik výkonu řeči, které se dají použít k vyhodnocení schopnosti zařízení používat vloženou řeč. Shromážděná data jsou součástí výsledků konkrétních scénářů, jako je rozpoznávání řeči. Výchozí nastavení je false. Všimněte si, že metriky nemusí být dostupné ve všech vložených scénářích řeči.
SpeechSynthesisRequest_Pitch Tón syntetizované řeči.
SpeechSynthesisRequest_Rate Rychlost syntetizované řeči.
SpeechSynthesisRequest_Volume Objem syntetizované řeči.

Definuje ID vlastností řeči. Změněno ve verzi 1.4.0.

enum OutputFormat

Hodnoty Popisy
Jednoduchý
Podrobný

Výstupní formát

enum ProfanityOption

Hodnoty Popisy
Maskovaný Nahradí písmena v profánní slovech hvězdičkami.
Odstraněný Odstraní věrná slova.
Syrový Nedělá nic k vulgárním slovům.

Odebere vulgární slova (na sobě) nebo nahradí písmena vulgárních slov hvězdičkami. Přidáno ve verzi 1.5.0.

enum ResultReason

Hodnoty Popisy
NoMatch Označuje, že řeč nebyla rozpoznána. Další podrobnosti naleznete v NoMatchDetails objektu.
Zrušený Označuje, že rozpoznávání bylo zrušeno. Další podrobnosti naleznete pomocí CancellationDetails objektu.
RozpoznáváníSpeech Označuje výsledek řeči, který obsahuje text hypotézy.
RecognizedSpeech Označuje výsledek řeči obsahující konečný text, který byl rozpoznán. Rozpoznávání řeči je teď pro tuto frázi hotové.
RozpoznáváníIntent Označuje výsledek záměru obsahuje text hypotézy a záměr.
RecognizedIntent Označuje výsledek záměru obsahuje konečný text a záměr. Pro tuto frázi se teď dokončí rozpoznávání řeči a určení záměru.
PřekladSpeech Označuje výsledek překladu, který obsahuje text hypotézy a jeho překlady.
PřeloženoSpeech Označuje výsledek překladu, který obsahuje konečný text a odpovídající překlady. Rozpoznávání řeči a překlad jsou teď pro tuto frázi hotové.
SynthesizingAudio Označuje syntetizovaný výsledek zvuku obsahuje nenulové množství zvukových dat.
SynthesizingAudioCompleted Označuje, že syntetizovaný zvuk je nyní dokončen pro tuto frázi.
Rozpoznávání klíče Označuje výsledek řeči obsahuje (neověřený) text klíčového slova. Přidáno ve verzi 1.3.0.
RecognizedKeyword Označuje, že rozpoznávání klíčových slov dokončilo rozpoznávání daného klíčového slova. Přidáno ve verzi 1.3.0.
SynthesizingAudioStarted Označuje, že syntéza řeči je nyní spuštěna přidána ve verzi 1.4.0.
TranslatingParticipantSpeech Označuje výsledek přepisu, který obsahuje text hypotézy a jeho překlady pro ostatní účastníky konverzace. Přidáno ve verzi 1.8.0.
PřeloženýParticipantSpeech Označuje výsledek přepisu, který obsahuje konečný text a odpovídající překlady pro ostatní účastníky konverzace. Rozpoznávání řeči a překlad jsou teď pro tuto frázi hotové. Přidáno ve verzi 1.8.0.
TranslatedInstantMessage Označuje výsledek přepisu obsahující rychlou zprávu a odpovídající překlady. Přidáno ve verzi 1.8.0.
PřeloženáparticipantInstantMessage Označuje výsledek přepisu obsahuje rychlou zprávu pro ostatní účastníky konverzace a odpovídající překlady. Přidáno ve verzi 1.8.0.
Registrace profiluVoiceProfile Označuje, že se hlasový profil registrují a zákazníci musí odeslat další zvuk, aby mohli vytvořit hlasový profil. Přidáno ve verzi 1.12.0.
EnrolledVoiceProfile Hlasový profil je zaregistrovaný. Přidáno ve verzi 1.12.0.
RecognizedSpeakers Označuje úspěšnou identifikaci některých mluvčích. Přidáno ve verzi 1.12.0.
RecognizedSpeaker Označuje úspěšné ověření jednoho mluvčího. Přidáno ve verzi 1.12.0.
ResetVoiceProfile Značí, že se hlasový profil úspěšně resetoval. Přidáno ve verzi 1.12.0.
Odstraněný souborVoiceProfile Značí, že se hlasový profil úspěšně odstranil. Přidáno ve verzi 1.12.0.
VoicesListRetrieved Označuje, že se seznam hlasů úspěšně načetl. Přidáno ve verzi 1.16.0.

Určuje možné důvody, proč se může vygenerovat výsledek rozpoznávání.

enum CancellationReason

Hodnoty Popisy
Chyba Označuje, že během rozpoznávání řeči došlo k chybě.
EndOfStream Označuje, že byl dosažen konec zvukového streamu.
CancelledByUser Označuje, že uživatel zrušil požadavek. Přidáno ve verzi 1.14.0.

Definuje možné důvody, proč může být výsledek rozpoznávání zrušen.

enum CancellationErrorCode

Hodnoty Popisy
NoError Žádná chyba. Pokud je CancellationReason EndOfStream, CancellationErrorCode je nastavena na NoError.
OvěřováníFailure Označuje chybu ověřování. K chybě ověřování dochází v případě, že je klíč předplatného nebo autorizační token neplatný, vypršela jeho platnost nebo neodpovídá používané oblasti.
BadRequest Označuje, že jeden nebo více parametrů rozpoznávání je neplatné nebo formát zvuku není podporován.
TooManyRequests Označuje, že počet paralelních požadavků překročil počet povolených souběžných přepisů předplatného.
Zakázaný Označuje, že bezplatné předplatné, které žádost používá, vypršela kvóta.
Chyba připojení Označuje chybu připojení.
ServiceTimeout Označuje chybu časového limitu při čekání na odpověď ze služby.
Chyba služby Označuje, že služba vrací chybu.
ServiceUnavailable Označuje, že služba je momentálně nedostupná.
RuntimeError Označuje neočekávanou chybu modulu runtime.
ServiceRedirectTemporary Označuje, že služba Speech dočasně žádá o opětovné připojení k jinému koncovému bodu.
ServiceRedirectPermanent Označuje, že služba Speech trvale žádá o opětovné připojení k jinému koncovému bodu.
EmbeddedModelError Označuje, že model vložené řeči (SR nebo TTS) není dostupný nebo poškozený.

Definuje kód chyby v případě, že CancellationReason je Chyba. Přidáno ve verzi 1.1.0.

enum NoMatchReason

Hodnoty Popisy
NotRecognized Označuje, že se rozpoznala řeč, ale nerozpoznala.
InitialSilenceTimeout Označuje, že začátek zvukového streamu obsahoval pouze ticho a služba vypršela časového limitu čekání na řeč.
InitialBabbleTimeout Označuje, že začátek zvukového streamu obsahoval pouze šum a služba vypršela časového limitu čekání na řeč.
Klíčové slovoNotRecognized Označuje, že spotované klíčové slovo služba ověření klíčového slova odmítla. Přidáno ve verzi 1.5.0.
EndSilenceTimeout Označuje, že zvukový stream obsahoval pouze ticho po poslední rozpoznané frázi.

Definuje možné důvody, proč se výsledek rozpoznávání nemusí rozpoznat.

enum ActivityJSONType

Hodnoty Popisy
Nula
Objekt
Pole
Řetězec
Dvojitý
UInt
Int
Booleovský

Definuje možné typy pro hodnotu JSON aktivity. Přidáno ve verzi 1.5.0.

enum SpeechSynthesisOutputFormat

Hodnoty Popisy
Raw8Khz8BitMonoMULaw raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16khz-16kbps-mono-siren Nepodporované službou. Tuto hodnotu nepoužívejte.
Audio16Khz16KbpsMonoSiren audio-16khz-16kbps-mono-siren Nepodporovaná službou. Tuto hodnotu nepoužívejte.
Audio16Khz32KBitRateMonoMp3 audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48khz-16bit-mono-opus Přidáno ve verzi 1.16.0
Webm16Khz16BitMonoOpus webm-16khz-16bit-mono-opus Přidáno ve verzi 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus Přidáno ve verzi 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24khz-16bit-mono-truesilk Přidáno ve verzi 1.17.0
Raw8Khz8BitMonoALaw raw-8khz-8bit-mono-alaw Přidáno ve verzi 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw Přidáno ve verzi 1.17.0
Webm24Khz16Bit24KbpsMonoOpus webm-24khz-16bit-24kbps-mono-opus Audio komprimovaný kodekem OPUS v kontejneru WebM s přenosovou rychlostí 24 kb/s optimalizovanou pro scénář IoT. (Přidáno do verze 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus audio-16khz-16bit-32kbps-mono-opus Audio komprimovaný kodekem OPUS bez kontejneru s přenosovou rychlostí 32 kB/s. (Přidáno do verze 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus audio-24khz-16bit-48kbps-mono-opus Audio komprimovaný kodekem OPUS bez kontejneru, s přenosovou rychlostí 48 kbps. (Přidáno do verze 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus audio-24khz-16bit-24kbps-mono-opus Audio komprimovaný kodekem OPUS bez kontejneru, s přenosovou rychlostí 24 kB/s. (Přidáno do verze 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Raw PCM zvuk při vzorkovací frekvenci 22050Hz a 16bitové hloubky. (Přidáno do verze 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM audio při vzorkovací frekvenci 22050Hz a 16bitové hloubky s hlavičkou RIFF. (Přidáno do verze 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Raw PCM zvuk při vzorkovací frekvenci 44100Hz a 16bitové hloubky. (Přidáno do verze 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm PCM audio při vzorkovací frekvenci 44100Hz a 16bitové hloubky s hlavičkou RIFF. (Přidáno do verze 1.22.0)
AmrWb16000Hz amr-wb-16000hz AMR-WB zvuku při vzorkovací frekvenci 16kHz. (Přidáno do verze 1.24.0)
G72216Khz64Kbps g722-16khz-64kbps G.722 audio při vzorkovací frekvenci 16kHz a přenosová rychlost 64 kB/s. (Přidáno ve verzi 1.38.0)

Definuje možné formáty zvuku syntézy řeči. Aktualizováno ve verzi 1.19.0.

enum StreamStatus

Hodnoty Popisy
Neznámý Stav zvukového datového proudu je neznámý.
NoData Datový proud zvuku neobsahuje žádná data.
PartialData Datový proud zvuku obsahuje částečná data žádosti o mluvení.
AllData Stream zvukových dat obsahuje všechna data žádosti o mluvení.
Zrušený Stream zvukových dat byl zrušen.

Definuje možný stav zvukového datového streamu. Přidáno ve verzi 1.4.0.

enum ServicePropertyChannel

Hodnoty Popisy
UriQueryParameter Používá parametr dotazu URI k předání nastavení vlastností do služby.
HttpHeader Použije Metodu HttpHeader k nastavení klíče nebo hodnoty v hlavičce HTTP.

Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.5.0.

enum VoiceProfileType

Hodnoty Popisy
TextIndependentIdentification Identifikace mluvčího nezávislá na textu
TextDependentVerification Ověření mluvčího závislého na textu
TextIndependentVerification Ověření nezávislé na textu

Definuje typy hlasových profilů.

enum RecognitionFactorScope

Hodnoty Popisy
Částečné fráze Faktor rozpoznávání se použije na gramatiky, na které lze odkazovat jako na jednotlivé částečné fráze.

Definuje obor, na který se použije faktor rozpoznávání.

enum PronunciationAssessmentGradingSystem

Hodnoty Popisy
Pět bodů Kalibrace pěti bodů.
HundredMark Stovka.

Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.14.0.

enum PronunciationAssessmentGranularity

Hodnoty Popisy
Foném Zobrazuje skóre na úrovni celého textu, slova a fooneu.
Slovo Zobrazuje skóre na úrovni celého textu a slova.
FullText Zobrazuje skóre pouze na úrovni celého textu.

Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.14.0.

enum SynthesisVoiceType

Hodnoty Popisy
OnlineNeural Online neurální hlas.
OnlineStandard Online standardní hlas.
OfflineNeural Offline neurální hlas.
Offlinestandard Standardní hlas offline.

Definuje typ syntézy hlasů přidaných ve verzi 1.16.0.

enum SynthesisVoiceGender

Hodnoty Popisy
Neznámý Pohlaví neznámé.
Ženský Ženský hlas.
Muž Mužský hlas.

Definuje pohlaví syntézy hlasů přidaných ve verzi 1.17.0.

enum SpeechSynthesisBoundaryType

Hodnoty Popisy
Slovo Hranice slova.
Interpunkce Interpunkční hranice.
Rozsudek Hranice věty.

Definuje typ hranice události syntézy řeči přidané ve verzi 1.21.0.

enum SegmentationStrategy

Hodnoty Popisy
Výchozí Použijte výchozí strategii a nastavení určenou službou Speech. Používejte ve většině situací.
Čas Používá strategii založenou na čase, kdy se k vygenerování konečného výsledku používá množství ticha mezi řečí.
Sémantický Používá model AI k deterinu konce mluvené fráze na základě obsahu fráze.

Strategie používaná k určení, kdy mluvená fráze skončila, a konečný rozpoznaný výsledek by se měl vygenerovat. Povolené hodnoty jsou Default( Výchozí), Time (Čas) a Sémantic (Sémantické).