microsoft-cognitiveservices-speech-sdk package
Třídy
ActivityReceivedEventArgs |
Definuje obsah přijatých zpráv nebo událostí. |
AudioConfig |
Představuje konfiguraci zvukového vstupu použitou k určení typu vstupu, který se má použít (mikrofon, soubor, datový proud). |
AudioInputStream |
Představuje zvukový vstupní datový proud používaný pro vlastní konfigurace zvukového vstupu. |
AudioOutputStream |
Představuje zvukový výstupní datový proud používaný pro vlastní konfigurace zvukového výstupu. |
AudioStreamFormat |
Představuje formát zvukového streamu používaný pro vlastní konfigurace zvukového vstupu. |
AutoDetectSourceLanguageConfig |
Konfigurace automatického rozpoznávání jazyka |
AutoDetectSourceLanguageResult |
Výstupní formát |
AvatarConfig |
Definuje konfiguraci mluvícího avatara. |
AvatarEventArgs |
Definuje obsah pro mluvení událostí avatarů. |
AvatarSynthesizer |
Definuje syntetizátor avataru. |
AvatarVideoFormat |
Definuje výstupní formát videa avatara. |
AvatarWebRTCConnectionResult |
Definuje výsledek připojení WebRTC avataru. |
BaseAudioPlayer |
Základní audio přehrávač třídy TODO: Přehrává pouze PCM prozatím. |
BotFrameworkConfig |
Třída, která definuje konfigurace pro objekt konektoru služby dialog pro použití back-endu služby Bot Framework. |
CancellationDetails |
Obsahuje podrobné informace o tom, proč byl výsledek zrušen. |
CancellationDetailsBase |
Obsahuje podrobné informace o tom, proč byl výsledek zrušen. |
Connection |
Připojení je třída proxy pro správu připojení ke službě Speech zadaného rozpoznávání. Ve výchozím nastavení služba Recognizer v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití připojení je volitelné a hlavně pro scénáře, ve kterých je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open() a ručně nastavit připojení předem před zahájením rozpoznávání v nástroji Recognizer přidruženém k tomuto připojení. Pokud se služba Recognizer potřebuje připojit nebo odpojit ke službě, nastaví nebo vypne připojení nezávisle. V takovém případě bude připojení upozorněno změnou stavu připojení prostřednictvím událostí Připojeno/Odpojeno. Přidáno ve verzi 1.2.1. |
ConnectionEventArgs |
Definuje datovou část pro události připojení, jako je Connected/Disconnected. Přidáno ve verzi 1.2.0 |
ConnectionMessage |
ConnectionMessage představuje implementaci konkrétních zpráv odesílaných a přijatých ze služby Speech. Tyto zprávy jsou k dispozici pro účely ladění a neměly by se používat pro případy použití v produkčním prostředí se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté ze služby Speech se můžou bez předchozího upozornění měnit. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.11.0. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationParticipantsChangedEventArgs |
Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationTranscriber |
Provádí rozpoznávání řeči s oddělením reproduktoru od mikrofonu, souboru nebo jiných streamů zvukového vstupu a v důsledku toho přepíše text. |
ConversationTranscriptionCanceledEventArgs |
Definuje obsah funkce RecognitionErrorEvent. |
ConversationTranscriptionEventArgs |
Definuje obsah události přepisu nebo přepisu konverzace. |
ConversationTranscriptionResult |
Definuje výsledek přepisu konverzace. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Definuje datovou část pro události relace, jako je start/konec rozpoznávání řeči. |
ConversationTranslationResult |
Výsledek překladu textu |
ConversationTranslator |
Připojte se ke konverzaci, odpojte ji nebo se k ní připojte. |
Coordinate |
Definuje souřadnici v 2D prostoru. |
CustomCommandsConfig |
Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu CustomCommands. |
Diagnostics |
Definuje rozhraní API diagnostiky pro správu výstupu konzoly přidaného ve verzi 1.21.0. |
DialogServiceConfig |
Třída, která definuje základní konfigurace pro konektor služby dialogových oken |
DialogServiceConnector |
Konektor služby dialogového okna |
IntentRecognitionCanceledEventArgs |
Definujte datovou část událostí zrušených výsledků rozpoznávání záměru. |
IntentRecognitionEventArgs |
Argumenty události rozpoznávání záměru |
IntentRecognitionResult |
Výsledek rozpoznávání záměru |
IntentRecognizer |
Rozpoznávání záměru |
KeywordRecognitionModel |
Představuje model rozpoznávání klíčových slov pro rozpoznávání, když uživatel říká klíčové slovo pro zahájení dalšího rozpoznávání řeči. |
LanguageUnderstandingModel |
Model language understanding |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
Definuje obsah MeetingTranscriptionCanceledEvent. |
MeetingTranscriptionEventArgs |
Definuje obsah události, která se přepíše nebo přepíše. |
NoMatchDetails |
Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch. |
Participant |
Představuje účastníka konverzace. Přidáno ve verzi 1.4.0 |
PhraseListGrammar |
Umožňuje přidávání nových frází ke zlepšení rozpoznávání řeči. Fráze přidané do rozpoznávání jsou efektivní na začátku dalšího rozpoznávání, nebo se při příštím připojení sady SpeechSDK ke službě SpeechSDK musí znovu připojit. |
PronunciationAssessmentConfig |
Konfigurace posouzení výslovnosti |
PronunciationAssessmentResult |
Výsledky hodnocení výslovnosti. |
PropertyCollection |
Představuje kolekci vlastností a jejich hodnot. |
PullAudioInputStream |
Představuje zvukový vstupní datový proud používaný pro vlastní konfigurace zvukového vstupu. |
PullAudioInputStreamCallback |
Abstraktní základní třída, která definuje metody zpětného volání (read() a close()) pro vlastní zvukové vstupní streamy). |
PullAudioOutputStream |
Představuje stream zvukového výstupu s podporou paměti používaný pro vlastní konfigurace zvukového výstupu. |
PushAudioInputStream |
Představuje stream zvukového vstupu s podporou paměti, který se používá pro vlastní konfigurace zvukového vstupu. |
PushAudioOutputStream |
Představuje zvukový výstupní datový proud používaný pro vlastní konfigurace zvukového výstupu. |
PushAudioOutputStreamCallback |
Abstraktní základní třída, která definuje metody zpětného volání (write() a close()) pro vlastní zvukové výstupní streamy). |
RecognitionEventArgs |
Definuje datovou část pro události relace, jako je start/konec rozpoznávání řeči. |
RecognitionResult |
Definuje výsledek rozpoznávání řeči. |
Recognizer |
Definuje základní třídu Recognizer, která obsahuje hlavně běžné obslužné rutiny událostí. |
ServiceEventArgs |
Definuje datovou část pro událost zprávy služby přidanou ve verzi 1.9.0. |
SessionEventArgs |
Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped. |
SourceLanguageConfig |
Konfigurace zdrojového jazyka |
SpeakerAudioDestination |
Představuje cíl přehrávání zvuku mluvčího, který funguje jenom v prohlížeči. Poznámka: Sada SDK se pokusí použít rozšíření zdroje médií k přehrávání zvuku. Formát Mp3 má lepší podporu pro Microsoft Edge, Chrome a Safari (desktop), takže je lepší určit formát mp3 pro přehrávání. |
SpeakerIdentificationModel |
Definuje třídu SpeakerIdentificationModel pro model rozpoznávání mluvčího obsahuje sadu profilů, pro které se mají identifikovat mluvčí. |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
Výstupní formát |
SpeakerRecognizer |
Definuje třídu SpeakerRecognizer pro operace zpracování rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile). |
SpeakerVerificationModel |
Definuje třídu SpeakerVerificationModel pro model rozpoznávání mluvčího obsahuje profil, proti kterému se má ověřit mluvčí. |
SpeechConfig |
Konfigurace řeči |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
Definuje obsah rozpoznávání a rozpoznané události řeči. |
SpeechRecognitionResult |
Definuje výsledek rozpoznávání řeči. |
SpeechRecognizer |
Provádí rozpoznávání řeči z mikrofonu, souboru nebo jiných zvukových vstupních datových proudů a v důsledku toho se přepíše text. |
SpeechSynthesisBookmarkEventArgs |
Definuje obsah události záložky syntézy řeči. |
SpeechSynthesisEventArgs |
Definuje obsah událostí syntézy řeči. |
SpeechSynthesisResult |
Definuje výsledek syntézy řeči. |
SpeechSynthesisVisemeEventArgs |
Definuje obsah události syntézy řeči viseme. |
SpeechSynthesisWordBoundaryEventArgs |
Definuje obsah události hranice slova syntézy řeči. |
SpeechSynthesizer |
Definuje třídu SpeechSynthesizer pro převod textu na řeč. Aktualizováno ve verzi 1.16.0 |
SpeechTranslationConfig |
Konfigurace překladu řeči |
SynthesisResult |
Základní třída pro výsledky syntézy |
SynthesisVoicesResult |
Definuje výsledek syntézy řeči. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
Definujte datovou část událostí zrušených výsledků rozpoznávání řeči. |
TranslationRecognitionEventArgs |
Argumenty události výsledku překladu textu |
TranslationRecognitionResult |
Výsledek překladu textu |
TranslationRecognizer |
Rozpoznávání překladu |
TranslationSynthesisEventArgs |
Argumenty události syntézy překladu |
TranslationSynthesisResult |
Definuje výsledek syntézy překladu, tj. hlasový výstup přeloženého textu v cílovém jazyce. |
Translations |
Představuje kolekci parametrů a jejich hodnot. |
TurnStatusReceivedEventArgs |
Definuje obsah přijatých zpráv nebo událostí. |
User | |
VoiceInfo |
Informace o hlasu syntézy řeči přidány ve verzi 1.20.0. |
VoiceProfile |
Definuje třídu hlasového profilu pro rozpoznávání mluvčího. |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
Definuje třídu VoiceProfileClient pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile). |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
Výstupní formát |
VoiceProfilePhraseResult |
Výstupní formát |
VoiceProfileResult |
Výstupní formát |
Rozhraní
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
Představuje účastníka konverzace. Přidáno ve verzi 1.4.0 |
IPlayer |
Představuje rozhraní zvukového přehrávače pro ovládání přehrávání zvuku, například pozastavení, obnovení atd. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
Výčty
AudioFormatTag | |
CancellationErrorCode |
Definuje kód chyby v případě, že CancellationReason je Chyba. Přidáno ve verzi 1.1.0. |
CancellationReason |
Definuje možné důvody, proč může být výsledek rozpoznávání zrušen. |
LanguageIdMode |
Režim identifikace jazyka |
LogLevel | |
NoMatchReason |
Definuje možné důvody, proč se výsledek rozpoznávání nemusí rozpoznat. |
OutputFormat |
Definujte výstupní formáty služby Rozpoznávání řeči. |
ParticipantChangedReason | |
ProfanityOption |
Možnost vulgárních výrazů. Přidáno ve verzi 1.7.0. |
PronunciationAssessmentGradingSystem |
Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.15.0 |
PronunciationAssessmentGranularity |
Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.15.0 |
PropertyId |
Definuje ID vlastností řeči. |
ResultReason |
Definuje možné důvody, proč se může vygenerovat výsledek rozpoznávání. |
ServicePropertyChannel |
Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.7.0. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
Definuje typ hranice události hranice syntézy řeči. |
SpeechSynthesisOutputFormat |
Definujte formáty zvukového výstupu syntézy řeči. SpeechSynthesisOutputFormat aktualizováno ve verzi 1.17.0 |
VoiceProfileType |
Výstupní formát |