microsoft-cognitiveservices-speech-sdk package

Reference

Třídy

ActivityReceivedEventArgs	Definuje obsah přijatých zpráv nebo událostí.
AudioConfig	Představuje konfiguraci zvukového vstupu použitou k určení typu vstupu, který se má použít (mikrofon, soubor, datový proud).
AudioInputStream	Představuje zvukový vstupní datový proud používaný pro vlastní konfigurace zvukového vstupu.
AudioOutputStream	Představuje zvukový výstupní datový proud používaný pro vlastní konfigurace zvukového výstupu.
AudioStreamFormat	Představuje formát zvukového streamu používaný pro vlastní konfigurace zvukového vstupu.
AutoDetectSourceLanguageConfig	Konfigurace automatického rozpoznávání jazyka
AutoDetectSourceLanguageResult	Výstupní formát
AvatarConfig	Definuje konfiguraci mluvícího avatara.
AvatarEventArgs	Definuje obsah pro mluvení událostí avatarů.
AvatarSynthesizer	Definuje syntetizátor avataru.
AvatarVideoFormat	Definuje výstupní formát videa avatara.
AvatarWebRTCConnectionResult	Definuje výsledek připojení WebRTC avataru.
BaseAudioPlayer	Základní audio přehrávač třídy TODO: Přehrává pouze PCM prozatím.
BotFrameworkConfig	Třída, která definuje konfigurace pro objekt konektoru služby dialog pro použití back-endu služby Bot Framework.
CancellationDetails	Obsahuje podrobné informace o tom, proč byl výsledek zrušen.
CancellationDetailsBase	Obsahuje podrobné informace o tom, proč byl výsledek zrušen.
Connection	Připojení je třída proxy pro správu připojení ke službě Speech zadaného rozpoznávání. Ve výchozím nastavení služba Recognizer v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití připojení je volitelné a hlavně pro scénáře, ve kterých je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open() a ručně nastavit připojení předem před zahájením rozpoznávání v nástroji Recognizer přidruženém k tomuto připojení. Pokud se služba Recognizer potřebuje připojit nebo odpojit ke službě, nastaví nebo vypne připojení nezávisle. V takovém případě bude připojení upozorněno změnou stavu připojení prostřednictvím událostí Připojeno/Odpojeno. Přidáno ve verzi 1.2.1.
ConnectionEventArgs	Definuje datovou část pro události připojení, jako je Connected/Disconnected. Přidáno ve verzi 1.2.0
ConnectionMessage	ConnectionMessage představuje implementaci konkrétních zpráv odesílaných a přijatých ze služby Speech. Tyto zprávy jsou k dispozici pro účely ladění a neměly by se používat pro případy použití v produkčním prostředí se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté ze služby Speech se můžou bez předchozího upozornění měnit. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.
ConversationTranscriber	Provádí rozpoznávání řeči s oddělením reproduktoru od mikrofonu, souboru nebo jiných streamů zvukového vstupu a v důsledku toho přepíše text.
ConversationTranscriptionCanceledEventArgs	Definuje obsah funkce RecognitionErrorEvent.
ConversationTranscriptionEventArgs	Definuje obsah události přepisu nebo přepisu konverzace.
ConversationTranscriptionResult	Definuje výsledek přepisu konverzace.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Definuje datovou část pro události relace, jako je start/konec rozpoznávání řeči.
ConversationTranslationResult	Výsledek překladu textu
ConversationTranslator	Připojte se ke konverzaci, odpojte ji nebo se k ní připojte.
Coordinate	Definuje souřadnici v 2D prostoru.
CustomCommandsConfig	Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu CustomCommands.
Diagnostics	Definuje rozhraní API diagnostiky pro správu výstupu konzoly přidaného ve verzi 1.21.0.
DialogServiceConfig	Třída, která definuje základní konfigurace pro konektor služby dialogových oken
DialogServiceConnector	Konektor služby dialogového okna
IntentRecognitionCanceledEventArgs	Definujte datovou část událostí zrušených výsledků rozpoznávání záměru.
IntentRecognitionEventArgs	Argumenty události rozpoznávání záměru
IntentRecognitionResult	Výsledek rozpoznávání záměru
IntentRecognizer	Rozpoznávání záměru
KeywordRecognitionModel	Představuje model rozpoznávání klíčových slov pro rozpoznávání, když uživatel říká klíčové slovo pro zahájení dalšího rozpoznávání řeči.
LanguageUnderstandingModel	Model language understanding
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	Definuje obsah MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	Definuje obsah události, která se přepíše nebo přepíše.
NoMatchDetails	Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch.
Participant	Představuje účastníka konverzace. Přidáno ve verzi 1.4.0
PhraseListGrammar	Umožňuje přidávání nových frází ke zlepšení rozpoznávání řeči. Fráze přidané do rozpoznávání jsou efektivní na začátku dalšího rozpoznávání, nebo se při příštím připojení sady SpeechSDK ke službě SpeechSDK musí znovu připojit.
PronunciationAssessmentConfig	Konfigurace posouzení výslovnosti
PronunciationAssessmentResult	Výsledky hodnocení výslovnosti.
PropertyCollection	Představuje kolekci vlastností a jejich hodnot.
PullAudioInputStream	Představuje zvukový vstupní datový proud používaný pro vlastní konfigurace zvukového vstupu.
PullAudioInputStreamCallback	Abstraktní základní třída, která definuje metody zpětného volání (read() a close()) pro vlastní zvukové vstupní streamy).
PullAudioOutputStream	Představuje stream zvukového výstupu s podporou paměti používaný pro vlastní konfigurace zvukového výstupu.
PushAudioInputStream	Představuje stream zvukového vstupu s podporou paměti, který se používá pro vlastní konfigurace zvukového vstupu.
PushAudioOutputStream	Představuje zvukový výstupní datový proud používaný pro vlastní konfigurace zvukového výstupu.
PushAudioOutputStreamCallback	Abstraktní základní třída, která definuje metody zpětného volání (write() a close()) pro vlastní zvukové výstupní streamy).
RecognitionEventArgs	Definuje datovou část pro události relace, jako je start/konec rozpoznávání řeči.
RecognitionResult	Definuje výsledek rozpoznávání řeči.
Recognizer	Definuje základní třídu Recognizer, která obsahuje hlavně běžné obslužné rutiny událostí.
ServiceEventArgs	Definuje datovou část pro událost zprávy služby přidanou ve verzi 1.9.0.
SessionEventArgs	Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.
SourceLanguageConfig	Konfigurace zdrojového jazyka
SpeakerAudioDestination	Představuje cíl přehrávání zvuku mluvčího, který funguje jenom v prohlížeči. Poznámka: Sada SDK se pokusí použít rozšíření zdroje médií k přehrávání zvuku. Formát Mp3 má lepší podporu pro Microsoft Edge, Chrome a Safari (desktop), takže je lepší určit formát mp3 pro přehrávání.
SpeakerIdentificationModel	Definuje třídu SpeakerIdentificationModel pro model rozpoznávání mluvčího obsahuje sadu profilů, pro které se mají identifikovat mluvčí.
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	Výstupní formát
SpeakerRecognizer	Definuje třídu SpeakerRecognizer pro operace zpracování rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).
SpeakerVerificationModel	Definuje třídu SpeakerVerificationModel pro model rozpoznávání mluvčího obsahuje profil, proti kterému se má ověřit mluvčí.
SpeechConfig	Konfigurace řeči
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	Definuje obsah rozpoznávání a rozpoznané události řeči.
SpeechRecognitionResult	Definuje výsledek rozpoznávání řeči.
SpeechRecognizer	Provádí rozpoznávání řeči z mikrofonu, souboru nebo jiných zvukových vstupních datových proudů a v důsledku toho se přepíše text.
SpeechSynthesisBookmarkEventArgs	Definuje obsah události záložky syntézy řeči.
SpeechSynthesisEventArgs	Definuje obsah událostí syntézy řeči.
SpeechSynthesisResult	Definuje výsledek syntézy řeči.
SpeechSynthesisVisemeEventArgs	Definuje obsah události syntézy řeči viseme.
SpeechSynthesisWordBoundaryEventArgs	Definuje obsah události hranice slova syntézy řeči.
SpeechSynthesizer	Definuje třídu SpeechSynthesizer pro převod textu na řeč. Aktualizováno ve verzi 1.16.0
SpeechTranslationConfig	Konfigurace překladu řeči
SynthesisResult	Základní třída pro výsledky syntézy
SynthesisVoicesResult	Definuje výsledek syntézy řeči.
Synthesizer
TranslationRecognitionCanceledEventArgs	Definujte datovou část událostí zrušených výsledků rozpoznávání řeči.
TranslationRecognitionEventArgs	Argumenty události výsledku překladu textu
TranslationRecognitionResult	Výsledek překladu textu
TranslationRecognizer	Rozpoznávání překladu
TranslationSynthesisEventArgs	Argumenty události syntézy překladu
TranslationSynthesisResult	Definuje výsledek syntézy překladu, tj. hlasový výstup přeloženého textu v cílovém jazyce.
Translations	Představuje kolekci parametrů a jejich hodnot.
TurnStatusReceivedEventArgs	Definuje obsah přijatých zpráv nebo událostí.
User
VoiceInfo	Informace o hlasu syntézy řeči přidány ve verzi 1.20.0.
VoiceProfile	Definuje třídu hlasového profilu pro rozpoznávání mluvčího.
VoiceProfileCancellationDetails
VoiceProfileClient	Definuje třídu VoiceProfileClient pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	Výstupní formát
VoiceProfilePhraseResult	Výstupní formát
VoiceProfileResult	Výstupní formát

Rozhraní

CancellationEventArgs
ConversationInfo
IParticipant	Představuje účastníka konverzace. Přidáno ve verzi 1.4.0
IPlayer	Představuje rozhraní zvukového přehrávače pro ovládání přehrávání zvuku, například pozastavení, obnovení atd.
IVoiceJson
MeetingInfo
VoiceSignature

Výčty

AudioFormatTag
CancellationErrorCode	Definuje kód chyby v případě, že CancellationReason je Chyba. Přidáno ve verzi 1.1.0.
CancellationReason	Definuje možné důvody, proč může být výsledek rozpoznávání zrušen.
LanguageIdMode	Režim identifikace jazyka
LogLevel
NoMatchReason	Definuje možné důvody, proč se výsledek rozpoznávání nemusí rozpoznat.
OutputFormat	Definujte výstupní formáty služby Rozpoznávání řeči.
ParticipantChangedReason
ProfanityOption	Možnost vulgárních výrazů. Přidáno ve verzi 1.7.0.
PronunciationAssessmentGradingSystem	Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.15.0
PronunciationAssessmentGranularity	Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.15.0
PropertyId	Definuje ID vlastností řeči.
ResultReason	Definuje možné důvody, proč se může vygenerovat výsledek rozpoznávání.
ServicePropertyChannel	Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	Definuje typ hranice události hranice syntézy řeči.
SpeechSynthesisOutputFormat	Definujte formáty zvukového výstupu syntézy řeči. SpeechSynthesisOutputFormat aktualizováno ve verzi 1.17.0
VoiceProfileType	Výstupní formát

Sdílet prostřednictvím

microsoft-cognitiveservices-speech-sdk package

Třídy

Rozhraní

Výčty

Další materiály