Sdílet prostřednictvím


microsoft-cognitiveservices-speech-sdk package

Třídy

ActivityReceivedEventArgs

Definuje obsah přijatých zpráv nebo událostí.

AudioConfig

Představuje konfiguraci zvukového vstupu použitou k určení typu vstupu, který se má použít (mikrofon, soubor, datový proud).

AudioInputStream

Představuje zvukový vstupní datový proud používaný pro vlastní konfigurace zvukového vstupu.

AudioOutputStream

Představuje zvukový výstupní datový proud používaný pro vlastní konfigurace zvukového výstupu.

AudioStreamFormat

Představuje formát zvukového streamu používaný pro vlastní konfigurace zvukového vstupu.

AutoDetectSourceLanguageConfig

Konfigurace automatického rozpoznávání jazyka

AutoDetectSourceLanguageResult

Výstupní formát

AvatarConfig

Definuje konfiguraci mluvícího avatara.

AvatarEventArgs

Definuje obsah pro mluvení událostí avatarů.

AvatarSynthesizer

Definuje syntetizátor avataru.

AvatarVideoFormat

Definuje výstupní formát videa avatara.

AvatarWebRTCConnectionResult

Definuje výsledek připojení WebRTC avataru.

BaseAudioPlayer

Základní audio přehrávač třídy TODO: Přehrává pouze PCM prozatím.

BotFrameworkConfig

Třída, která definuje konfigurace pro objekt konektoru služby dialog pro použití back-endu služby Bot Framework.

CancellationDetails

Obsahuje podrobné informace o tom, proč byl výsledek zrušen.

CancellationDetailsBase

Obsahuje podrobné informace o tom, proč byl výsledek zrušen.

Connection

Připojení je třída proxy pro správu připojení ke službě Speech zadaného rozpoznávání. Ve výchozím nastavení služba Recognizer v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití připojení je volitelné a hlavně pro scénáře, ve kterých je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open() a ručně nastavit připojení předem před zahájením rozpoznávání v nástroji Recognizer přidruženém k tomuto připojení. Pokud se služba Recognizer potřebuje připojit nebo odpojit ke službě, nastaví nebo vypne připojení nezávisle. V takovém případě bude připojení upozorněno změnou stavu připojení prostřednictvím událostí Připojeno/Odpojeno. Přidáno ve verzi 1.2.1.

ConnectionEventArgs

Definuje datovou část pro události připojení, jako je Connected/Disconnected. Přidáno ve verzi 1.2.0

ConnectionMessage

ConnectionMessage představuje implementaci konkrétních zpráv odesílaných a přijatých ze služby Speech. Tyto zprávy jsou k dispozici pro účely ladění a neměly by se používat pro případy použití v produkčním prostředí se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté ze služby Speech se můžou bez předchozího upozornění měnit. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Provádí rozpoznávání řeči s oddělením reproduktoru od mikrofonu, souboru nebo jiných streamů zvukového vstupu a v důsledku toho přepíše text.

ConversationTranscriptionCanceledEventArgs

Definuje obsah funkce RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Definuje obsah události přepisu nebo přepisu konverzace.

ConversationTranscriptionResult

Definuje výsledek přepisu konverzace.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Definuje datovou část pro události relace, jako je start/konec rozpoznávání řeči.

ConversationTranslationResult

Výsledek překladu textu

ConversationTranslator

Připojte se ke konverzaci, odpojte ji nebo se k ní připojte.

Coordinate

Definuje souřadnici v 2D prostoru.

CustomCommandsConfig

Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu CustomCommands.

Diagnostics

Definuje rozhraní API diagnostiky pro správu výstupu konzoly přidaného ve verzi 1.21.0.

DialogServiceConfig

Třída, která definuje základní konfigurace pro konektor služby dialogových oken

DialogServiceConnector

Konektor služby dialogového okna

IntentRecognitionCanceledEventArgs

Definujte datovou část událostí zrušených výsledků rozpoznávání záměru.

IntentRecognitionEventArgs

Argumenty události rozpoznávání záměru

IntentRecognitionResult

Výsledek rozpoznávání záměru

IntentRecognizer

Rozpoznávání záměru

KeywordRecognitionModel

Představuje model rozpoznávání klíčových slov pro rozpoznávání, když uživatel říká klíčové slovo pro zahájení dalšího rozpoznávání řeči.

LanguageUnderstandingModel

Model language understanding

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Definuje obsah MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Definuje obsah události, která se přepíše nebo přepíše.

NoMatchDetails

Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch.

Participant

Představuje účastníka konverzace. Přidáno ve verzi 1.4.0

PhraseListGrammar

Umožňuje přidávání nových frází ke zlepšení rozpoznávání řeči.

Fráze přidané do rozpoznávání jsou efektivní na začátku dalšího rozpoznávání, nebo se při příštím připojení sady SpeechSDK ke službě SpeechSDK musí znovu připojit.

PronunciationAssessmentConfig

Konfigurace posouzení výslovnosti

PronunciationAssessmentResult

Výsledky hodnocení výslovnosti.

PropertyCollection

Představuje kolekci vlastností a jejich hodnot.

PullAudioInputStream

Představuje zvukový vstupní datový proud používaný pro vlastní konfigurace zvukového vstupu.

PullAudioInputStreamCallback

Abstraktní základní třída, která definuje metody zpětného volání (read() a close()) pro vlastní zvukové vstupní streamy).

PullAudioOutputStream

Představuje stream zvukového výstupu s podporou paměti používaný pro vlastní konfigurace zvukového výstupu.

PushAudioInputStream

Představuje stream zvukového vstupu s podporou paměti, který se používá pro vlastní konfigurace zvukového vstupu.

PushAudioOutputStream

Představuje zvukový výstupní datový proud používaný pro vlastní konfigurace zvukového výstupu.

PushAudioOutputStreamCallback

Abstraktní základní třída, která definuje metody zpětného volání (write() a close()) pro vlastní zvukové výstupní streamy).

RecognitionEventArgs

Definuje datovou část pro události relace, jako je start/konec rozpoznávání řeči.

RecognitionResult

Definuje výsledek rozpoznávání řeči.

Recognizer

Definuje základní třídu Recognizer, která obsahuje hlavně běžné obslužné rutiny událostí.

ServiceEventArgs

Definuje datovou část pro událost zprávy služby přidanou ve verzi 1.9.0.

SessionEventArgs

Definuje obsah událostí relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Konfigurace zdrojového jazyka

SpeakerAudioDestination

Představuje cíl přehrávání zvuku mluvčího, který funguje jenom v prohlížeči. Poznámka: Sada SDK se pokusí použít rozšíření zdroje médií k přehrávání zvuku. Formát Mp3 má lepší podporu pro Microsoft Edge, Chrome a Safari (desktop), takže je lepší určit formát mp3 pro přehrávání.

SpeakerIdentificationModel

Definuje třídu SpeakerIdentificationModel pro model rozpoznávání mluvčího obsahuje sadu profilů, pro které se mají identifikovat mluvčí.

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Výstupní formát

SpeakerRecognizer

Definuje třídu SpeakerRecognizer pro operace zpracování rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).

SpeakerVerificationModel

Definuje třídu SpeakerVerificationModel pro model rozpoznávání mluvčího obsahuje profil, proti kterému se má ověřit mluvčí.

SpeechConfig

Konfigurace řeči

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Definuje obsah rozpoznávání a rozpoznané události řeči.

SpeechRecognitionResult

Definuje výsledek rozpoznávání řeči.

SpeechRecognizer

Provádí rozpoznávání řeči z mikrofonu, souboru nebo jiných zvukových vstupních datových proudů a v důsledku toho se přepíše text.

SpeechSynthesisBookmarkEventArgs

Definuje obsah události záložky syntézy řeči.

SpeechSynthesisEventArgs

Definuje obsah událostí syntézy řeči.

SpeechSynthesisResult

Definuje výsledek syntézy řeči.

SpeechSynthesisVisemeEventArgs

Definuje obsah události syntézy řeči viseme.

SpeechSynthesisWordBoundaryEventArgs

Definuje obsah události hranice slova syntézy řeči.

SpeechSynthesizer

Definuje třídu SpeechSynthesizer pro převod textu na řeč. Aktualizováno ve verzi 1.16.0

SpeechTranslationConfig

Konfigurace překladu řeči

SynthesisResult

Základní třída pro výsledky syntézy

SynthesisVoicesResult

Definuje výsledek syntézy řeči.

Synthesizer
TranslationRecognitionCanceledEventArgs

Definujte datovou část událostí zrušených výsledků rozpoznávání řeči.

TranslationRecognitionEventArgs

Argumenty události výsledku překladu textu

TranslationRecognitionResult

Výsledek překladu textu

TranslationRecognizer

Rozpoznávání překladu

TranslationSynthesisEventArgs

Argumenty události syntézy překladu

TranslationSynthesisResult

Definuje výsledek syntézy překladu, tj. hlasový výstup přeloženého textu v cílovém jazyce.

Translations

Představuje kolekci parametrů a jejich hodnot.

TurnStatusReceivedEventArgs

Definuje obsah přijatých zpráv nebo událostí.

User
VoiceInfo

Informace o hlasu syntézy řeči přidány ve verzi 1.20.0.

VoiceProfile

Definuje třídu hlasového profilu pro rozpoznávání mluvčího.

VoiceProfileCancellationDetails
VoiceProfileClient

Definuje třídu VoiceProfileClient pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Výstupní formát

VoiceProfilePhraseResult

Výstupní formát

VoiceProfileResult

Výstupní formát

Rozhraní

CancellationEventArgs
ConversationInfo
IParticipant

Představuje účastníka konverzace. Přidáno ve verzi 1.4.0

IPlayer

Představuje rozhraní zvukového přehrávače pro ovládání přehrávání zvuku, například pozastavení, obnovení atd.

IVoiceJson
MeetingInfo
VoiceSignature

Výčty

AudioFormatTag
CancellationErrorCode

Definuje kód chyby v případě, že CancellationReason je Chyba. Přidáno ve verzi 1.1.0.

CancellationReason

Definuje možné důvody, proč může být výsledek rozpoznávání zrušen.

LanguageIdMode

Režim identifikace jazyka

LogLevel
NoMatchReason

Definuje možné důvody, proč se výsledek rozpoznávání nemusí rozpoznat.

OutputFormat

Definujte výstupní formáty služby Rozpoznávání řeči.

ParticipantChangedReason
ProfanityOption

Možnost vulgárních výrazů. Přidáno ve verzi 1.7.0.

PronunciationAssessmentGradingSystem

Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.15.0

PronunciationAssessmentGranularity

Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.15.0

PropertyId

Definuje ID vlastností řeči.

ResultReason

Definuje možné důvody, proč se může vygenerovat výsledek rozpoznávání.

ServicePropertyChannel

Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Definuje typ hranice události hranice syntézy řeči.

SpeechSynthesisOutputFormat

Definujte formáty zvukového výstupu syntézy řeči. SpeechSynthesisOutputFormat aktualizováno ve verzi 1.17.0

VoiceProfileType

Výstupní formát