microsoft-cognitiveservices-speech-sdk package
Klasser
ActivityReceivedEventArgs |
Definierar innehållet i mottagna meddelanden/händelser. |
AudioConfig |
Representerar konfiguration av ljudindata som används för att ange vilken typ av indata som ska användas (mikrofon, fil, ström). |
AudioInputStream |
Representerar ljudindataström som används för anpassade ljudindatakonfigurationer. |
AudioOutputStream |
Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer. |
AudioStreamFormat |
Representerar ljudströmformat som används för anpassade ljudindatakonfigurationer. |
AutoDetectSourceLanguageConfig |
Automatisk identifiering av språkkonfiguration. |
AutoDetectSourceLanguageResult |
Utdataformat |
AvatarConfig |
Definierar konfigurationen av den talande avataren. |
AvatarEventArgs |
Definierar innehåll för att prata avatarhändelser. |
AvatarSynthesizer |
Definierar avatarsyntesen. |
AvatarVideoFormat |
Definierar avatarutdatavideoformatet. |
AvatarWebRTCConnectionResult |
Definierar avatarens WebRTC-anslutningsresultat. |
BaseAudioPlayer |
Base audio player class TODO: Spelar bara PCM för tillfället. |
BotFrameworkConfig |
Klass som definierar konfigurationer för dialogtjänstanslutningsobjektet för att använda en Bot Framework-serverdel. |
CancellationDetails |
Innehåller detaljerad information om varför ett resultat avbröts. |
CancellationDetailsBase |
Innehåller detaljerad information om varför ett resultat avbröts. |
Connection |
Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en identifierare autonomt anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Användning av Anslutning är valfritt, och främst för scenarier där finjustering av programbeteende baserat på anslutningsstatus krävs. Användare kan också anropa Open() för att manuellt konfigurera en anslutning i förväg innan de startar igenkänningen på den identifierare som är associerad med den här anslutningen. Om identifieraren behöver ansluta eller koppla från till tjänsten konfigureras eller stängs anslutningen av oberoende av varandra. I det här fallet meddelas anslutningen genom ändring av anslutningsstatus via anslutna/frånkopplade händelser. Har lagts till i version 1.2.1. |
ConnectionEventArgs |
Definierar nyttolast för anslutningshändelser som Ansluten/Frånkopplad. Har lagts till i version 1.2.0 |
ConnectionMessage |
ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Taltjänsten kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.11.0. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationParticipantsChangedEventArgs |
Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationTranscriber |
Utför taligenkänning med talaravgränsning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat. |
ConversationTranscriptionCanceledEventArgs |
Definierar innehållet i en RecognitionErrorEvent. |
ConversationTranscriptionEventArgs |
Definierar innehållet i en transkriberad/transkriberad konversationshändelse. |
ConversationTranscriptionResult |
Definierar resultatet av konversationstranskription. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Definierar nyttolast för sessionshändelser som Speech Start/End Detected |
ConversationTranslationResult |
Översättningstextresultat. |
ConversationTranslator |
Anslut, lämna eller anslut till en konversation. |
Coordinate |
Definierar en koordinat i 2D-blanksteg. |
CustomCommandsConfig |
Klass som definierar konfigurationer för dialogtjänstanslutningsobjektet för att använda en CustomCommands-serverdel. |
Diagnostics |
Definierar diagnostik-API för hantering av konsolutdata som lagts till i version 1.21.0 |
DialogServiceConfig |
Klass som definierar baskonfigurationer för dialogtjänstanslutning |
DialogServiceConnector |
Anslutningsprogram för dialogtjänst |
IntentRecognitionCanceledEventArgs |
Definiera nyttolasten för avbrutna resultathändelser för avsiktsigenkänning. |
IntentRecognitionEventArgs |
Argument för resultathändelse för avsiktsigenkänning. |
IntentRecognitionResult |
Resultat av avsiktsigenkänning. |
IntentRecognizer |
Avsiktsigenkänning. |
KeywordRecognitionModel |
Representerar en nyckelordsigenkänningsmodell för att identifiera när användaren säger ett nyckelord för att initiera ytterligare taligenkänning. |
LanguageUnderstandingModel |
Språktolkningsmodell |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
Definierar innehållet i en MeetingTranscriptionCanceledEvent. |
MeetingTranscriptionEventArgs |
Definierar innehållet i mötestranskriberad/transkriberad händelse. |
NoMatchDetails |
Innehåller detaljerad information för NoMatch-igenkänningsresultat. |
Participant |
Representerar en deltagare i en konversation. Har lagts till i version 1.4.0 |
PhraseListGrammar |
Tillåter tillägg av nya fraser för att förbättra taligenkänningen. Fraser som läggs till i identifieraren gäller i början av nästa igenkänning, eller nästa gång SpeechSDK måste återansluta till taltjänsten. |
PronunciationAssessmentConfig |
Konfiguration av uttalsutvärdering. |
PronunciationAssessmentResult |
Uttalsutvärderingsresultat. |
PropertyCollection |
Representerar en samling egenskaper och deras värden. |
PullAudioInputStream |
Representerar ljudindataström som används för anpassade ljudindatakonfigurationer. |
PullAudioInputStreamCallback |
En abstrakt basklass som definierar motringningsmetoder (read() och close()) för anpassade ljudindataströmmar). |
PullAudioOutputStream |
Representerar den minnesstödda utdataströmmen för push-ljud som används för anpassade ljudutdatakonfigurationer. |
PushAudioInputStream |
Representerar den minnesbaserade push-ljudindataströmmen som används för anpassade ljudindatakonfigurationer. |
PushAudioOutputStream |
Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer. |
PushAudioOutputStreamCallback |
En abstrakt basklass som definierar motringningsmetoder (write() och close()) för anpassade ljudutdataströmmar. |
RecognitionEventArgs |
Definierar nyttolast för sessionshändelser som Speech Start/End Detected |
RecognitionResult |
Definierar resultatet av taligenkänning. |
Recognizer |
Definierar basklassen Recognizer som huvudsakligen innehåller vanliga händelsehanterare. |
ServiceEventArgs |
Definierar nyttolasten för alla servicemeddelandehändelser som har lagts till i version 1.9.0 |
SessionEventArgs |
Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped. |
SourceLanguageConfig |
Konfiguration av källspråk. |
SpeakerAudioDestination |
Representerar ljudmålet för talaruppspelning, som bara fungerar i webbläsaren. Obs! SDK:et försöker använda Media Source Extensions för att spela upp ljud. Mp3-format har bättre stöd för Microsoft Edge, Chrome och Safari (skrivbord), så det är bättre att ange mp3-format för uppspelning. |
SpeakerIdentificationModel |
Definierar Klassen SpeakerIdentificationModel för modellen för talarigenkänning innehåller en uppsättning profiler som du kan identifiera talare mot |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
Utdataformat |
SpeakerRecognizer |
Definierar Klassen SpeakerRecognizer för Talarigenkänning Hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile) |
SpeakerVerificationModel |
Definierar Klassen SpeakerVerificationModel för talarigenkänningsmodellen innehåller en profil som du kan verifiera en talare mot |
SpeechConfig |
Talkonfiguration. |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
Definierar innehållet i taligenkänning/identifierad händelse. |
SpeechRecognitionResult |
Definierar resultatet av taligenkänning. |
SpeechRecognizer |
Utför taligenkänning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat. |
SpeechSynthesisBookmarkEventArgs |
Definierar innehållet i talsyntesens bokmärkeshändelse. |
SpeechSynthesisEventArgs |
Definierar innehållet i talsynteshändelser. |
SpeechSynthesisResult |
Definierar resultatet av talsyntesen. |
SpeechSynthesisVisemeEventArgs |
Definierar innehållet i talsyntesens viseme-händelse. |
SpeechSynthesisWordBoundaryEventArgs |
Definierar innehållet i talsyntesens ordgränshändelse. |
SpeechSynthesizer |
Definierar klassen SpeechSynthesizer för text till tal. Uppdaterad i version 1.16.0 |
SpeechTranslationConfig |
Konfiguration av talöversättning. |
SynthesisResult |
Basklass för syntesresultat |
SynthesisVoicesResult |
Definierar resultatet av talsyntesen. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
Definiera nyttolasten för avbrutna resultathändelser för taligenkänning. |
TranslationRecognitionEventArgs |
Argument för översättningstextresultathändelse. |
TranslationRecognitionResult |
Översättningstextresultat. |
TranslationRecognizer |
Översättningsigenkänning |
TranslationSynthesisEventArgs |
Argument för översättningssynteshändelse |
TranslationSynthesisResult |
Definierar resultatet av översättningssyntesen, dvs. röstutdata för den översatta texten på målspråket. |
Translations |
Representerar en samling parametrar och deras värden. |
TurnStatusReceivedEventArgs |
Definierar innehållet i mottagna meddelanden/händelser. |
User | |
VoiceInfo |
Information om talsyntesröst som lagts till i version 1.20.0. |
VoiceProfile |
Definierar röstprofilklass för talarigenkänning |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
Definierar Klassen VoiceProfileClient för talarigenkänning hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile) |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
Utdataformat |
VoiceProfilePhraseResult |
Utdataformat |
VoiceProfileResult |
Utdataformat |
Gränssnitt
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
Representerar en deltagare i en konversation. Har lagts till i version 1.4.0 |
IPlayer |
Representerar ljudspelarens gränssnitt för att styra ljuduppspelningen, till exempel pausa, återuppta osv. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
Uppräkningar
AudioFormatTag | |
CancellationErrorCode |
Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0. |
CancellationReason |
Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas. |
LanguageIdMode |
Språkidentifieringsläge |
LogLevel | |
NoMatchReason |
Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras. |
OutputFormat |
Definiera utdataformat för Taligenkänning. |
ParticipantChangedReason | |
ProfanityOption |
Alternativ för svordomar. Har lagts till i version 1.7.0. |
PronunciationAssessmentGradingSystem |
Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.15.0 |
PronunciationAssessmentGranularity |
Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.15.0 |
PropertyId |
Definierar talegenskaps-ID:t. |
ResultReason |
Definierar möjliga orsaker till att ett igenkänningsresultat kan genereras. |
ServicePropertyChannel |
Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.7.0. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
Definierar gränstypen för talsyntesgränshändelsen. |
SpeechSynthesisOutputFormat |
Definiera ljudutdataformat för talsyntes. SpeechSynthesisOutputFormat uppdaterad i version 1.17.0 |
VoiceProfileType |
Utdataformat |