microsoft-cognitiveservices-speech-sdk package

Referens

Klasser

ActivityReceivedEventArgs	Definierar innehållet i mottagna meddelanden/händelser.
AudioConfig	Representerar konfiguration av ljudindata som används för att ange vilken typ av indata som ska användas (mikrofon, fil, ström).
AudioInputStream	Representerar ljudindataström som används för anpassade ljudindatakonfigurationer.
AudioOutputStream	Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer.
AudioStreamFormat	Representerar ljudströmformat som används för anpassade ljudindatakonfigurationer.
AutoDetectSourceLanguageConfig	Automatisk identifiering av språkkonfiguration.
AutoDetectSourceLanguageResult	Utdataformat
AvatarConfig	Definierar konfigurationen av den talande avataren.
AvatarEventArgs	Definierar innehåll för att prata avatarhändelser.
AvatarSynthesizer	Definierar avatarsyntesen.
AvatarVideoFormat	Definierar avatarutdatavideoformatet.
AvatarWebRTCConnectionResult	Definierar avatarens WebRTC-anslutningsresultat.
BaseAudioPlayer	Base audio player class TODO: Spelar bara PCM för tillfället.
BotFrameworkConfig	Klass som definierar konfigurationer för dialogtjänstanslutningsobjektet för att använda en Bot Framework-serverdel.
CancellationDetails	Innehåller detaljerad information om varför ett resultat avbröts.
CancellationDetailsBase	Innehåller detaljerad information om varför ett resultat avbröts.
Connection	Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en identifierare autonomt anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Användning av Anslutning är valfritt, och främst för scenarier där finjustering av programbeteende baserat på anslutningsstatus krävs. Användare kan också anropa Open() för att manuellt konfigurera en anslutning i förväg innan de startar igenkänningen på den identifierare som är associerad med den här anslutningen. Om identifieraren behöver ansluta eller koppla från till tjänsten konfigureras eller stängs anslutningen av oberoende av varandra. I det här fallet meddelas anslutningen genom ändring av anslutningsstatus via anslutna/frånkopplade händelser. Har lagts till i version 1.2.1.
ConnectionEventArgs	Definierar nyttolast för anslutningshändelser som Ansluten/Frånkopplad. Har lagts till i version 1.2.0
ConnectionMessage	ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Taltjänsten kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.
ConversationTranscriber	Utför taligenkänning med talaravgränsning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat.
ConversationTranscriptionCanceledEventArgs	Definierar innehållet i en RecognitionErrorEvent.
ConversationTranscriptionEventArgs	Definierar innehållet i en transkriberad/transkriberad konversationshändelse.
ConversationTranscriptionResult	Definierar resultatet av konversationstranskription.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Definierar nyttolast för sessionshändelser som Speech Start/End Detected
ConversationTranslationResult	Översättningstextresultat.
ConversationTranslator	Anslut, lämna eller anslut till en konversation.
Coordinate	Definierar en koordinat i 2D-blanksteg.
CustomCommandsConfig	Klass som definierar konfigurationer för dialogtjänstanslutningsobjektet för att använda en CustomCommands-serverdel.
Diagnostics	Definierar diagnostik-API för hantering av konsolutdata som lagts till i version 1.21.0
DialogServiceConfig	Klass som definierar baskonfigurationer för dialogtjänstanslutning
DialogServiceConnector	Anslutningsprogram för dialogtjänst
IntentRecognitionCanceledEventArgs	Definiera nyttolasten för avbrutna resultathändelser för avsiktsigenkänning.
IntentRecognitionEventArgs	Argument för resultathändelse för avsiktsigenkänning.
IntentRecognitionResult	Resultat av avsiktsigenkänning.
IntentRecognizer	Avsiktsigenkänning.
KeywordRecognitionModel	Representerar en nyckelordsigenkänningsmodell för att identifiera när användaren säger ett nyckelord för att initiera ytterligare taligenkänning.
LanguageUnderstandingModel	Språktolkningsmodell
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	Definierar innehållet i en MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	Definierar innehållet i mötestranskriberad/transkriberad händelse.
NoMatchDetails	Innehåller detaljerad information för NoMatch-igenkänningsresultat.
Participant	Representerar en deltagare i en konversation. Har lagts till i version 1.4.0
PhraseListGrammar	Tillåter tillägg av nya fraser för att förbättra taligenkänningen. Fraser som läggs till i identifieraren gäller i början av nästa igenkänning, eller nästa gång SpeechSDK måste återansluta till taltjänsten.
PronunciationAssessmentConfig	Konfiguration av uttalsutvärdering.
PronunciationAssessmentResult	Uttalsutvärderingsresultat.
PropertyCollection	Representerar en samling egenskaper och deras värden.
PullAudioInputStream	Representerar ljudindataström som används för anpassade ljudindatakonfigurationer.
PullAudioInputStreamCallback	En abstrakt basklass som definierar motringningsmetoder (read() och close()) för anpassade ljudindataströmmar).
PullAudioOutputStream	Representerar den minnesstödda utdataströmmen för push-ljud som används för anpassade ljudutdatakonfigurationer.
PushAudioInputStream	Representerar den minnesbaserade push-ljudindataströmmen som används för anpassade ljudindatakonfigurationer.
PushAudioOutputStream	Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer.
PushAudioOutputStreamCallback	En abstrakt basklass som definierar motringningsmetoder (write() och close()) för anpassade ljudutdataströmmar.
RecognitionEventArgs	Definierar nyttolast för sessionshändelser som Speech Start/End Detected
RecognitionResult	Definierar resultatet av taligenkänning.
Recognizer	Definierar basklassen Recognizer som huvudsakligen innehåller vanliga händelsehanterare.
ServiceEventArgs	Definierar nyttolasten för alla servicemeddelandehändelser som har lagts till i version 1.9.0
SessionEventArgs	Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.
SourceLanguageConfig	Konfiguration av källspråk.
SpeakerAudioDestination	Representerar ljudmålet för talaruppspelning, som bara fungerar i webbläsaren. Obs! SDK:et försöker använda Media Source Extensions för att spela upp ljud. Mp3-format har bättre stöd för Microsoft Edge, Chrome och Safari (skrivbord), så det är bättre att ange mp3-format för uppspelning.
SpeakerIdentificationModel	Definierar Klassen SpeakerIdentificationModel för modellen för talarigenkänning innehåller en uppsättning profiler som du kan identifiera talare mot
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	Utdataformat
SpeakerRecognizer	Definierar Klassen SpeakerRecognizer för Talarigenkänning Hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile)
SpeakerVerificationModel	Definierar Klassen SpeakerVerificationModel för talarigenkänningsmodellen innehåller en profil som du kan verifiera en talare mot
SpeechConfig	Talkonfiguration.
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	Definierar innehållet i taligenkänning/identifierad händelse.
SpeechRecognitionResult	Definierar resultatet av taligenkänning.
SpeechRecognizer	Utför taligenkänning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat.
SpeechSynthesisBookmarkEventArgs	Definierar innehållet i talsyntesens bokmärkeshändelse.
SpeechSynthesisEventArgs	Definierar innehållet i talsynteshändelser.
SpeechSynthesisResult	Definierar resultatet av talsyntesen.
SpeechSynthesisVisemeEventArgs	Definierar innehållet i talsyntesens viseme-händelse.
SpeechSynthesisWordBoundaryEventArgs	Definierar innehållet i talsyntesens ordgränshändelse.
SpeechSynthesizer	Definierar klassen SpeechSynthesizer för text till tal. Uppdaterad i version 1.16.0
SpeechTranslationConfig	Konfiguration av talöversättning.
SynthesisResult	Basklass för syntesresultat
SynthesisVoicesResult	Definierar resultatet av talsyntesen.
Synthesizer
TranslationRecognitionCanceledEventArgs	Definiera nyttolasten för avbrutna resultathändelser för taligenkänning.
TranslationRecognitionEventArgs	Argument för översättningstextresultathändelse.
TranslationRecognitionResult	Översättningstextresultat.
TranslationRecognizer	Översättningsigenkänning
TranslationSynthesisEventArgs	Argument för översättningssynteshändelse
TranslationSynthesisResult	Definierar resultatet av översättningssyntesen, dvs. röstutdata för den översatta texten på målspråket.
Translations	Representerar en samling parametrar och deras värden.
TurnStatusReceivedEventArgs	Definierar innehållet i mottagna meddelanden/händelser.
User
VoiceInfo	Information om talsyntesröst som lagts till i version 1.20.0.
VoiceProfile	Definierar röstprofilklass för talarigenkänning
VoiceProfileCancellationDetails
VoiceProfileClient	Definierar Klassen VoiceProfileClient för talarigenkänning hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile)
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	Utdataformat
VoiceProfilePhraseResult	Utdataformat
VoiceProfileResult	Utdataformat

Gränssnitt

CancellationEventArgs
ConversationInfo
IParticipant	Representerar en deltagare i en konversation. Har lagts till i version 1.4.0
IPlayer	Representerar ljudspelarens gränssnitt för att styra ljuduppspelningen, till exempel pausa, återuppta osv.
IVoiceJson
MeetingInfo
VoiceSignature

Uppräkningar

AudioFormatTag
CancellationErrorCode	Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.
CancellationReason	Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.
LanguageIdMode	Språkidentifieringsläge
LogLevel
NoMatchReason	Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.
OutputFormat	Definiera utdataformat för Taligenkänning.
ParticipantChangedReason
ProfanityOption	Alternativ för svordomar. Har lagts till i version 1.7.0.
PronunciationAssessmentGradingSystem	Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.15.0
PronunciationAssessmentGranularity	Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.15.0
PropertyId	Definierar talegenskaps-ID:t.
ResultReason	Definierar möjliga orsaker till att ett igenkänningsresultat kan genereras.
ServicePropertyChannel	Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	Definierar gränstypen för talsyntesgränshändelsen.
SpeechSynthesisOutputFormat	Definiera ljudutdataformat för talsyntes. SpeechSynthesisOutputFormat uppdaterad i version 1.17.0
VoiceProfileType	Utdataformat

Dela via

microsoft-cognitiveservices-speech-sdk package

Klasser

Gränssnitt

Uppräkningar

Ytterligare resurser