Dela via


microsoft-cognitiveservices-speech-sdk package

Klasser

ActivityReceivedEventArgs

Definierar innehållet i mottagna meddelanden/händelser.

AudioConfig

Representerar konfiguration av ljudindata som används för att ange vilken typ av indata som ska användas (mikrofon, fil, ström).

AudioInputStream

Representerar ljudindataström som används för anpassade ljudindatakonfigurationer.

AudioOutputStream

Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer.

AudioStreamFormat

Representerar ljudströmformat som används för anpassade ljudindatakonfigurationer.

AutoDetectSourceLanguageConfig

Automatisk identifiering av språkkonfiguration.

AutoDetectSourceLanguageResult

Utdataformat

AvatarConfig

Definierar konfigurationen av den talande avataren.

AvatarEventArgs

Definierar innehåll för att prata avatarhändelser.

AvatarSynthesizer

Definierar avatarsyntesen.

AvatarVideoFormat

Definierar avatarutdatavideoformatet.

AvatarWebRTCConnectionResult

Definierar avatarens WebRTC-anslutningsresultat.

BaseAudioPlayer

Base audio player class TODO: Spelar bara PCM för tillfället.

BotFrameworkConfig

Klass som definierar konfigurationer för dialogtjänstanslutningsobjektet för att använda en Bot Framework-serverdel.

CancellationDetails

Innehåller detaljerad information om varför ett resultat avbröts.

CancellationDetailsBase

Innehåller detaljerad information om varför ett resultat avbröts.

Connection

Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en identifierare autonomt anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Användning av Anslutning är valfritt, och främst för scenarier där finjustering av programbeteende baserat på anslutningsstatus krävs. Användare kan också anropa Open() för att manuellt konfigurera en anslutning i förväg innan de startar igenkänningen på den identifierare som är associerad med den här anslutningen. Om identifieraren behöver ansluta eller koppla från till tjänsten konfigureras eller stängs anslutningen av oberoende av varandra. I det här fallet meddelas anslutningen genom ändring av anslutningsstatus via anslutna/frånkopplade händelser. Har lagts till i version 1.2.1.

ConnectionEventArgs

Definierar nyttolast för anslutningshändelser som Ansluten/Frånkopplad. Har lagts till i version 1.2.0

ConnectionMessage

ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Taltjänsten kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Utför taligenkänning med talaravgränsning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat.

ConversationTranscriptionCanceledEventArgs

Definierar innehållet i en RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Definierar innehållet i en transkriberad/transkriberad konversationshändelse.

ConversationTranscriptionResult

Definierar resultatet av konversationstranskription.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Definierar nyttolast för sessionshändelser som Speech Start/End Detected

ConversationTranslationResult

Översättningstextresultat.

ConversationTranslator

Anslut, lämna eller anslut till en konversation.

Coordinate

Definierar en koordinat i 2D-blanksteg.

CustomCommandsConfig

Klass som definierar konfigurationer för dialogtjänstanslutningsobjektet för att använda en CustomCommands-serverdel.

Diagnostics

Definierar diagnostik-API för hantering av konsolutdata som lagts till i version 1.21.0

DialogServiceConfig

Klass som definierar baskonfigurationer för dialogtjänstanslutning

DialogServiceConnector

Anslutningsprogram för dialogtjänst

IntentRecognitionCanceledEventArgs

Definiera nyttolasten för avbrutna resultathändelser för avsiktsigenkänning.

IntentRecognitionEventArgs

Argument för resultathändelse för avsiktsigenkänning.

IntentRecognitionResult

Resultat av avsiktsigenkänning.

IntentRecognizer

Avsiktsigenkänning.

KeywordRecognitionModel

Representerar en nyckelordsigenkänningsmodell för att identifiera när användaren säger ett nyckelord för att initiera ytterligare taligenkänning.

LanguageUnderstandingModel

Språktolkningsmodell

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Definierar innehållet i en MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Definierar innehållet i mötestranskriberad/transkriberad händelse.

NoMatchDetails

Innehåller detaljerad information för NoMatch-igenkänningsresultat.

Participant

Representerar en deltagare i en konversation. Har lagts till i version 1.4.0

PhraseListGrammar

Tillåter tillägg av nya fraser för att förbättra taligenkänningen.

Fraser som läggs till i identifieraren gäller i början av nästa igenkänning, eller nästa gång SpeechSDK måste återansluta till taltjänsten.

PronunciationAssessmentConfig

Konfiguration av uttalsutvärdering.

PronunciationAssessmentResult

Uttalsutvärderingsresultat.

PropertyCollection

Representerar en samling egenskaper och deras värden.

PullAudioInputStream

Representerar ljudindataström som används för anpassade ljudindatakonfigurationer.

PullAudioInputStreamCallback

En abstrakt basklass som definierar motringningsmetoder (read() och close()) för anpassade ljudindataströmmar).

PullAudioOutputStream

Representerar den minnesstödda utdataströmmen för push-ljud som används för anpassade ljudutdatakonfigurationer.

PushAudioInputStream

Representerar den minnesbaserade push-ljudindataströmmen som används för anpassade ljudindatakonfigurationer.

PushAudioOutputStream

Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer.

PushAudioOutputStreamCallback

En abstrakt basklass som definierar motringningsmetoder (write() och close()) för anpassade ljudutdataströmmar.

RecognitionEventArgs

Definierar nyttolast för sessionshändelser som Speech Start/End Detected

RecognitionResult

Definierar resultatet av taligenkänning.

Recognizer

Definierar basklassen Recognizer som huvudsakligen innehåller vanliga händelsehanterare.

ServiceEventArgs

Definierar nyttolasten för alla servicemeddelandehändelser som har lagts till i version 1.9.0

SessionEventArgs

Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Konfiguration av källspråk.

SpeakerAudioDestination

Representerar ljudmålet för talaruppspelning, som bara fungerar i webbläsaren. Obs! SDK:et försöker använda Media Source Extensions för att spela upp ljud. Mp3-format har bättre stöd för Microsoft Edge, Chrome och Safari (skrivbord), så det är bättre att ange mp3-format för uppspelning.

SpeakerIdentificationModel

Definierar Klassen SpeakerIdentificationModel för modellen för talarigenkänning innehåller en uppsättning profiler som du kan identifiera talare mot

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Utdataformat

SpeakerRecognizer

Definierar Klassen SpeakerRecognizer för Talarigenkänning Hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile)

SpeakerVerificationModel

Definierar Klassen SpeakerVerificationModel för talarigenkänningsmodellen innehåller en profil som du kan verifiera en talare mot

SpeechConfig

Talkonfiguration.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Definierar innehållet i taligenkänning/identifierad händelse.

SpeechRecognitionResult

Definierar resultatet av taligenkänning.

SpeechRecognizer

Utför taligenkänning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat.

SpeechSynthesisBookmarkEventArgs

Definierar innehållet i talsyntesens bokmärkeshändelse.

SpeechSynthesisEventArgs

Definierar innehållet i talsynteshändelser.

SpeechSynthesisResult

Definierar resultatet av talsyntesen.

SpeechSynthesisVisemeEventArgs

Definierar innehållet i talsyntesens viseme-händelse.

SpeechSynthesisWordBoundaryEventArgs

Definierar innehållet i talsyntesens ordgränshändelse.

SpeechSynthesizer

Definierar klassen SpeechSynthesizer för text till tal. Uppdaterad i version 1.16.0

SpeechTranslationConfig

Konfiguration av talöversättning.

SynthesisResult

Basklass för syntesresultat

SynthesisVoicesResult

Definierar resultatet av talsyntesen.

Synthesizer
TranslationRecognitionCanceledEventArgs

Definiera nyttolasten för avbrutna resultathändelser för taligenkänning.

TranslationRecognitionEventArgs

Argument för översättningstextresultathändelse.

TranslationRecognitionResult

Översättningstextresultat.

TranslationRecognizer

Översättningsigenkänning

TranslationSynthesisEventArgs

Argument för översättningssynteshändelse

TranslationSynthesisResult

Definierar resultatet av översättningssyntesen, dvs. röstutdata för den översatta texten på målspråket.

Translations

Representerar en samling parametrar och deras värden.

TurnStatusReceivedEventArgs

Definierar innehållet i mottagna meddelanden/händelser.

User
VoiceInfo

Information om talsyntesröst som lagts till i version 1.20.0.

VoiceProfile

Definierar röstprofilklass för talarigenkänning

VoiceProfileCancellationDetails
VoiceProfileClient

Definierar Klassen VoiceProfileClient för talarigenkänning hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Utdataformat

VoiceProfilePhraseResult

Utdataformat

VoiceProfileResult

Utdataformat

Gränssnitt

CancellationEventArgs
ConversationInfo
IParticipant

Representerar en deltagare i en konversation. Har lagts till i version 1.4.0

IPlayer

Representerar ljudspelarens gränssnitt för att styra ljuduppspelningen, till exempel pausa, återuppta osv.

IVoiceJson
MeetingInfo
VoiceSignature

Uppräkningar

AudioFormatTag
CancellationErrorCode

Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.

CancellationReason

Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.

LanguageIdMode

Språkidentifieringsläge

LogLevel
NoMatchReason

Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.

OutputFormat

Definiera utdataformat för Taligenkänning.

ParticipantChangedReason
ProfanityOption

Alternativ för svordomar. Har lagts till i version 1.7.0.

PronunciationAssessmentGradingSystem

Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.15.0

PronunciationAssessmentGranularity

Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.15.0

PropertyId

Definierar talegenskaps-ID:t.

ResultReason

Definierar möjliga orsaker till att ett igenkänningsresultat kan genereras.

ServicePropertyChannel

Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Definierar gränstypen för talsyntesgränshändelsen.

SpeechSynthesisOutputFormat

Definiera ljudutdataformat för talsyntes. SpeechSynthesisOutputFormat uppdaterad i version 1.17.0

VoiceProfileType

Utdataformat