Dela via


microsoft-cognitiveservices-speech-sdk package

Klasser

ActivityReceivedEventArgs

Definierar innehållet i mottagna meddelanden/händelser.

AudioConfig

Representerar konfiguration av ljudindata som används för att ange vilken typ av indata som ska användas (mikrofon, fil, ström).

AudioInputStream

Representerar ljudindataström som används för anpassade ljudindatakonfigurationer.

AudioOutputStream

Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer.

AudioStreamFormat

Representerar ljudströmformat som används för anpassade konfigurationer av ljudindata.

AutoDetectSourceLanguageConfig

Automatisk identifiering av språkkonfiguration.

AutoDetectSourceLanguageResult

Utdataformat

AvatarConfig

Definierar den talande avatarkonfigurationen.

AvatarEventArgs

Definierar innehåll för talande avatarhändelser.

AvatarSynthesizer

Definierar avatarsyntesen.

AvatarVideoFormat

Definierar avatarutdatavideoformatet.

AvatarWebRTCConnectionResult

Definierar webRTC-anslutningsresultatet för avataren.

BaseAudioPlayer

Base audio player class TODO: Spelar bara PCM för tillfället.

BotFrameworkConfig

Klass som definierar konfigurationer för dialogtjänstens anslutningsobjekt för användning av en Bot Framework-serverdel.

CancellationDetails

Innehåller detaljerad information om varför ett resultat avbröts.

CancellationDetailsBase

Innehåller detaljerad information om varför ett resultat avbröts.

Connection

Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en igenkännare anslutningen till tjänsten när det behövs. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Användning av Anslutning är valfritt, och främst för scenarier där finjustering av programbeteende baserat på anslutningsstatus krävs. Användare kan också anropa Open() för att manuellt konfigurera en anslutning i förväg innan de startar igenkänningen av den identifierare som är associerad med den här anslutningen. Om identifieraren behöver ansluta eller koppla från till tjänsten konfigureras eller stängs anslutningen av oberoende av varandra. I det här fallet meddelas anslutningen genom att anslutningsstatusen ändras via anslutna/frånkopplade händelser. Har lagts till i version 1.2.1.

ConnectionEventArgs

Definierar nyttolasten för anslutningshändelser som Ansluten/Frånkopplad. Har lagts till i version 1.2.0

ConnectionMessage

ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Speech Service kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Utför taligenkänning med talaravgränsning från mikrofon, fil eller andra ljudindataströmmar och transkriberas text som resultat.

ConversationTranscriptionCanceledEventArgs

Definierar innehållet i en RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Definierar innehållet i en transkriberad/transkriberad konversationshändelse.

ConversationTranscriptionResult

Definierar resultatet av samtalstranskription.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Definierar nyttolasten för sessionshändelser som Speech Start/End Detected

ConversationTranslationResult

Översättningstextresultat.

ConversationTranslator

Anslut, lämna eller anslut till en konversation.

Coordinate

Definierar en koordinat i 2D-blanksteg.

CustomCommandsConfig

Klass som definierar konfigurationer för dialogtjänstens anslutningsobjekt för att använda en CustomCommands-serverdel.

Diagnostics

Definierar diagnostik-API för att hantera konsolutdata som lagts till i version 1.21.0

DialogServiceConfig

Klass som definierar baskonfigurationer för dialogtjänstanslutning

DialogServiceConnector

Dialogtjänstanslutning

IntentRecognitionCanceledEventArgs

Definiera nyttolasten för avbrutna resultathändelser för avsiktsigenkänning.

IntentRecognitionEventArgs

Resultathändelseargument för avsiktsigenkänning.

IntentRecognitionResult

Resultat av avsiktsigenkänning.

IntentRecognizer

Avsiktsigenkänning.

KeywordRecognitionModel

Representerar en nyckelordsigenkänningsmodell för att identifiera när användaren säger ett nyckelord för att initiera ytterligare taligenkänning.

LanguageUnderstandingModel

Modell för språktolkning

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Definierar innehållet i en MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Definierar innehållet i mötets transkriberade/transkriberade händelse.

NoMatchDetails

Innehåller detaljerad information för NoMatch-igenkänningsresultat.

Participant

Representerar en deltagare i en konversation. Tillagd i version 1.4.0

PhraseListGrammar

Tillåter tillägg av nya fraser för att förbättra taligenkänningen.

Fraser som läggs till i identifieraren gäller i början av nästa igenkänning, eller nästa gång SpeechSDK måste återansluta till taltjänsten.

PronunciationAssessmentConfig

Konfiguration av utvärdering av uttal.

PronunciationAssessmentResult

Uttalsutvärderingsresultat.

PropertyCollection

Representerar en samling egenskaper och deras värden.

PullAudioInputStream

Representerar ljudindataström som används för anpassade ljudindatakonfigurationer.

PullAudioInputStreamCallback

En abstrakt basklass som definierar återanropsmetoder (read() och close()) för anpassade ljudindataströmmar).

PullAudioOutputStream

Representerar den minnesstödda push-ljudutdataströmmen som används för anpassade ljudutdatakonfigurationer.

PushAudioInputStream

Representerar den minnesstödda indataströmmen för push-ljud som används för anpassade konfigurationer av ljudindata.

PushAudioOutputStream

Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer.

PushAudioOutputStreamCallback

En abstrakt basklass som definierar återanropsmetoder (write() och close()) för anpassade ljudutdataströmmar).

RecognitionEventArgs

Definierar nyttolasten för sessionshändelser som Speech Start/End Detected

RecognitionResult

Definierar resultatet av taligenkänning.

Recognizer

Definierar basklassen Recognizer som huvudsakligen innehåller vanliga händelsehanterare.

ServiceEventArgs

Definierar nyttolasten för alla tjänstmeddelandehändelser som har lagts till i version 1.9.0

SessionEventArgs

Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Konfiguration av källspråk.

SpeakerAudioDestination

Representerar ljudmålet för talaruppspelning, som endast fungerar i webbläsaren. Obs! SDK:et försöker använda mediakälltillägg för att spela upp ljud. Mp3-formatet har bättre stöd för Microsoft Edge, Chrome och Safari (skrivbord), så det är bättre att ange mp3-format för uppspelning.

SpeakerIdentificationModel

Definierar klassen SpeakerIdentificationModel för talarigenkänningsmodellen som innehåller en uppsättning profiler som talarna ska identifieras mot

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Utdataformat

SpeakerRecognizer

Definierar Klassen SpeakerRecognizer för Talarigenkänning Hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile)

SpeakerVerificationModel

Definierar klassen SpeakerVerificationModel för talarigenkänningsmodellen som innehåller en profil som en talare ska verifieras mot

SpeechConfig

Talkonfiguration.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Definierar innehållet i taligenkänning/identifierad händelse.

SpeechRecognitionResult

Definierar resultatet av taligenkänning.

SpeechRecognizer

Utför taligenkänning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat.

SpeechSynthesisBookmarkEventArgs

Definierar innehållet i talsyntesens bokmärkeshändelse.

SpeechSynthesisEventArgs

Definierar innehållet i talsynteshändelser.

SpeechSynthesisResult

Definierar resultatet av talsyntesen.

SpeechSynthesisVisemeEventArgs

Definierar innehållet i talsyntesens viseme-händelse.

SpeechSynthesisWordBoundaryEventArgs

Definierar innehållet i talsyntesens ordgränshändelse.

SpeechSynthesizer

Definierar klassen SpeechSynthesizer för text till tal. Uppdaterad i version 1.16.0

SpeechTranslationConfig

Konfiguration av talöversättning.

SynthesisResult

Basklass för syntesresultat

SynthesisVoicesResult

Definierar resultatet av talsyntesen.

Synthesizer
TranslationRecognitionCanceledEventArgs

Definiera nyttolasten för avbrutna resultathändelser för taligenkänning.

TranslationRecognitionEventArgs

Argument för översättningstextresultathändelse.

TranslationRecognitionResult

Översättningstextresultat.

TranslationRecognizer

Översättningsigenkänning

TranslationSynthesisEventArgs

Argument för översättningssynteshändelse

TranslationSynthesisResult

Definierar översättningssyntesresultat, d.v.s. röstutdata för den översatta texten på målspråket.

Translations

Representerar en samling parametrar och deras värden.

TurnStatusReceivedEventArgs

Definierar innehållet i mottagna meddelanden/händelser.

User
VoiceInfo

Information om talsyntesröst som lagts till i version 1.20.0.

VoiceProfile

Definierar röstprofilklass för talarigenkänning

VoiceProfileCancellationDetails
VoiceProfileClient

Definierar klassen VoiceProfileClient för talarigenkänning hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Utdataformat

VoiceProfilePhraseResult

Utdataformat

VoiceProfileResult

Utdataformat

Gränssnitt

CancellationEventArgs
ConversationInfo
IParticipant

Representerar en deltagare i en konversation. Tillagd i version 1.4.0

IPlayer

Representerar ljudspelarens gränssnitt för att styra ljuduppspelningen, till exempel pausa, återuppta osv.

IVoiceJson
MeetingInfo
VoiceSignature

Uppräkningar

AudioFormatTag
CancellationErrorCode

Definierar felkoden om CancellationReason är Error. Har lagts till i version 1.1.0.

CancellationReason

Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.

LanguageIdMode

Språkidentifieringsläge

LogLevel
NoMatchReason

Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte känns igen.

OutputFormat

Definiera utdataformat för Taligenkänning.

ParticipantChangedReason
ProfanityOption

Alternativ för olämpligt språk. Har lagts till i version 1.7.0.

PronunciationAssessmentGradingSystem

Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.15.0

PronunciationAssessmentGranularity

Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.15.0

PropertyId

Definierar talegenskaps-ID:t.

ResultReason

Definierar möjliga orsaker till att ett igenkänningsresultat kan genereras.

ServicePropertyChannel

Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Definierar gränstypen för talsyntesgränshändelsen.

SpeechSynthesisOutputFormat

Definiera ljudutdataformat för talsyntes. SpeechSynthesisOutputFormat uppdaterad i version 1.17.0

VoiceProfileType

Utdataformat