microsoft-cognitiveservices-speech-sdk package
Klasser
ActivityReceivedEventArgs |
Definierar innehållet i mottagna meddelanden/händelser. |
AudioConfig |
Representerar konfiguration av ljudindata som används för att ange vilken typ av indata som ska användas (mikrofon, fil, ström). |
AudioInputStream |
Representerar ljudindataström som används för anpassade ljudindatakonfigurationer. |
AudioOutputStream |
Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer. |
AudioStreamFormat |
Representerar ljudströmformat som används för anpassade konfigurationer av ljudindata. |
AutoDetectSourceLanguageConfig |
Automatisk identifiering av språkkonfiguration. |
AutoDetectSourceLanguageResult |
Utdataformat |
AvatarConfig |
Definierar den talande avatarkonfigurationen. |
AvatarEventArgs |
Definierar innehåll för talande avatarhändelser. |
AvatarSynthesizer |
Definierar avatarsyntesen. |
AvatarVideoFormat |
Definierar avatarutdatavideoformatet. |
AvatarWebRTCConnectionResult |
Definierar webRTC-anslutningsresultatet för avataren. |
BaseAudioPlayer |
Base audio player class TODO: Spelar bara PCM för tillfället. |
BotFrameworkConfig |
Klass som definierar konfigurationer för dialogtjänstens anslutningsobjekt för användning av en Bot Framework-serverdel. |
CancellationDetails |
Innehåller detaljerad information om varför ett resultat avbröts. |
CancellationDetailsBase |
Innehåller detaljerad information om varför ett resultat avbröts. |
Connection |
Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en igenkännare anslutningen till tjänsten när det behövs. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Användning av Anslutning är valfritt, och främst för scenarier där finjustering av programbeteende baserat på anslutningsstatus krävs. Användare kan också anropa Open() för att manuellt konfigurera en anslutning i förväg innan de startar igenkänningen av den identifierare som är associerad med den här anslutningen. Om identifieraren behöver ansluta eller koppla från till tjänsten konfigureras eller stängs anslutningen av oberoende av varandra. I det här fallet meddelas anslutningen genom att anslutningsstatusen ändras via anslutna/frånkopplade händelser. Har lagts till i version 1.2.1. |
ConnectionEventArgs |
Definierar nyttolasten för anslutningshändelser som Ansluten/Frånkopplad. Har lagts till i version 1.2.0 |
ConnectionMessage |
ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Speech Service kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.11.0. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationParticipantsChangedEventArgs |
Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationTranscriber |
Utför taligenkänning med talaravgränsning från mikrofon, fil eller andra ljudindataströmmar och transkriberas text som resultat. |
ConversationTranscriptionCanceledEventArgs |
Definierar innehållet i en RecognitionErrorEvent. |
ConversationTranscriptionEventArgs |
Definierar innehållet i en transkriberad/transkriberad konversationshändelse. |
ConversationTranscriptionResult |
Definierar resultatet av samtalstranskription. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Definierar nyttolasten för sessionshändelser som Speech Start/End Detected |
ConversationTranslationResult |
Översättningstextresultat. |
ConversationTranslator |
Anslut, lämna eller anslut till en konversation. |
Coordinate |
Definierar en koordinat i 2D-blanksteg. |
CustomCommandsConfig |
Klass som definierar konfigurationer för dialogtjänstens anslutningsobjekt för att använda en CustomCommands-serverdel. |
Diagnostics |
Definierar diagnostik-API för att hantera konsolutdata som lagts till i version 1.21.0 |
DialogServiceConfig |
Klass som definierar baskonfigurationer för dialogtjänstanslutning |
DialogServiceConnector |
Dialogtjänstanslutning |
IntentRecognitionCanceledEventArgs |
Definiera nyttolasten för avbrutna resultathändelser för avsiktsigenkänning. |
IntentRecognitionEventArgs |
Resultathändelseargument för avsiktsigenkänning. |
IntentRecognitionResult |
Resultat av avsiktsigenkänning. |
IntentRecognizer |
Avsiktsigenkänning. |
KeywordRecognitionModel |
Representerar en nyckelordsigenkänningsmodell för att identifiera när användaren säger ett nyckelord för att initiera ytterligare taligenkänning. |
LanguageUnderstandingModel |
Modell för språktolkning |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
Definierar innehållet i en MeetingTranscriptionCanceledEvent. |
MeetingTranscriptionEventArgs |
Definierar innehållet i mötets transkriberade/transkriberade händelse. |
NoMatchDetails |
Innehåller detaljerad information för NoMatch-igenkänningsresultat. |
Participant |
Representerar en deltagare i en konversation. Tillagd i version 1.4.0 |
PhraseListGrammar |
Tillåter tillägg av nya fraser för att förbättra taligenkänningen. Fraser som läggs till i identifieraren gäller i början av nästa igenkänning, eller nästa gång SpeechSDK måste återansluta till taltjänsten. |
PronunciationAssessmentConfig |
Konfiguration av utvärdering av uttal. |
PronunciationAssessmentResult |
Uttalsutvärderingsresultat. |
PropertyCollection |
Representerar en samling egenskaper och deras värden. |
PullAudioInputStream |
Representerar ljudindataström som används för anpassade ljudindatakonfigurationer. |
PullAudioInputStreamCallback |
En abstrakt basklass som definierar återanropsmetoder (read() och close()) för anpassade ljudindataströmmar). |
PullAudioOutputStream |
Representerar den minnesstödda push-ljudutdataströmmen som används för anpassade ljudutdatakonfigurationer. |
PushAudioInputStream |
Representerar den minnesstödda indataströmmen för push-ljud som används för anpassade konfigurationer av ljudindata. |
PushAudioOutputStream |
Representerar ljudutdataström som används för anpassade ljudutdatakonfigurationer. |
PushAudioOutputStreamCallback |
En abstrakt basklass som definierar återanropsmetoder (write() och close()) för anpassade ljudutdataströmmar). |
RecognitionEventArgs |
Definierar nyttolasten för sessionshändelser som Speech Start/End Detected |
RecognitionResult |
Definierar resultatet av taligenkänning. |
Recognizer |
Definierar basklassen Recognizer som huvudsakligen innehåller vanliga händelsehanterare. |
ServiceEventArgs |
Definierar nyttolasten för alla tjänstmeddelandehändelser som har lagts till i version 1.9.0 |
SessionEventArgs |
Definierar innehåll för sessionshändelser som SessionStarted/Stopped, SoundStarted/Stopped. |
SourceLanguageConfig |
Konfiguration av källspråk. |
SpeakerAudioDestination |
Representerar ljudmålet för talaruppspelning, som endast fungerar i webbläsaren. Obs! SDK:et försöker använda mediakälltillägg för att spela upp ljud. Mp3-formatet har bättre stöd för Microsoft Edge, Chrome och Safari (skrivbord), så det är bättre att ange mp3-format för uppspelning. |
SpeakerIdentificationModel |
Definierar klassen SpeakerIdentificationModel för talarigenkänningsmodellen som innehåller en uppsättning profiler som talarna ska identifieras mot |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
Utdataformat |
SpeakerRecognizer |
Definierar Klassen SpeakerRecognizer för Talarigenkänning Hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile) |
SpeakerVerificationModel |
Definierar klassen SpeakerVerificationModel för talarigenkänningsmodellen som innehåller en profil som en talare ska verifieras mot |
SpeechConfig |
Talkonfiguration. |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
Definierar innehållet i taligenkänning/identifierad händelse. |
SpeechRecognitionResult |
Definierar resultatet av taligenkänning. |
SpeechRecognizer |
Utför taligenkänning från mikrofon, fil eller andra ljudindataströmmar och får transkriberad text som resultat. |
SpeechSynthesisBookmarkEventArgs |
Definierar innehållet i talsyntesens bokmärkeshändelse. |
SpeechSynthesisEventArgs |
Definierar innehållet i talsynteshändelser. |
SpeechSynthesisResult |
Definierar resultatet av talsyntesen. |
SpeechSynthesisVisemeEventArgs |
Definierar innehållet i talsyntesens viseme-händelse. |
SpeechSynthesisWordBoundaryEventArgs |
Definierar innehållet i talsyntesens ordgränshändelse. |
SpeechSynthesizer |
Definierar klassen SpeechSynthesizer för text till tal. Uppdaterad i version 1.16.0 |
SpeechTranslationConfig |
Konfiguration av talöversättning. |
SynthesisResult |
Basklass för syntesresultat |
SynthesisVoicesResult |
Definierar resultatet av talsyntesen. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
Definiera nyttolasten för avbrutna resultathändelser för taligenkänning. |
TranslationRecognitionEventArgs |
Argument för översättningstextresultathändelse. |
TranslationRecognitionResult |
Översättningstextresultat. |
TranslationRecognizer |
Översättningsigenkänning |
TranslationSynthesisEventArgs |
Argument för översättningssynteshändelse |
TranslationSynthesisResult |
Definierar översättningssyntesresultat, d.v.s. röstutdata för den översatta texten på målspråket. |
Translations |
Representerar en samling parametrar och deras värden. |
TurnStatusReceivedEventArgs |
Definierar innehållet i mottagna meddelanden/händelser. |
User | |
VoiceInfo |
Information om talsyntesröst som lagts till i version 1.20.0. |
VoiceProfile |
Definierar röstprofilklass för talarigenkänning |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
Definierar klassen VoiceProfileClient för talarigenkänning hanterar åtgärder från användare för röstprofilåtgärder (t.ex. createProfile, deleteProfile) |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
Utdataformat |
VoiceProfilePhraseResult |
Utdataformat |
VoiceProfileResult |
Utdataformat |
Gränssnitt
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
Representerar en deltagare i en konversation. Tillagd i version 1.4.0 |
IPlayer |
Representerar ljudspelarens gränssnitt för att styra ljuduppspelningen, till exempel pausa, återuppta osv. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
Uppräkningar
AudioFormatTag | |
CancellationErrorCode |
Definierar felkoden om CancellationReason är Error. Har lagts till i version 1.1.0. |
CancellationReason |
Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas. |
LanguageIdMode |
Språkidentifieringsläge |
LogLevel | |
NoMatchReason |
Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte känns igen. |
OutputFormat |
Definiera utdataformat för Taligenkänning. |
ParticipantChangedReason | |
ProfanityOption |
Alternativ för olämpligt språk. Har lagts till i version 1.7.0. |
PronunciationAssessmentGradingSystem |
Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.15.0 |
PronunciationAssessmentGranularity |
Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.15.0 |
PropertyId |
Definierar talegenskaps-ID:t. |
ResultReason |
Definierar möjliga orsaker till att ett igenkänningsresultat kan genereras. |
ServicePropertyChannel |
Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.7.0. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
Definierar gränstypen för talsyntesgränshändelsen. |
SpeechSynthesisOutputFormat |
Definiera ljudutdataformat för talsyntes. SpeechSynthesisOutputFormat uppdaterad i version 1.17.0 |
VoiceProfileType |
Utdataformat |