Delen via


microsoft-cognitiveservices-speech-sdk package

Klassen

ActivityReceivedEventArgs

Hiermee definieert u de inhoud van ontvangen berichten/gebeurtenissen.

AudioConfig

Vertegenwoordigt de audio-invoerconfiguratie die wordt gebruikt voor het opgeven van het type invoer dat moet worden gebruikt (microfoon, bestand, stream).

AudioInputStream

Vertegenwoordigt de audio-invoerstroom die wordt gebruikt voor aangepaste audio-invoerconfiguraties.

AudioOutputStream

Vertegenwoordigt de audio-uitvoerstroom die wordt gebruikt voor aangepaste audio-uitvoerconfiguraties.

AudioStreamFormat

Vertegenwoordigt de indeling van de audiostream die wordt gebruikt voor aangepaste audio-invoerconfiguraties.

AutoDetectSourceLanguageConfig

Configuratie voor automatisch detecteren van taal.

AutoDetectSourceLanguageResult

Uitvoerindeling

AvatarConfig

Definieert de configuratie van de pratende avatar.

AvatarEventArgs

Definieert inhoud voor het praten van avatar-gebeurtenissen.

AvatarSynthesizer

Definieert de avatarsynthesizer.

AvatarVideoFormat

Hiermee definieert u de video-indeling van de avatar-uitvoer.

AvatarWebRTCConnectionResult

Hiermee definieert u het resultaat van de avatar WebRTC-verbinding.

BaseAudioPlayer

Basisaudiospelerklasse TODO: Speelt voorlopig alleen PCM af.

BotFrameworkConfig

Klasse die configuraties definieert voor het dialoogvensterserviceconnectorobject voor het gebruik van een Bot Framework-back-end.

CancellationDetails

Bevat gedetailleerde informatie over waarom een resultaat is geannuleerd.

CancellationDetailsBase

Bevat gedetailleerde informatie over waarom een resultaat is geannuleerd.

Connection

Verbinding is een proxyklasse voor het beheren van de verbinding met de spraakservice van de opgegeven Recognizer. Standaard beheert een Recognizer autonoom verbinding met de service wanneer dat nodig is. De verbindingsklasse biedt aanvullende methoden voor gebruikers om expliciet een verbinding te openen of te sluiten en om u te abonneren op wijzigingen in de verbindingsstatus. Het gebruik van verbinding is optioneel en vooral voor scenario's waarin het gedrag van toepassingen op basis van de verbindingsstatus moet worden afgestemd. Gebruikers kunnen optioneel Open() aanroepen om handmatig een verbinding in te stellen voordat ze herkenning starten op de Recognizer die aan deze verbinding is gekoppeld. Als de Recognizer verbinding moet maken of de verbinding met de service moet verbreken, wordt de verbinding onafhankelijk ingesteld of afgesloten. In dit geval wordt de verbinding op de hoogte gesteld door een wijziging van de verbindingsstatus via verbonden/verbroken gebeurtenissen. Toegevoegd in versie 1.2.1.

ConnectionEventArgs

Definieert nettolading voor verbindingsgebeurtenissen zoals Verbonden/Verbroken. Toegevoegd in versie 1.2.0

ConnectionMessage

ConnectionMessage vertegenwoordigt implementatiespecifieke berichten die worden verzonden naar en ontvangen van de spraakservice. Deze berichten worden verstrekt voor foutopsporingsdoeleinden en mogen niet worden gebruikt voor productiegebruiksscenario's met de Azure Cognitive Services Speech Service. Berichten die worden verzonden naar en ontvangen van de Speech Service, kunnen zonder kennisgeving worden gewijzigd. Dit omvat berichtinhoud, kopteksten, nettoladingen, bestellen, enzovoort. Toegevoegd in versie 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Definieert inhoud voor sessiegebeurtenissen zoals SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Definieert inhoud voor sessiegebeurtenissen zoals SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Voert spraakherkenning uit met sprekerscheiding van microfoon, bestand of andere audio-invoerstromen en krijgt getranscribeerde tekst als resultaat.

ConversationTranscriptionCanceledEventArgs

Definieert inhoud van een RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Hiermee definieert u de inhoud van de getranscribeerde/transscribeerde gebeurtenis van het gesprek.

ConversationTranscriptionResult

Definieert het resultaat van gesprektranscriptie.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Hiermee definieert u de nettolading voor sessie-gebeurtenissen zoals Speech Start/End gedetecteerd

ConversationTranslationResult

Resultaat van vertaaltekst.

ConversationTranslator

Deelnemen aan, verlaten of verbinding maken met een gesprek.

Coordinate

Definieert een coördinaat in de 2D-ruimte.

CustomCommandsConfig

Klasse die configuraties definieert voor het dialoogvensterserviceconnectorobject voor het gebruik van een CustomCommands-back-end.

Diagnostics

Definieert diagnostische API voor het beheren van console-uitvoer toegevoegd in versie 1.21.0

DialogServiceConfig

Klasse die basisconfiguraties definieert voor dialoogvensterserviceconnector

DialogServiceConnector

Dialoogvenster Serviceconnector

IntentRecognitionCanceledEventArgs

Definieer de nettolading van intentieherkenning geannuleerde resultaatgebeurtenissen.

IntentRecognitionEventArgs

Resultaatargumenten voor intentieherkenning.

IntentRecognitionResult

Resultaat van intentieherkenning.

IntentRecognizer

Intentieherkenning.

KeywordRecognitionModel

Vertegenwoordigt een model voor trefwoordherkenning voor het herkennen wanneer de gebruiker een trefwoord zegt om verdere spraakherkenning te initiëren.

LanguageUnderstandingModel

Language Understanding-model

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Definieert inhoud van een MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Hiermee definieert u de inhoud van de getranscribeerde/transscribeerde gebeurtenis van de vergadering.

NoMatchDetails

Bevat gedetailleerde informatie voor noMatch-herkenningsresultaten.

Participant

Vertegenwoordigt een deelnemer in een gesprek. Toegevoegd in versie 1.4.0

PhraseListGrammar

Hiermee kunt u nieuwe woordgroepen toevoegen om spraakherkenning te verbeteren.

Zinnen die aan de recognizer zijn toegevoegd, zijn effectief aan het begin van de volgende herkenning, of de volgende keer dat de SpeechSDK opnieuw verbinding moet maken met de spraakservice.

PronunciationAssessmentConfig

Beoordelingsconfiguratie van uitspraak.

PronunciationAssessmentResult

Beoordelingsresultaten van uitspraak.

PropertyCollection

Vertegenwoordigt verzameling eigenschappen en de bijbehorende waarden.

PullAudioInputStream

Vertegenwoordigt de audio-invoerstroom die wordt gebruikt voor aangepaste audio-invoerconfiguraties.

PullAudioInputStreamCallback

Een abstracte basisklasse die callback-methoden (read() en close()) definieert voor aangepaste audio-invoerstromen.

PullAudioOutputStream

Vertegenwoordigt een push-audio-uitvoerstroom die wordt gebruikt voor aangepaste audio-uitvoerconfiguraties.

PushAudioInputStream

Vertegenwoordigt een push-audio-invoerstroom die wordt gebruikt voor aangepaste audio-invoerconfiguraties.

PushAudioOutputStream

Vertegenwoordigt de audio-uitvoerstroom die wordt gebruikt voor aangepaste audio-uitvoerconfiguraties.

PushAudioOutputStreamCallback

Een abstracte basisklasse die callback-methoden (write() en close()) definieert voor aangepaste audio-uitvoerstromen.

RecognitionEventArgs

Hiermee definieert u de nettolading voor sessie-gebeurtenissen zoals Speech Start/End gedetecteerd

RecognitionResult

Definieert het resultaat van spraakherkenning.

Recognizer

Definieert de basisklasse Recognizer die voornamelijk algemene gebeurtenis-handlers bevat.

ServiceEventArgs

Definieert nettolading voor elke servicebericht-gebeurtenis die is toegevoegd in versie 1.9.0

SessionEventArgs

Definieert inhoud voor sessiegebeurtenissen zoals SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Configuratie van brontaal.

SpeakerAudioDestination

Vertegenwoordigt de audiobestemming voor het afspelen van luidsprekers, die alleen in de browser werkt. Opmerking: de SDK probeert mediabronextensies te gebruiken om audio af te spelen. Mp3-indeling biedt betere ondersteuning voor Microsoft Edge, Chrome en Safari (desktop), dus het is beter om mp3-indeling op te geven voor afspelen.

SpeakerIdentificationModel

Definieert de Klasse SpeakerIdentificationModel voor Speaker Recognition Model bevat een set profielen waarmee spreker(s) kunnen worden geïdentificeerd

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Uitvoerindeling

SpeakerRecognizer

Definieert de Klasse SpeakerRecognizer voor bewerkingen van Speaker Recognition Verwerkt bewerkingen van de gebruiker voor Voice Profile-bewerkingen (bijvoorbeeld createProfile, deleteProfile)

SpeakerVerificationModel

Definieert de Klasse SpeakerVerificationModel voor Speaker Recognition Model bevat een profiel waarmee een spreker kan worden geverifieerd

SpeechConfig

Spraakconfiguratie.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Hiermee definieert u de inhoud van spraakherkenning/herkende gebeurtenis.

SpeechRecognitionResult

Definieert het resultaat van spraakherkenning.

SpeechRecognizer

Voert spraakherkenning uit vanuit microfoon-, bestand- of andere audio-invoerstromen en haalt getranscribeerde tekst op als resultaat.

SpeechSynthesisBookmarkEventArgs

Hiermee definieert u de inhoud van de gebeurtenis voor spraaksynthesebladwijzers.

SpeechSynthesisEventArgs

Hiermee definieert u de inhoud van spraaksynthese-gebeurtenissen.

SpeechSynthesisResult

Definieert het resultaat van spraaksynthese.

SpeechSynthesisVisemeEventArgs

Definieert de inhoud van spraaksynthese viseme-gebeurtenis.

SpeechSynthesisWordBoundaryEventArgs

Hiermee definieert u de inhoud van de woordgrensgebeurtenis voor spraaksynthese.

SpeechSynthesizer

Definieert de klasse SpeechSynthesizer voor tekst naar spraak. Bijgewerkt in versie 1.16.0

SpeechTranslationConfig

Configuratie van spraakomzetting.

SynthesisResult

Basisklasse voor syntheseresultaten

SynthesisVoicesResult

Definieert het resultaat van spraaksynthese.

Synthesizer
TranslationRecognitionCanceledEventArgs

Definieer de nettolading van geannuleerde resultaatgebeurtenissen voor spraakherkenning.

TranslationRecognitionEventArgs

Resultaatargumenten voor vertalingstekst.

TranslationRecognitionResult

Resultaat van vertaaltekst.

TranslationRecognizer

Vertaalherkenning

TranslationSynthesisEventArgs

Argumenten voor omzettingssynthese-gebeurtenis

TranslationSynthesisResult

Definieert het resultaat van de omzettingssynthese, bijvoorbeeld de stemuitvoer van de vertaalde tekst in de doeltaal.

Translations

Vertegenwoordigt het verzamelen van parameters en de bijbehorende waarden.

TurnStatusReceivedEventArgs

Hiermee definieert u de inhoud van ontvangen berichten/gebeurtenissen.

User
VoiceInfo

Informatie over spraaksynthese stem toegevoegd in versie 1.20.0.

VoiceProfile

Definieert de klasse Spraakprofiel voor Sprekerherkenning

VoiceProfileCancellationDetails
VoiceProfileClient

Definieert de VoiceProfileClient-klasse voor bewerkingen van speaker recognition van de gebruiker voor spraakprofielbewerkingen (bijvoorbeeld createProfile, deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Uitvoerindeling

VoiceProfilePhraseResult

Uitvoerindeling

VoiceProfileResult

Uitvoerindeling

Interfaces

CancellationEventArgs
ConversationInfo
IParticipant

Vertegenwoordigt een deelnemer in een gesprek. Toegevoegd in versie 1.4.0

IPlayer

Vertegenwoordigt de audiospelerinterface om het afspelen van audio te regelen, zoals onderbreken, hervatten, enzovoort.

IVoiceJson
MeetingInfo
VoiceSignature

Enums

AudioFormatTag
CancellationErrorCode

Definieert foutcode in het geval dat CancellationReason fout is. Toegevoegd in versie 1.1.0.

CancellationReason

Definieert de mogelijke redenen waarom een herkenningsresultaat kan worden geannuleerd.

LanguageIdMode

Taalidentificatiemodus

LogLevel
NoMatchReason

Definieert de mogelijke redenen waarom een herkenningsresultaat mogelijk niet wordt herkend.

OutputFormat

Indelingen voor speech Recognizer-uitvoer definiëren.

ParticipantChangedReason
ProfanityOption

Optie voor grof taalgebruik. Toegevoegd in versie 1.7.0.

PronunciationAssessmentGradingSystem

Definieert het puntsysteem voor de kalibratie van de uitspraakscore; de standaardwaarde is FivePoint. Toegevoegd in versie 1.15.0

PronunciationAssessmentGranularity

Definieert de beoordelingsgranulariteit van de uitspraak; de standaardwaarde is Phoneme. Toegevoegd in versie 1.15.0

PropertyId

Definieert de id's van de spraakeigenschap.

ResultReason

Definieert de mogelijke redenen waarom een herkenningsresultaat kan worden gegenereerd.

ServicePropertyChannel

Definieert kanalen die worden gebruikt om eigenschapsinstellingen door te geven aan de service. Toegevoegd in versie 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Hiermee definieert u het grenstype van de grensgebeurtenis voor spraaksynthese.

SpeechSynthesisOutputFormat

Audio-uitvoerindelingen voor spraaksynthese definiëren. SpeechSynthesisOutputFormat bijgewerkt in versie 1.17.0

VoiceProfileType

Uitvoerindeling