Поделиться через


microsoft-cognitiveservices-speech-sdk package

Классы

ActivityReceivedEventArgs

Определяет содержимое полученного сообщения или событий.

AudioConfig

Представляет конфигурацию входного звука, используемую для указания типа входных данных (микрофон, файл, поток).

AudioInputStream

Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука.

AudioOutputStream

Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.

AudioStreamFormat

Представляет формат аудиопотока, используемый для пользовательских конфигураций ввода звука.

AutoDetectSourceLanguageConfig

Настройка автоматического обнаружения языка.

AutoDetectSourceLanguageResult

Формат выходных данных

AvatarConfig

Определяет конфигурацию говорящая аватара.

AvatarEventArgs

Определяет содержимое для разговорных событий аватара.

AvatarSynthesizer

Определяет синтезатор аватара.

AvatarVideoFormat

Определяет формат выходного видео аватара.

AvatarWebRTCConnectionResult

Определяет результат подключения webRTC аватара.

BaseAudioPlayer

Базовый класс аудиопроигрывателя: сейчас воспроизводит только PCM.

BotFrameworkConfig

Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части Bot Framework.

CancellationDetails

Содержит подробные сведения о том, почему результат был отменен.

CancellationDetailsBase

Содержит подробные сведения о том, почему результат был отменен.

Connection

Подключение — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет дополнительные методы, которые пользователи могут явно открывать или закрывать подключение, а также подписываться на изменения состояния подключения. Использование подключения является необязательным и главным образом для сценариев, в которых требуется точное изменение поведения приложения на основе состояния подключения. Пользователи могут при необходимости вызвать Open(), чтобы вручную настроить подключение перед началом распознавания распознавателя, связанного с этим подключением. Если распознаватель должен подключиться к службе или отключить его, он будет настраивать или завершать подключение независимо. В этом случае подключение будет уведомлено путем изменения состояния подключения с помощью событий подключенного или отключенного подключения. Добавлено в версию 1.2.1.

ConnectionEventArgs

Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версию 1.2.0

ConnectionMessage

ConnectionMessage представляет конкретные сообщения реализации, отправленные и полученные из службы речи. Эти сообщения предоставляются для отладки и не должны использоваться для рабочих вариантов использования с помощью службы "Речь Azure Cognitive Services". Сообщения, отправленные и полученные из службы "Речь", могут изменяться без уведомления. К ним относятся содержимое сообщения, заголовки, полезные данные, упорядочивание и т. д. Добавлено в версию 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Выполняет распознавание речи с разделением микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате.

ConversationTranscriptionCanceledEventArgs

Определяет содержимое объекта RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Определяет содержимое события транскрибирования беседы или транскрибирования.

ConversationTranscriptionResult

Определяет результат транскрибирования беседы.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец"

ConversationTranslationResult

Результат перевода текста.

ConversationTranslator

Присоединяйтесь, оставьте или подключитесь к беседе.

Coordinate

Определяет координату в 2D-пространстве.

CustomCommandsConfig

Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части CustomCommands.

Diagnostics

Определяет API диагностики для управления выходными данными консоли, добавленными в версии 1.21.0

DialogServiceConfig

Класс, определяющий базовые конфигурации соединителя службы диалогов

DialogServiceConnector

Соединитель службы диалоговых окон

IntentRecognitionCanceledEventArgs

Определите полезные данные отмененных событий распознавания намерений.

IntentRecognitionEventArgs

Аргументы события результата распознавания намерений.

IntentRecognitionResult

Результат распознавания намерений.

IntentRecognizer

Распознаватель намерений.

KeywordRecognitionModel

Представляет модель распознавания ключевых слов для распознавания, когда пользователь говорит ключевое слово, чтобы инициировать дальнейшее распознавание речи.

LanguageUnderstandingModel

Модель распознавания речи

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Определяет содержимое собрания MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Определяет содержимое события транскрибированного или транскрибирования собрания.

NoMatchDetails

Содержит подробные сведения о результатах распознавания NoMatch.

Participant

Представляет участника беседы. Добавлено в версию 1.4.0

PhraseListGrammar

Позволяет добавлять новые фразы для улучшения распознавания речи.

Фразы, добавленные в распознаватель, эффективны в начале следующего распознавания, или при следующем подключении SpeechSDK к службе распознавания речи.

PronunciationAssessmentConfig

Конфигурация оценки произношения.

PronunciationAssessmentResult

Результаты оценки произношения.

PropertyCollection

Представляет коллекцию свойств и их значений.

PullAudioInputStream

Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука.

PullAudioInputStreamCallback

Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских потоков ввода звука.

PullAudioOutputStream

Представляет резервный поток вывода звука, поддерживаемый памятью, используемый для пользовательских конфигураций вывода звука.

PushAudioInputStream

Представляет резервный поток передачи звука, используемый для пользовательских конфигураций ввода звука.

PushAudioOutputStream

Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.

PushAudioOutputStreamCallback

Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода звука.

RecognitionEventArgs

Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец"

RecognitionResult

Определяет результат распознавания речи.

Recognizer

Определяет распознаватель базового класса, который в основном содержит общие обработчики событий.

ServiceEventArgs

Определяет полезные данные для любого события сообщения службы, добавленного в версию 1.9.0.

SessionEventArgs

Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Конфигурация исходного языка.

SpeakerAudioDestination

Представляет назначение воспроизведения звука динамиков, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа мультимедиа для воспроизведения звука. Формат Mp3 лучше поддерживается в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат mp3 для воспроизведения.

SpeakerIdentificationModel

Определяет класс SpeakerIdentificationModel для модели распознавания говорящего содержит набор профилей для идентификации говорящего.

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Формат выходных данных

SpeakerRecognizer

Определяет класс SpeakerRecognizer для операций распознавания говорящего от пользователя для операций профиля голоса (например, createProfile, deleteProfile)

SpeakerVerificationModel

Определяет класс SpeakerVerificationModel для модели распознавания говорящего содержит профиль для проверки говорящего

SpeechConfig

Конфигурация речи.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Определяет содержимое события распознавания и распознавания речи.

SpeechRecognitionResult

Определяет результат распознавания речи.

SpeechRecognizer

Выполняет распознавание речи с микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате.

SpeechSynthesisBookmarkEventArgs

Определяет содержимое события закладки синтеза речи.

SpeechSynthesisEventArgs

Определяет содержимое событий синтеза речи.

SpeechSynthesisResult

Определяет результат синтеза речи.

SpeechSynthesisVisemeEventArgs

Определяет содержимое события синтеза речи viseme.

SpeechSynthesisWordBoundaryEventArgs

Определяет содержимое события границы синтеза речи.

SpeechSynthesizer

Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0

SpeechTranslationConfig

Конфигурация перевода речи.

SynthesisResult

Базовый класс для результатов синтеза

SynthesisVoicesResult

Определяет результат синтеза речи.

Synthesizer
TranslationRecognitionCanceledEventArgs

Определите полезные данные отмененных событий распознавания речи.

TranslationRecognitionEventArgs

Аргументы события результата перевода текста.

TranslationRecognitionResult

Результат перевода текста.

TranslationRecognizer

Распознаватель перевода

TranslationSynthesisEventArgs

Аргументы события синтеза перевода

TranslationSynthesisResult

Определяет результат синтеза перевода, т. е. выходные данные голоса переведенного текста на целевом языке.

Translations

Представляет коллекцию параметров и их значений.

TurnStatusReceivedEventArgs

Определяет содержимое полученного сообщения или событий.

User
VoiceInfo

Сведения о голосе синтеза речи, добавленном в версию 1.20.0.

VoiceProfile

Определяет класс "Профиль голоса" для распознавания говорящего

VoiceProfileCancellationDetails
VoiceProfileClient

Определяет класс VoiceProfileClient для операций распознавания говорящего от пользователя для операций профиля голосовой связи (например, createProfile, deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Формат выходных данных

VoiceProfilePhraseResult

Формат выходных данных

VoiceProfileResult

Формат выходных данных

Интерфейсы

CancellationEventArgs
ConversationInfo
IParticipant

Представляет участника беседы. Добавлено в версию 1.4.0

IPlayer

Представляет интерфейс аудиопроигрыватель для управления воспроизведением звука, например приостановкой, возобновлением и т. д.

IVoiceJson
MeetingInfo
VoiceSignature

Перечисления

AudioFormatTag
CancellationErrorCode

Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0.

CancellationReason

Определяет возможные причины отмены результата распознавания.

LanguageIdMode

Режим идентификации языка

LogLevel
NoMatchReason

Определяет возможные причины, по которым результат распознавания не распознается.

OutputFormat

Определение форматов выходных данных распознавателя речи.

ParticipantChangedReason
ProfanityOption

Параметр ненормативной лексики. Добавлено в версию 1.7.0.

PronunciationAssessmentGradingSystem

Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.15.0

PronunciationAssessmentGranularity

Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.15.0

PropertyId

Определяет идентификаторы свойства речи.

ResultReason

Определяет возможные причины, по которым может быть создан результат распознавания.

ServicePropertyChannel

Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Определяет тип границы события границ синтеза речи.

SpeechSynthesisOutputFormat

Определение форматов выходных данных синтеза речи. SpeechSynthesisOutputFormat обновлен в версии 1.17.0

VoiceProfileType

Формат выходных данных