microsoft-cognitiveservices-speech-sdk package

Ссылка

Классы

ActivityReceivedEventArgs	Определяет содержимое полученного сообщения или событий.
AudioConfig	Представляет конфигурацию входного звука, используемую для указания типа входных данных (микрофон, файл, поток).
AudioInputStream	Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука.
AudioOutputStream	Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.
AudioStreamFormat	Представляет формат аудиопотока, используемый для пользовательских конфигураций ввода звука.
AutoDetectSourceLanguageConfig	Настройка автоматического обнаружения языка.
AutoDetectSourceLanguageResult	Формат выходных данных
AvatarConfig	Определяет конфигурацию говорящая аватара.
AvatarEventArgs	Определяет содержимое для разговорных событий аватара.
AvatarSynthesizer	Определяет синтезатор аватара.
AvatarVideoFormat	Определяет формат выходного видео аватара.
AvatarWebRTCConnectionResult	Определяет результат подключения webRTC аватара.
BaseAudioPlayer	Базовый класс аудиопроигрывателя: сейчас воспроизводит только PCM.
BotFrameworkConfig	Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части Bot Framework.
CancellationDetails	Содержит подробные сведения о том, почему результат был отменен.
CancellationDetailsBase	Содержит подробные сведения о том, почему результат был отменен.
Connection	Подключение — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет дополнительные методы, которые пользователи могут явно открывать или закрывать подключение, а также подписываться на изменения состояния подключения. Использование подключения является необязательным и главным образом для сценариев, в которых требуется точное изменение поведения приложения на основе состояния подключения. Пользователи могут при необходимости вызвать Open(), чтобы вручную настроить подключение перед началом распознавания распознавателя, связанного с этим подключением. Если распознаватель должен подключиться к службе или отключить его, он будет настраивать или завершать подключение независимо. В этом случае подключение будет уведомлено путем изменения состояния подключения с помощью событий подключенного или отключенного подключения. Добавлено в версию 1.2.1.
ConnectionEventArgs	Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версию 1.2.0
ConnectionMessage	ConnectionMessage представляет конкретные сообщения реализации, отправленные и полученные из службы речи. Эти сообщения предоставляются для отладки и не должны использоваться для рабочих вариантов использования с помощью службы "Речь Azure Cognitive Services". Сообщения, отправленные и полученные из службы "Речь", могут изменяться без уведомления. К ним относятся содержимое сообщения, заголовки, полезные данные, упорядочивание и т. д. Добавлено в версию 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.
ConversationTranscriber	Выполняет распознавание речи с разделением микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате.
ConversationTranscriptionCanceledEventArgs	Определяет содержимое объекта RecognitionErrorEvent.
ConversationTranscriptionEventArgs	Определяет содержимое события транскрибирования беседы или транскрибирования.
ConversationTranscriptionResult	Определяет результат транскрибирования беседы.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец"
ConversationTranslationResult	Результат перевода текста.
ConversationTranslator	Присоединяйтесь, оставьте или подключитесь к беседе.
Coordinate	Определяет координату в 2D-пространстве.
CustomCommandsConfig	Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части CustomCommands.
Diagnostics	Определяет API диагностики для управления выходными данными консоли, добавленными в версии 1.21.0
DialogServiceConfig	Класс, определяющий базовые конфигурации соединителя службы диалогов
DialogServiceConnector	Соединитель службы диалоговых окон
IntentRecognitionCanceledEventArgs	Определите полезные данные отмененных событий распознавания намерений.
IntentRecognitionEventArgs	Аргументы события результата распознавания намерений.
IntentRecognitionResult	Результат распознавания намерений.
IntentRecognizer	Распознаватель намерений.
KeywordRecognitionModel	Представляет модель распознавания ключевых слов для распознавания, когда пользователь говорит ключевое слово, чтобы инициировать дальнейшее распознавание речи.
LanguageUnderstandingModel	Модель распознавания речи
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	Определяет содержимое собрания MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	Определяет содержимое события транскрибированного или транскрибирования собрания.
NoMatchDetails	Содержит подробные сведения о результатах распознавания NoMatch.
Participant	Представляет участника беседы. Добавлено в версию 1.4.0
PhraseListGrammar	Позволяет добавлять новые фразы для улучшения распознавания речи. Фразы, добавленные в распознаватель, эффективны в начале следующего распознавания, или при следующем подключении SpeechSDK к службе распознавания речи.
PronunciationAssessmentConfig	Конфигурация оценки произношения.
PronunciationAssessmentResult	Результаты оценки произношения.
PropertyCollection	Представляет коллекцию свойств и их значений.
PullAudioInputStream	Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука.
PullAudioInputStreamCallback	Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских потоков ввода звука.
PullAudioOutputStream	Представляет резервный поток вывода звука, поддерживаемый памятью, используемый для пользовательских конфигураций вывода звука.
PushAudioInputStream	Представляет резервный поток передачи звука, используемый для пользовательских конфигураций ввода звука.
PushAudioOutputStream	Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.
PushAudioOutputStreamCallback	Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода звука.
RecognitionEventArgs	Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец"
RecognitionResult	Определяет результат распознавания речи.
Recognizer	Определяет распознаватель базового класса, который в основном содержит общие обработчики событий.
ServiceEventArgs	Определяет полезные данные для любого события сообщения службы, добавленного в версию 1.9.0.
SessionEventArgs	Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.
SourceLanguageConfig	Конфигурация исходного языка.
SpeakerAudioDestination	Представляет назначение воспроизведения звука динамиков, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа мультимедиа для воспроизведения звука. Формат Mp3 лучше поддерживается в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат mp3 для воспроизведения.
SpeakerIdentificationModel	Определяет класс SpeakerIdentificationModel для модели распознавания говорящего содержит набор профилей для идентификации говорящего.
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	Формат выходных данных
SpeakerRecognizer	Определяет класс SpeakerRecognizer для операций распознавания говорящего от пользователя для операций профиля голоса (например, createProfile, deleteProfile)
SpeakerVerificationModel	Определяет класс SpeakerVerificationModel для модели распознавания говорящего содержит профиль для проверки говорящего
SpeechConfig	Конфигурация речи.
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	Определяет содержимое события распознавания и распознавания речи.
SpeechRecognitionResult	Определяет результат распознавания речи.
SpeechRecognizer	Выполняет распознавание речи с микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате.
SpeechSynthesisBookmarkEventArgs	Определяет содержимое события закладки синтеза речи.
SpeechSynthesisEventArgs	Определяет содержимое событий синтеза речи.
SpeechSynthesisResult	Определяет результат синтеза речи.
SpeechSynthesisVisemeEventArgs	Определяет содержимое события синтеза речи viseme.
SpeechSynthesisWordBoundaryEventArgs	Определяет содержимое события границы синтеза речи.
SpeechSynthesizer	Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0
SpeechTranslationConfig	Конфигурация перевода речи.
SynthesisResult	Базовый класс для результатов синтеза
SynthesisVoicesResult	Определяет результат синтеза речи.
Synthesizer
TranslationRecognitionCanceledEventArgs	Определите полезные данные отмененных событий распознавания речи.
TranslationRecognitionEventArgs	Аргументы события результата перевода текста.
TranslationRecognitionResult	Результат перевода текста.
TranslationRecognizer	Распознаватель перевода
TranslationSynthesisEventArgs	Аргументы события синтеза перевода
TranslationSynthesisResult	Определяет результат синтеза перевода, т. е. выходные данные голоса переведенного текста на целевом языке.
Translations	Представляет коллекцию параметров и их значений.
TurnStatusReceivedEventArgs	Определяет содержимое полученного сообщения или событий.
User
VoiceInfo	Сведения о голосе синтеза речи, добавленном в версию 1.20.0.
VoiceProfile	Определяет класс "Профиль голоса" для распознавания говорящего
VoiceProfileCancellationDetails
VoiceProfileClient	Определяет класс VoiceProfileClient для операций распознавания говорящего от пользователя для операций профиля голосовой связи (например, createProfile, deleteProfile)
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	Формат выходных данных
VoiceProfilePhraseResult	Формат выходных данных
VoiceProfileResult	Формат выходных данных

Интерфейсы

CancellationEventArgs
ConversationInfo
IParticipant	Представляет участника беседы. Добавлено в версию 1.4.0
IPlayer	Представляет интерфейс аудиопроигрыватель для управления воспроизведением звука, например приостановкой, возобновлением и т. д.
IVoiceJson
MeetingInfo
VoiceSignature

Перечисления

AudioFormatTag
CancellationErrorCode	Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0.
CancellationReason	Определяет возможные причины отмены результата распознавания.
LanguageIdMode	Режим идентификации языка
LogLevel
NoMatchReason	Определяет возможные причины, по которым результат распознавания не распознается.
OutputFormat	Определение форматов выходных данных распознавателя речи.
ParticipantChangedReason
ProfanityOption	Параметр ненормативной лексики. Добавлено в версию 1.7.0.
PronunciationAssessmentGradingSystem	Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.15.0
PronunciationAssessmentGranularity	Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.15.0
PropertyId	Определяет идентификаторы свойства речи.
ResultReason	Определяет возможные причины, по которым может быть создан результат распознавания.
ServicePropertyChannel	Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	Определяет тип границы события границ синтеза речи.
SpeechSynthesisOutputFormat	Определение форматов выходных данных синтеза речи. SpeechSynthesisOutputFormat обновлен в версии 1.17.0
VoiceProfileType	Формат выходных данных

Поделиться через

microsoft-cognitiveservices-speech-sdk package

Классы

Интерфейсы

Перечисления

Дополнительные ресурсы