microsoft-cognitiveservices-speech-sdk package
Классы
ActivityReceivedEventArgs |
Определяет содержимое полученного сообщения или событий. |
AudioConfig |
Представляет конфигурацию входного звука, используемую для указания типа входных данных (микрофон, файл, поток). |
AudioInputStream |
Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука. |
AudioOutputStream |
Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука. |
AudioStreamFormat |
Представляет формат аудиопотока, используемый для пользовательских конфигураций ввода звука. |
AutoDetectSourceLanguageConfig |
Настройка автоматического обнаружения языка. |
AutoDetectSourceLanguageResult |
Формат выходных данных |
AvatarConfig |
Определяет конфигурацию говорящая аватара. |
AvatarEventArgs |
Определяет содержимое для разговорных событий аватара. |
AvatarSynthesizer |
Определяет синтезатор аватара. |
AvatarVideoFormat |
Определяет формат выходного видео аватара. |
AvatarWebRTCConnectionResult |
Определяет результат подключения webRTC аватара. |
BaseAudioPlayer |
Базовый класс аудиопроигрывателя: сейчас воспроизводит только PCM. |
BotFrameworkConfig |
Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части Bot Framework. |
CancellationDetails |
Содержит подробные сведения о том, почему результат был отменен. |
CancellationDetailsBase |
Содержит подробные сведения о том, почему результат был отменен. |
Connection |
Подключение — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет дополнительные методы, которые пользователи могут явно открывать или закрывать подключение, а также подписываться на изменения состояния подключения. Использование подключения является необязательным и главным образом для сценариев, в которых требуется точное изменение поведения приложения на основе состояния подключения. Пользователи могут при необходимости вызвать Open(), чтобы вручную настроить подключение перед началом распознавания распознавателя, связанного с этим подключением. Если распознаватель должен подключиться к службе или отключить его, он будет настраивать или завершать подключение независимо. В этом случае подключение будет уведомлено путем изменения состояния подключения с помощью событий подключенного или отключенного подключения. Добавлено в версию 1.2.1. |
ConnectionEventArgs |
Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версию 1.2.0 |
ConnectionMessage |
ConnectionMessage представляет конкретные сообщения реализации, отправленные и полученные из службы речи. Эти сообщения предоставляются для отладки и не должны использоваться для рабочих вариантов использования с помощью службы "Речь Azure Cognitive Services". Сообщения, отправленные и полученные из службы "Речь", могут изменяться без уведомления. К ним относятся содержимое сообщения, заголовки, полезные данные, упорядочивание и т. д. Добавлено в версию 1.11.0. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationParticipantsChangedEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationTranscriber |
Выполняет распознавание речи с разделением микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате. |
ConversationTranscriptionCanceledEventArgs |
Определяет содержимое объекта RecognitionErrorEvent. |
ConversationTranscriptionEventArgs |
Определяет содержимое события транскрибирования беседы или транскрибирования. |
ConversationTranscriptionResult |
Определяет результат транскрибирования беседы. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец" |
ConversationTranslationResult |
Результат перевода текста. |
ConversationTranslator |
Присоединяйтесь, оставьте или подключитесь к беседе. |
Coordinate |
Определяет координату в 2D-пространстве. |
CustomCommandsConfig |
Класс, определяющий конфигурации для объекта соединителя службы диалоговых окон для использования серверной части CustomCommands. |
Diagnostics |
Определяет API диагностики для управления выходными данными консоли, добавленными в версии 1.21.0 |
DialogServiceConfig |
Класс, определяющий базовые конфигурации соединителя службы диалогов |
DialogServiceConnector |
Соединитель службы диалоговых окон |
IntentRecognitionCanceledEventArgs |
Определите полезные данные отмененных событий распознавания намерений. |
IntentRecognitionEventArgs |
Аргументы события результата распознавания намерений. |
IntentRecognitionResult |
Результат распознавания намерений. |
IntentRecognizer |
Распознаватель намерений. |
KeywordRecognitionModel |
Представляет модель распознавания ключевых слов для распознавания, когда пользователь говорит ключевое слово, чтобы инициировать дальнейшее распознавание речи. |
LanguageUnderstandingModel |
Модель распознавания речи |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
Определяет содержимое собрания MeetingTranscriptionCanceledEvent. |
MeetingTranscriptionEventArgs |
Определяет содержимое события транскрибированного или транскрибирования собрания. |
NoMatchDetails |
Содержит подробные сведения о результатах распознавания NoMatch. |
Participant |
Представляет участника беседы. Добавлено в версию 1.4.0 |
PhraseListGrammar |
Позволяет добавлять новые фразы для улучшения распознавания речи. Фразы, добавленные в распознаватель, эффективны в начале следующего распознавания, или при следующем подключении SpeechSDK к службе распознавания речи. |
PronunciationAssessmentConfig |
Конфигурация оценки произношения. |
PronunciationAssessmentResult |
Результаты оценки произношения. |
PropertyCollection |
Представляет коллекцию свойств и их значений. |
PullAudioInputStream |
Представляет поток ввода звука, используемый для пользовательских конфигураций ввода звука. |
PullAudioInputStreamCallback |
Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских потоков ввода звука. |
PullAudioOutputStream |
Представляет резервный поток вывода звука, поддерживаемый памятью, используемый для пользовательских конфигураций вывода звука. |
PushAudioInputStream |
Представляет резервный поток передачи звука, используемый для пользовательских конфигураций ввода звука. |
PushAudioOutputStream |
Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука. |
PushAudioOutputStreamCallback |
Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода звука. |
RecognitionEventArgs |
Определяет полезные данные для событий сеанса, таких как "Начало речи" или "Обнаружен конец" |
RecognitionResult |
Определяет результат распознавания речи. |
Recognizer |
Определяет распознаватель базового класса, который в основном содержит общие обработчики событий. |
ServiceEventArgs |
Определяет полезные данные для любого события сообщения службы, добавленного в версию 1.9.0. |
SessionEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
SourceLanguageConfig |
Конфигурация исходного языка. |
SpeakerAudioDestination |
Представляет назначение воспроизведения звука динамиков, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа мультимедиа для воспроизведения звука. Формат Mp3 лучше поддерживается в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат mp3 для воспроизведения. |
SpeakerIdentificationModel |
Определяет класс SpeakerIdentificationModel для модели распознавания говорящего содержит набор профилей для идентификации говорящего. |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
Формат выходных данных |
SpeakerRecognizer |
Определяет класс SpeakerRecognizer для операций распознавания говорящего от пользователя для операций профиля голоса (например, createProfile, deleteProfile) |
SpeakerVerificationModel |
Определяет класс SpeakerVerificationModel для модели распознавания говорящего содержит профиль для проверки говорящего |
SpeechConfig |
Конфигурация речи. |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
Определяет содержимое события распознавания и распознавания речи. |
SpeechRecognitionResult |
Определяет результат распознавания речи. |
SpeechRecognizer |
Выполняет распознавание речи с микрофона, файла или других звуковых входных потоков и получает транскрибированные тексты в результате. |
SpeechSynthesisBookmarkEventArgs |
Определяет содержимое события закладки синтеза речи. |
SpeechSynthesisEventArgs |
Определяет содержимое событий синтеза речи. |
SpeechSynthesisResult |
Определяет результат синтеза речи. |
SpeechSynthesisVisemeEventArgs |
Определяет содержимое события синтеза речи viseme. |
SpeechSynthesisWordBoundaryEventArgs |
Определяет содержимое события границы синтеза речи. |
SpeechSynthesizer |
Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0 |
SpeechTranslationConfig |
Конфигурация перевода речи. |
SynthesisResult |
Базовый класс для результатов синтеза |
SynthesisVoicesResult |
Определяет результат синтеза речи. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
Определите полезные данные отмененных событий распознавания речи. |
TranslationRecognitionEventArgs |
Аргументы события результата перевода текста. |
TranslationRecognitionResult |
Результат перевода текста. |
TranslationRecognizer |
Распознаватель перевода |
TranslationSynthesisEventArgs |
Аргументы события синтеза перевода |
TranslationSynthesisResult |
Определяет результат синтеза перевода, т. е. выходные данные голоса переведенного текста на целевом языке. |
Translations |
Представляет коллекцию параметров и их значений. |
TurnStatusReceivedEventArgs |
Определяет содержимое полученного сообщения или событий. |
User | |
VoiceInfo |
Сведения о голосе синтеза речи, добавленном в версию 1.20.0. |
VoiceProfile |
Определяет класс "Профиль голоса" для распознавания говорящего |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
Определяет класс VoiceProfileClient для операций распознавания говорящего от пользователя для операций профиля голосовой связи (например, createProfile, deleteProfile) |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
Формат выходных данных |
VoiceProfilePhraseResult |
Формат выходных данных |
VoiceProfileResult |
Формат выходных данных |
Интерфейсы
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
Представляет участника беседы. Добавлено в версию 1.4.0 |
IPlayer |
Представляет интерфейс аудиопроигрыватель для управления воспроизведением звука, например приостановкой, возобновлением и т. д. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
Перечисления
AudioFormatTag | |
CancellationErrorCode |
Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0. |
CancellationReason |
Определяет возможные причины отмены результата распознавания. |
LanguageIdMode |
Режим идентификации языка |
LogLevel | |
NoMatchReason |
Определяет возможные причины, по которым результат распознавания не распознается. |
OutputFormat |
Определение форматов выходных данных распознавателя речи. |
ParticipantChangedReason | |
ProfanityOption |
Параметр ненормативной лексики. Добавлено в версию 1.7.0. |
PronunciationAssessmentGradingSystem |
Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.15.0 |
PronunciationAssessmentGranularity |
Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.15.0 |
PropertyId |
Определяет идентификаторы свойства речи. |
ResultReason |
Определяет возможные причины, по которым может быть создан результат распознавания. |
ServicePropertyChannel |
Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.7.0. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
Определяет тип границы события границ синтеза речи. |
SpeechSynthesisOutputFormat |
Определение форматов выходных данных синтеза речи. SpeechSynthesisOutputFormat обновлен в версии 1.17.0 |
VoiceProfileType |
Формат выходных данных |