Поделиться через


Пространство имен Microsoft::CognitiveServices::Speech

Сводка

Члены Описания
перечисление PropertyId Определяет идентификаторы свойства речи. Изменено в версии 1.4.0.
перечисление OutputFormat Формат вывода.
перечисление ProfanityOption Удаляет ненормативную лексику (ношение) или заменяет буквы ненормативных слов звездами. Добавлено в версию 1.5.0.
перечисление ResultReason Указывает возможные причины, по которым может быть создан результат распознавания.
перечисление CancellationReason Определяет возможные причины отмены результата распознавания.
перечисление CancellationErrorCode Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0.
перечисление NoMatchReason Определяет возможные причины, по которым результат распознавания не распознается.
перечисление ActivityJSONType Определяет возможные типы для значения json действия. Добавлено в версию 1.5.0.
перечисление SpeechSynthesisOutputFormat Определяет возможные форматы звука синтеза речи. Обновлено в версии 1.19.0.
перечисление StreamStatus Определяет возможное состояние потока звуковых данных. Добавлено в версию 1.4.0.
перечисление ServicePropertyChannel Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.5.0.
перечисление VoiceProfileType Определяет типы профилей голоса.
перечисление RecognitionFactorScope Определяет область применения фактора распознавания.
перечисление "ПроизношениеAssessmentGradingSystem Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.14.0.
перечислениеAssessmentGranularity Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.14.0.
перечисление SynthesisVoiceType Определяет тип голосов синтеза, добавленных в версию 1.16.0.
перечисление SynthesisVoiceGender Определяет пол голосов синтеза, добавленных в версию 1.17.0.
перечисление SpeechSynthesisBoundaryType Определяет тип границы события границ синтеза речи, добавленного в версию 1.21.0.
перечисление SegmentationStrategy Стратегия, используемая для определения окончания фразы и окончательного распознаваемого результата. Допустимые значения: Default, Time и "Semantic".
класса AsyncRecognizer Абстрактный базовый класс AsyncRecognizer.
класса AudioDataStream Представляет поток аудиоданных, используемый для работы звуковых данных в виде потока. Добавлено в версию 1.4.0.
класса AutoDetectSourceLanguageConfig Класс, определяющий конфигурацию источника автоматического обнаружения, обновленную в версии 1.13.0.
класса AutoDetectSourceLanguageResult Содержит результат автоматического обнаружения исходного языка, добавленный в версии 1.8.0.
класс BaseAsyncRecognizer Класс BaseAsyncRecognizer.
класса CancellationDetails Содержит подробные сведения о том, почему результат был отменен.
класс ClassLanguageModel Представляет список грамматик для динамических сценариев грамматики. Добавлено в версию 1.7.0.
класса Connection Подключение — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет дополнительные методы, которые пользователи могут явно открывать или закрывать подключение, а также подписываться на изменения состояния подключения. Использование подключения является необязательным. Он предназначен для сценариев, в которых требуется точное изменение поведения приложения на основе состояния подключения. Пользователи могут при необходимости вызвать Open(), чтобы вручную инициировать подключение к службе перед началом распознавания распознавателя, связанного с этим подключением. После запуска распознавания вызов Open() или Close() может завершиться ошибкой. Это не повлияет на распознавателя или текущее распознавание. Подключение может отпасть по различным причинам, распознаватель всегда пытается повторно переустановить подключение, как это необходимо для обеспечения текущих операций. Во всех этих случаях события connected/Disconnected указывают на изменение состояния подключения. Обновлено в версии 1.17.0.
класса ConnectionEventArgs Предоставляет данные для ConnectionEvent. Добавлено в версию 1.2.0.
класс ConnectionMessage ConnectionMessage представляет конкретные сообщения реализации, отправленные и полученные из службы речи. Эти сообщения предоставляются для отладки и не должны использоваться для рабочих вариантов использования с помощью службы "Речь Azure Cognitive Services". Сообщения, отправленные и полученные из службы "Речь", могут изменяться без уведомления. К ним относятся содержимое сообщения, заголовки, полезные данные, упорядочивание и т. д. Добавлено в версию 1.10.0.
класс ConnectionMessageEventArgs Предоставляет данные для ConnectionMessageEvent.
класс EmbeddedSpeechConfig Класс, определяющий встроенную (автономную) конфигурацию речи.
класса EventArgs Базовый класс для аргументов событий.
класса EventSignal Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы остановить получение событий.
класса EventSignalBase Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы остановить получение событий.
класса Grammar Представляет грамматику базового класса для настройки распознавания речи. Добавлено в версию 1.5.0.
класса GrammarList Представляет список грамматик для динамических сценариев грамматики. Добавлено в версию 1.7.0.
класс GrammarPhrase Представляет фразу, которую может говорить пользователь. Добавлено в версию 1.5.0.
класса HybridSpeechConfig Класс, определяющий гибридные (облачные и внедренные) конфигурации для распознавания речи или синтеза речи.
класса KeywordRecognitionEventArgs Класс для событий, эмитированных KeywordRecognizer.
класса KeywordRecognitionModel Представляет модель распознавания ключевых слов, используемую с методами StartKeywordRecognitionAsync.
класс KeywordRecognitionResult Класс, определяющий результаты, создаваемые KeywordRecognizer.
класс KeywordRecognizer Тип распознавателя, специализированный для обработки только активации ключевых слов.
класс NoMatchDetails Содержит подробные сведения о результатах распознавания NoMatch.
класс PersonalVoiceSynthesisRequest Класс, определяющий запрос синтеза речи для личного голоса (aka.ms/azureai/personal-voice). Этот класс находится в предварительной версии и подлежит изменению. Добавлено в версию 1.39.0.
класс PhraseListGrammar Представляет грамматику списка фраз для сценариев динамической грамматики. Добавлено в версию 1.5.0.
класс PronunciationAssessmentConfig Класс, определяющий конфигурацию оценки произношения, добавленную в версии 1.14.0.
класс PronunciationAssessmentResult Класс для результатов оценки произношения.
класс ПроизношениеContentAssessmentResult Класс для результатов оценки содержимого.
класса PropertyCollection Класс для получения или задания значения свойства из коллекции свойств.
класса RecognitionEventArgs Предоставляет данные для RecognitionEvent.
класса RecognitionResult Содержит подробные сведения о результатах операции распознавания.
класса Распознавателя Базовый класс Распознавателя.
класса SessionEventArgs Базовый класс для аргументов событий сеанса.
класс SmartHandle Класс smart handle.
класса SourceLanguageConfig Класс, определяющий конфигурацию исходного языка, добавленный в версию 1.8.0.
класс SourceLanguageRecognizer Класс для распознавателей исходного языка. Этот класс можно использовать для автономного обнаружения языка. Добавлено в версию 1.17.0.
класса SpeechConfig Класс, определяющий конфигурации для распознавания речи или намерения или синтеза речи.
класс SpeechRecognitionCanceledEventArgs Класс для отмены аргументов события распознавания речи.
класс SpeechRecognitionEventArgs Класс для аргументов событий распознавания речи.
класс SpeechRecognitionModel Сведения о модели распознавания речи.
класса SpeechRecognitionResult Базовый класс для результатов распознавания речи.
класса SpeechRecognizer Класс для распознавателей речи.
класс SpeechSynthesisBookmarkEventArgs Класс для аргументов события синтеза речи. Добавлено в версию 1.16.0.
класс SpeechSynthesisCancellationDetails Содержит подробные сведения о том, почему результат был отменен. Добавлено в версию 1.4.0.
класс SpeechSynthesisEventArgs Класс для аргументов события синтеза речи. Добавлено в версию 1.4.0.
класса SpeechSynthesisRequest Класс, определяющий запрос синтеза речи. Этот класс находится в предварительной версии и подлежит изменению. Добавлено в версию 1.37.0.
класс SpeechSynthesisResult Содержит сведения о результатах синтеза текста в речь. Добавлено в версию 1.4.0.
класс SpeechSynthesisVisemeEventArgs Класс для аргументов события синтеза речи viseme. Добавлено в версию 1.16.0.
класс SpeechSynthesisWordBoundaryEventArgs Класс для аргументов события границы слова синтеза речи. Добавлено в версию 1.7.0.
класс SpeechSynthesizer Класс для синтезатора речи. Обновлено в версии 1.14.0.
класс SpeechTranslationModel Сведения о модели перевода речи.
класса SynthesisVoicesResult Содержит сведения о результатах из списка синтезаторов речи. Добавлено в версию 1.16.0.
класса VoiceInfo Содержит сведения об синтезе голосовых сведений, обновленных в версии 1.17.0.

Члены

enum PropertyId

Значения Описания
SpeechServiceConnection_Key Ключ подписки Службы распознавания речи Cognitive Services. Если вы используете распознаватель намерений, необходимо указать ключ конечной точки LUIS для конкретного приложения LUIS. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint Конечная точка службы распознавания речи Cognitive Services (URL-адрес). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromEndpoint. ПРИМЕЧАНИЕ. Эта конечная точка не совпадает с конечной точкой, используемой для получения маркера доступа.
SpeechServiceConnection_Region Регион Службы распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token Маркер авторизации Службы распознавания речи Cognitive Services (маркер доступа aka). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type Тип авторизации Службы распознавания речи Cognitive Services. В настоящее время не используется.
SpeechServiceConnection_EndpointId Идентификатор пользовательской речи Cognitive Services или конечной точки пользовательской голосовой службы. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetEndpointId. ПРИМЕЧАНИЕ. Идентификатор конечной точки доступен на пользовательском портале службы "Речь", указанном в разделе "Сведения о конечной точке".
SpeechServiceConnection_Host Узел службы распознавания речи Cognitive Services (URL-адрес). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName Имя узла прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_ProxyPort Порт прокси-сервера, используемый для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_ProxyUserName Имя пользователя прокси-сервера, используемого для подключения к службе "Речь" Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_ProxyPassword Пароль прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_Url Строка URL-адреса, созданная из конфигурации речи. Это свойство предназначено только для чтения. Пакет SDK используется внутри него. ПРИМЕЧАНИЕ. Добавлено в версию 1.5.0.
SpeechServiceConnection_ProxyHostBypass Указывает список узлов, для которых не следует использовать прокси-серверы. Этот параметр переопределяет все остальные конфигурации. Имена узлов разделены запятыми и соответствуют регистру без учета регистра. Подстановочные знаки не поддерживаются.
SpeechServiceConnection_TranslationToLanguages Список разделенных запятыми языков, используемых в качестве целевых языков перевода. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechTranslationConfig::AddTargetLanguage и SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice Имя голосового голоса Службы "Когнитивный сервис" для службы "Речь". В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechTranslationConfig::SetVoiceName. ПРИМЕЧАНИЕ. Допустимые имена голосов можно найти здесь.
SpeechServiceConnection_TranslationFeatures Функции перевода. Для внутреннего использования.
SpeechServiceConnection_IntentRegion Регион службы распознавания речи. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode Режим распознавания службы "Речь" Cognitive Services. Может быть "ИНТЕРАКТИВНЫЙ", "БЕСЕДА", "ДИКТОВКА". Это свойство предназначено только для чтения. Пакет SDK используется внутри него.
SpeechServiceConnection_RecoLanguage Язык для распознавания речи (в формате BCP-47). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId Идентификатор сеанса. Этот идентификатор является универсальным уникальным идентификатором (aka UUID), представляющим определенную привязку потока ввода звука и базовый экземпляр распознавания речи, к которому он привязан. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Параметры запроса, предоставляемые пользователями. Они будут переданы службе в качестве параметров запроса URL-адреса. Добавлено в версию 1.5.0.
SpeechServiceConnection_RecoBackend Строка, указывающая серверную часть, используемую для распознавания речи; допустимые параметры доступны в сети и в автономном режиме. В обычных обстоятельствах вы не должны использовать это свойство напрямую. В настоящее время автономный параметр действителен только при использовании EmbeddedSpeechConfig. Добавлено в версию 1.19.0.
SpeechServiceConnection_RecoModelName Имя модели, используемой для распознавания речи. В обычных обстоятельствах вы не должны использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версию 1.19.0.
SpeechServiceConnection_RecoModelKey Это свойство устарело.
SpeechServiceConnection_RecoModelIniFile Путь к файлу ini модели, который будет использоваться для распознавания речи. В обычных обстоятельствах вы не должны использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthLanguage Синтезированный язык (например, en-US) добавлен в версию 1.4.0.
SpeechServiceConnection_SynthVoice Имя голоса TTS, который будет использоваться для синтеза речи, добавленного в версии 1.4.0.
SpeechServiceConnection_SynthOutputFormat Строка для указания формата звука вывода TTS, добавленного в версии 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Указывает, используется ли сжатый формат звука для передачи звука синтеза речи. Это свойство влияет только в том случае, если SpeechServiceConnection_SynthOutputFormat задан формат pcm. Если это свойство не задано и GStreamer доступно, пакет SDK будет использовать сжатый формат для синтезированного аудиопередачи и декодировать его. Это свойство можно задать значение false, чтобы использовать необработанный формат pcm для передачи по проводу. Добавлено в версию 1.16.0.
SpeechServiceConnection_SynthBackend Строка для указания серверной части TTS; Допустимые параметры доступны в сети и в автономном режиме. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::FromPath или EmbeddedSpeechConfig::FromPaths, чтобы задать серверную часть синтеза в автономном режиме. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Пути к файлу данных для подсистемы автономного синтеза; допустимо только в том случае, если серверная часть синтеза находится в автономном режиме. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::FromPath или EmbeddedSpeechConfig::FromPaths. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthOfflineVoice Имя автономного голоса TTS, используемого для синтеза речи в обычных условиях, не следует использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::SetSpeechSynthesisVoice и EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthModelKey Это свойство устарело.
SpeechServiceConnection_VoicesListEndpoint Конечная точка API списка голосовых служб Cognitive Services (URL-адрес). В обычных условиях не нужно указывать это свойство, пакет SDK будет создавать его на основе региона или узла или конечной точки SpeechConfig. Добавлено в версию 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs Начальное значение времени ожидания молчания (в миллисекундах), используемое службой. Добавлено в версию 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs Значение времени ожидания окончания тишины (в миллисекундах), используемое службой. Добавлено в версию 1.5.0.
SpeechServiceConnection_EnableAudioLogging Логическое значение, указывающее, включена ли ведение журнала звука в службе. Журналы звука и содержимого хранятся в хранилище майкрософт или в собственной учетной записи хранения, связанной с подпиской Cognitive Services (перенос ресурса службы "Речь" с поддержкой byOS). Добавлено в версию 1.5.0.
SpeechServiceConnection_LanguageIdMode Режим идентификатора языка подключения службы распознавания речи. Может быть "AtStart" (по умолчанию) или "Непрерывный". См. документ идентификации языка. Добавлено в версии 1.25.0.
SpeechServiceConnection_TranslationCategoryId Категория преобразования подключения службы распознавания речи.
SpeechServiceConnection_AutoDetectSourceLanguages Языки источника, добавленные в версию 1.8.0, автоматически обнаруживаются.
SpeechServiceConnection_AutoDetectSourceLanguageResult Результат автоматического обнаружения исходного языка добавлен в версию 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse Запрошенный формат выходных данных ответа Службы распознавания речи Cognitive Services (простой или подробный). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse Запрошенный уровень ненормативной лексики службы распознавания речи Cognitive Services. В настоящее время не используется.
SpeechServiceResponse_ProfanityOption Запрошенный параметр ненормативной лексики службы распознавания речи Cognitive Services. Допустимые значения: "маскированные", "удаленные" и "необработанные". Добавлено в версию 1.5.0.
SpeechServiceResponse_PostProcessingOption Строковое значение, указывающее, какой параметр после обработки должен использоваться службой. Допустимые значения : TrueText. Добавлено в версию 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Логическое значение, указывающее, следует ли включать метки времени уровня слова в результат ответа. Добавлено в версию 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold Количество раз, когда слово должно быть возвращено в частичных результатах. Добавлено в версию 1.5.0.
SpeechServiceResponse_OutputFormatOption Строковое значение, указывающее параметр формата выходных данных в результате ответа. Только внутреннее использование. Добавлено в версию 1.5.0.
SpeechServiceResponse_RequestSnr Логическое значение, указывающее, следует ли включать SNR (сигнал к коэффициенту шума) в результат отклика. Добавлено в версию 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Логическое значение для запроса на стабилизацию частичных результатов перевода путем пропуска слов в конце. Добавлено в версию 1.5.0.
SpeechServiceResponse_RequestWordBoundary Логическое значение, указывающее, следует ли запрашивать события WordBoundary. Добавлено в версию 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Логическое значение, указывающее, следует ли запрашивать границу препинания в событиях WordBoundary. Значение по умолчанию — true. Добавлено в версию 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Логическое значение, указывающее, следует ли запрашивать границу предложения в событиях WordBoundary. Значение по умолчанию — false. Добавлено в версию 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio Логическое значение, указывающее, следует ли пакету SDK синхронизировать события метаданных синтеза (например, границы слов, viseme и т. д.) для воспроизведения звука. Это действует только при воспроизведении звука через пакет SDK. Значение по умолчанию — true. Если задано значение false, пакет SDK вызовет события, поступающие из службы, которые могут быть не синхронизированы с воспроизведением звука. Добавлено в версию 1.31.0.
SpeechServiceResponse_JsonResult Выходные данные ответа Службы распознавания речи Cognitive Services (в формате JSON). Это свойство доступно только для объектов результатов распознавания.
SpeechServiceResponse_JsonErrorDetails Сведения об ошибке Службы распознавания речи Cognitive Services (в формате JSON). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs Задержка распознавания в миллисекундах. Доступные только для чтения результаты речи, перевода и намерения. Это измеряет задержку между получением звукового ввода пакетом SDK и моментом получения окончательного результата от службы. Пакет SDK вычисляет разницу времени между последним фрагментом звука из входного звука, который способствует окончательному результату, и время получения окончательного результата от службы речи. Добавлено в версию 1.3.0.
SpeechServiceResponse_RecognitionBackend Серверная часть распознавания. Доступные только для чтения результаты распознавания речи. Это указывает, использовалось ли распознавание облачных (онлайн) или внедренных (автономных) для получения результата.
SpeechServiceResponse_SynthesisFirstByteLatencyMs Первая задержка синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет задержку между началом обработки синтеза и моментом доступности первого байтового звука. Добавлено в версию 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs Задержка синтеза речи всех байтов в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет задержку между процессом синтеза и моментом синтеза синтеза. Добавлено в версию 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs Время выполнения для синтеза речи в миллисекундах. Доступные только для чтения результаты в событиях SynthesisCompleted. Это измеряет общее время запуска от PropertyId::AudioConfig_PlaybackBufferLengthInMs заполнено для завершения синтеза. Добавлено в версию 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs Задержка соединения синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет задержку между началом обработки синтеза и моментом установления соединения HTTP/WebSocket. Добавлено в версию 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs Задержка сети синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет время кругового пути сети. Добавлено в версию 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs Задержка службы синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет время обработки службы для синтеза первого байта звука. Добавлено в версию 1.26.0.
SpeechServiceResponse_SynthesisBackend Указывает, какая серверная часть синтеза завершена. Доступные только для чтения результаты синтеза речи, за исключением результата события SynthesisStarted, добавленного в версии 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults Определяет, содержат ли промежуточные результаты идентификацию говорящего.
CancellationDetails_Reason Причина отмены. В настоящее время не используется.
CancellationDetails_ReasonText Текст отмены. В настоящее время не используется.
CancellationDetails_ReasonDetailedText Подробный текст отмены. В настоящее время не используется.
LanguageUnderstandingServiceResponse_JsonResult Выходные данные ответа службы распознавания речи (в формате JSON). Доступно через IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture Имя устройства для записи звука. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте AudioConfig::FromMicrophoneInput. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_NumberOfChannelsForCapture Количество каналов для записи звука. Только внутреннее использование. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_SampleRateForCapture Частота выборки (в Гц) для записи звука. Только внутреннее использование. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_BitsPerSampleForCapture Количество битов каждого примера для записи звука. Только внутреннее использование. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_AudioSource Источник звука. Допустимые значения: "Микрофоны", "Файл" и "Stream". Добавлено в версию 1.3.0.
AudioConfig_DeviceNameForRender Имя устройства для отрисовки звука. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте AudioConfig::FromSpeakerOutput. Добавлено в версию 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Длина буфера воспроизведения в миллисекундах по умолчанию составляет 50 миллисекундах.
AudioConfig_AudioProcessingOptions Параметры обработки звука в формате JSON.
Speech_LogFilename Имя файла для записи журналов. Добавлено в версию 1.4.0.
Speech_SegmentationSilenceTimeoutMs Продолжительность обнаруженного молчания, измеряемая в миллисекундах, после чего речь в тексте определит, что произнесенная фраза закончилась и создаст окончательный распознанный результат. Настройка этого времени ожидания может оказаться полезной в ситуациях, когда реченные входные данные значительно быстрее или медленнее, чем обычно, и поведение сегментации по умолчанию последовательно дает результаты, которые слишком длинные или слишком короткие. Значения времени ожидания сегментации, которые несоответствуют высокой или низкой, могут отрицательно повлиять на точность речи к тексту; это свойство должно быть тщательно настроено, а результирующее поведение должно быть тщательно проверено как предполагаемое.
Speech_SegmentationMaximumTimeMs Максимальная длина произнесенных фраз при использовании стратегии сегментации "Время". По мере того как длина речевых фраз приближается к этому значению, Speech_SegmentationSilenceTimeoutMs начнет уменьшаться до тех пор, пока не будет достигнуто время ожидания молчания фразы, или фраза достигает максимальной длины.
Speech_SegmentationStrategy Стратегия, используемая для определения окончания фразы и окончательного распознаваемого результата. Допустимые значения: Default, Time и "Semantic".
Conversation_ApplicationId Идентификатор, используемый для подключения к серверной службе. Добавлено в версию 1.5.0.
Conversation_DialogType Тип серверной части диалогового окна для подключения. Добавлено в версию 1.7.0.
Conversation_Initial_Silence_Timeout Время ожидания молчания для прослушивания добавлено в версии 1.5.0.
Conversation_From_Id Идентификатор, используемый для действий распознавания речи, добавленных в версии 1.5.0.
Conversation_Conversation_Id ConversationId для сеанса. Добавлено в версию 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Разделенный запятыми список пользовательских идентификаторов голосового развертывания. Добавлено в версию 1.8.0.
Conversation_Speech_Activity_Template Шаблон действия речи, свойства метки в шаблоне действия, созданного службой для речи. Добавлено в версию 1.10.0.
Conversation_ParticipantId Идентификатор участника в текущей беседе. Добавлено в версию 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp Метка времени, связанная с буфером данных, записанным клиентом при использовании потоков ввода входных данных по запросу или push-отправке. Метка времени — это 64-разрядное значение с разрешением 90 кГц. Это то же самое, что метка времени презентации в потоке транспорта MPEG. См. https://en.wikipedia.org/wiki/Presentation_timestamp добавлено в версию 1.5.0.
DataBuffer_UserId Идентификатор пользователя, связанный с буфером данных, написанным клиентом, при использовании потоков ввода входных данных по запросу или push-отправке. Добавлено в версию 1.5.0.
PronunciationAssessment_ReferenceText Справочный текст звука для оценки произношения. Для этого и следующих параметров оценки произношения см. в таблице параметры оценки произношения. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create или PronunciationAssessmentConfig::SetReferenceText. Добавлено в версию 1.14.0.
PronunciationAssessment_GradingSystem Система точек для калибровки показателей произношения (FivePoint или HundredMark). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_Granularity Степень детализации произношения (Phoneme, Word или FullText). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_EnableMiscue Определяет, включена ли функция неправильного вычисления. В этом случае выраженные слова будут сравниваться с справочным текстом и будут помечены с пропуском и вставкой на основе сравнения. Значение по умолчанию — False. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_PhonemeAlphabet Алфавит фонемы оценки произношения. Допустимые значения: SAPI (по умолчанию) и IPA в обычных обстоятельствах, вам не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::SetPhonemeAlphabet. Добавлено в версию 1.20.0.
PronunciationAssessment_NBestPhonemeCount Оценка произношения nbest phoneme count. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::SetNBestPhonemeCount. Добавлено в версию 1.20.0.
PronunciationAssessment_EnableProsodyAssessment Следует ли включить оценку просодии. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте произношениеAssessmentConfig::EnableProsodyAssessment. Добавлено в версию 1.33.0.
PronunciationAssessment_Json Строка json параметров оценки произношения в обычных обстоятельствах не должна использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_Params Параметры оценки произношения. Это свойство предназначено только для чтения. Пакет SDK используется внутри него. Добавлено в версию 1.14.0.
PronunciationAssessment_ContentTopic Тема содержимого оценки произношения. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::EnableContentAssessmentWithTopic. Добавлено в версию 1.33.0.
SpeakerRecognition_Api_Version Версия API распознавания говорящего. Это свойство добавляется для разрешения тестирования и использования предыдущих версий API распознавания говорящего, где это применимо. Добавлено в версию 1.18.0.
SpeechTranslation_ModelName Имя модели, используемой для перевода речи. Не используйте это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig.
SpeechTranslation_ModelKey Это свойство устарело.
KeywordRecognition_ModelName Имя модели, используемой для распознавания ключевых слов. Не используйте это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig.
KeywordRecognition_ModelKey Это свойство устарело.
EmbeddedSpeech_EnablePerformanceMetrics Включите коллекцию встроенных метрик производительности речи, которые можно использовать для оценки возможностей устройства для использования внедренной речи. Собранные данные включаются в результаты конкретных сценариев, таких как распознавание речи. Значение по умолчанию — false. Обратите внимание, что метрики могут быть недоступны во всех внедренных сценариях речи.
SpeechSynthesisRequest_Pitch Шаг синтезированного слова.
SpeechSynthesisRequest_Rate Скорость синтезированного речи.
SpeechSynthesisRequest_Volume Объем синтезированного речи.

Определяет идентификаторы свойства речи. Изменено в версии 1.4.0.

перечисление OutputFormat

Значения Описания
Простой
Подробный

Формат вывода.

enum ProfanityOption

Значения Описания
Замаскированный Заменяет буквы ненормативными словами звездными символами.
Удаленный Удаляет ненормативные слова.
Сырой Не делает ничего профилирования слов.

Удаляет ненормативную лексику (ношение) или заменяет буквы ненормативных слов звездами. Добавлено в версию 1.5.0.

перечисление ResultReason

Значения Описания
NoMatch Указывает, что не удалось распознать речь. Дополнительные сведения можно найти в объекте NoMatchDetails.
Аннулированный Указывает, что распознавание было отменено. Дополнительные сведения можно найти с помощью объекта CancellationDetails.
РаспознаваниеSpeech Указывает, что результат речи содержит текст гипотезы.
RecognizedSpeech Указывает, что результат речи содержит окончательный текст, распознанный. Распознавание речи теперь завершено для этой фразы.
РаспознаниеIntent Указывает результат намерения содержит текст гипотезы и намерение.
РаспознанныйIntent Указывает, что результат намерения содержит окончательный текст и намерение. Определение распознавания речи и намерения теперь завершено для этой фразы.
ПереводSpeech Указывает, что результат перевода содержит текст гипотезы и его переводы.
ПереводedSpeech Указывает, что результат перевода содержит окончательный текст и соответствующие переводы. Распознавание речи и перевод теперь завершены для этой фразы.
СинтезированиеAudio Указывает, что синтезированный результат звука содержит ненулевое количество звуковых данных.
СинтезированиеAudioCompleted Указывает, что синтезированный звук теперь завершен для этой фразы.
Распознаваниеkeyword Указывает, что результат речи содержит текст ключевого слова (непроверенный). Добавлено в версию 1.3.0.
РаспознанныйKeyword Указывает, что распознавание ключевых слов завершило распознавание заданного ключевого слова. Добавлено в версию 1.3.0.
СинтезированиеAudioStarted Указывает, что синтез речи теперь запущен в версии 1.4.0.
ПереводParticipantSpeech Указывает, что результат транскрибирования содержит текст гипотезы и его переводы для других участников беседы. Добавлено в версию 1.8.0.
ПереводedParticipantSpeech Указывает результат транскрибирования содержит окончательный текст и соответствующие переводы для других участников беседы. Распознавание речи и перевод теперь завершены для этой фразы. Добавлено в версию 1.8.0.
ПереводedInstantMessage Указывает результат транскрибирования, содержащий мгновенное сообщение и соответствующие переводы. Добавлено в версию 1.8.0.
ПреобразованиеParticipantInstantMessage Указывает, что результат транскрибирования содержит мгновенное сообщение для других участников беседы и соответствующих переводов. Добавлено в версию 1.8.0.
РегистрацияVoiceProfile Указывает, что профиль голосовой связи регистрируется, и клиентам необходимо отправить больше звука для создания голосового профиля. Добавлено в версию 1.12.0.
EnrolledVoiceProfile Профиль голосовой связи зарегистрирован. Добавлено в версию 1.12.0.
Распознанные фрагменты Указывает на успешную идентификацию некоторых ораторов. Добавлено в версию 1.12.0.
РаспознанныйSpeaker Указывает успешно проверенный один динамик. Добавлено в версию 1.12.0.
ResetVoiceProfile Указывает, что профиль голосовой связи успешно сброшен. Добавлено в версию 1.12.0.
DeletedVoiceProfile Указывает, что профиль голосовой связи успешно удален. Добавлено в версию 1.12.0.
VoicesListRetrieved Указывает, что список голосов успешно получен. Добавлено в версию 1.16.0.

Указывает возможные причины, по которым может быть создан результат распознавания.

перечисление CancellationReason

Значения Описания
Ошибка Указывает, что во время распознавания речи произошла ошибка.
EndOfStream Указывает, что достигнут конец аудиопотока.
ОтмененоByUser Указывает, что запрос был отменен пользователем. Добавлено в версию 1.14.0.

Определяет возможные причины отмены результата распознавания.

перечисление CancellationErrorCode

Значения Описания
NoError Нет ошибки. Если Значение "ОтменаReason" имеет значение EndOfStream, значение "ОтменаErrorCode" имеет значение NoError.
AuthenticationFailure Указывает ошибку проверки подлинности. Ошибка проверки подлинности возникает, если ключ подписки или маркер авторизации недопустим, истек или не соответствует используемому региону.
BadRequest Указывает, что один или несколько параметров распознавания недопустимы или формат звука не поддерживается.
TooManyRequests Указывает, что число параллельных запросов превысило число разрешенных параллельных транскрибирования для подписки.
Запретный Указывает, что бесплатная подписка, используемая запросом, закончилась квотой.
ConnectionFailure Указывает ошибку подключения.
ServiceTimeout Указывает ошибку времени ожидания при ожидании ответа от службы.
ServiceError Указывает, что служба возвращает ошибку.
ServiceUnavailable Указывает, что служба в настоящее время недоступна.
RuntimeError Указывает непредвиденная ошибка среды выполнения.
ServiceRedirectTemporary Указывает, что служба "Речь" временно запрашивает повторное подключение к другой конечной точке.
ServiceRedirectPermanent Указывает, что служба "Речь" постоянно запрашивает повторное подключение к другой конечной точке.
EmbeddedModelError Указывает, что модель встроенной речи (SR или TTS) недоступна или повреждена.

Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0.

перечисление NoMatchReason

Значения Описания
NotRecognized Указывает, что речь обнаружена, но не распознана.
InitialSilenceTimeout Указывает, что начало аудиопотока содержало только молчание, и служба истекла время ожидания речи.
InitialBabbleTimeout Указывает, что начало аудиопотока содержало только шум, а служба истекла время ожидания речи.
KeywordNotRecognized Указывает, что обнаруженное ключевое слово было отклонено службой проверки ключевых слов. Добавлено в версию 1.5.0.
EndSilenceTimeout Указывает, что аудиопоток содержал только молчание после последней распознанной фразы.

Определяет возможные причины, по которым результат распознавания не распознается.

перечисление ActivityJSONType

Значения Описания
Недействительный
Объект
Массив
Струна
Двойной
UInt
Int
Булев

Определяет возможные типы для значения json действия. Добавлено в версию 1.5.0.

перечисление SpeechSynthesisOutputFormat

Значения Описания
Raw8Khz8BitMonoMULaw raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16khz-16kbps-mono-siren Unsupported службой. Не используйте это значение.
Audio16Khz16KbpsMonoSiren audio-16khz-16kbps-mono-siren Unsupported службой. Не используйте это значение.
Audio16Khz32KBitRateMonoMp3 audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48khz-16bit-mono-opus добавлено в версии 1.16.0
Webm16Khz16BitMonoOpus webm-16khz-16bit-mono-opus добавлен в версии 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus добавлен в версии 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24khz-16bit-mono-truesilk добавлен в версии 1.17.0
Raw8Khz8BitMonoALaw raw-8khz-8bit-mono-alaw добавлен в версии 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw добавлен в версии 1.17.0
Webm24Khz16Bit24KbpsMonoOpus webm-24khz-16bit-24kbps-mono-opus Audio, сжатый кодеком OPUS в контейнере WebM, с скоростью 24 кб/с, оптимизированной для сценария Интернета вещей. (Добавлено в версии 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus audio-16khz-16bit-32kbps-mono-opus Audio, сжатый кодеком OPUS без контейнера, с скоростью 32 кб/с. (Добавлено в версии 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus audio-24khz-16bit-48kbps-mono-opus Audio, сжатый кодеком OPUS без контейнера, с скоростью 48 кб/с. (Добавлено в версии 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus audio-24khz-16bit-24kbps-mono-opus Audio, сжатый кодеком OPUS без контейнера, с скоростью 24 кб/с. (Добавлено в версии 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Raw PCM audio на частоте выборки 22050Гц и 16-разрядной глубине. (Добавлено в версии 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM audio на частоте выборки 22050Гц и 16-разрядной глубине с заголовком RIFF. (Добавлено в версии 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Raw PCM audio на частоте выборки 44100Гц и 16-разрядной глубине. (Добавлено в версии 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm PCM аудио с частотой выборки 44100Гц и 16-разрядной глубиной с заголовком RIFF. (Добавлено в версии 1.22.0)
AmrWb16000Гц amr-wb-16000гц AMR-WB звук с частотой выборки 16 кГц. (Добавлено в версии 1.24.0)
G72216Khz64Kbps g722-16khz-64kbps G.722 аудио с частотой выборки 16 кГц и скоростью 64 кб/с. (Добавлено в версии 1.38.0)

Определяет возможные форматы звука синтеза речи. Обновлено в версии 1.19.0.

перечисление StreamStatus

Значения Описания
Неизвестный Состояние потока аудиоданных неизвестно.
NoData Поток аудиоданных не содержит данных.
Частичные данные Поток звуковых данных содержит частичные данные голосового запроса.
AllData Поток аудиоданных содержит все данные голосового запроса.
Аннулированный Поток аудиоданных был отменен.

Определяет возможное состояние потока звуковых данных. Добавлено в версию 1.4.0.

enum ServicePropertyChannel

Значения Описания
UriQueryParameter Использует параметр запроса URI для передачи параметров свойств в службу.
HttpHeader Использует HttpHeader для задания ключа или значения в заголовке HTTP.

Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.5.0.

перечисление VoiceProfileType

Значения Описания
TextIndependentIdentification Идентификация независимого докладчика от текста.
TextDependentVerification Проверка зависимых от текста динамиков.
TextIndependentVerification Независимая проверка текста.

Определяет типы профилей голоса.

перечисление RecognitionFactorScope

Значения Описания
Частичная фраза Фактор распознавания будет применяться к грамматикам, на которые можно ссылаться как на отдельные частичные фразы.

Определяет область применения фактора распознавания.

перечисление PronunciationAssessmentGradingSystem

Значения Описания
FivePoint Пять точек калибровки.
Сотмарк Сотня отметки.

Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.14.0.

перечисление ПроизношениеAssessmentGranularity

Значения Описания
Фонема Отображает оценку на уровне полнотекстового текста, слова и фонемы.
Слово Отображает оценку на уровне полнотекстового и текстового текста.
FullText Отображает оценку только на уровне полнотекстового текста.

Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.14.0.

enum SynthesisVoiceType

Значения Описания
OnlineNeural Нейронный голос в Интернете.
OnlineStandard Онлайн стандартный голос.
АвтономныйNeural Автономный нейронный голос.
Автономныйstandard Автономный стандартный голос.

Определяет тип голосов синтеза, добавленных в версию 1.16.0.

перечисление SynthesisVoiceGender

Значения Описания
Неизвестный Пол неизвестен.
Женский Женский голос.
Мужской Мужской голос.

Определяет пол голосов синтеза, добавленных в версию 1.17.0.

enum SpeechSynthesisBoundaryType

Значения Описания
Слово Граница Word.
Пунктуация Граница препинания.
Предложение Граница предложения.

Определяет тип границы события границ синтеза речи, добавленного в версию 1.21.0.

перечисление SegmentationStrategy

Значения Описания
По умолчанию Используйте стратегию и параметры по умолчанию, определяемые службой "Речь". Используйте в большинстве случаев.
Время Использует стратегию на основе времени, в которой используется количество молчания между речью, чтобы определить, когда создается окончательный результат.
Семантический Использует модель искусственного интеллекта для сдерживания конца фразы на основе содержимого фразы.

Стратегия, используемая для определения окончания фразы и окончательного распознаваемого результата. Допустимые значения: Default, Time и "Semantic".