Пространство имен Microsoft::CognitiveServices::Speech

Статья
03/20/2025

Сводка

Члены	Описания
перечисление PropertyId	Определяет идентификаторы свойства речи. Изменено в версии 1.4.0.
перечисление OutputFormat	Формат вывода.
перечисление ProfanityOption	Удаляет ненормативную лексику (ношение) или заменяет буквы ненормативных слов звездами. Добавлено в версию 1.5.0.
перечисление ResultReason	Указывает возможные причины, по которым может быть создан результат распознавания.
перечисление CancellationReason	Определяет возможные причины отмены результата распознавания.
перечисление CancellationErrorCode	Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0.
перечисление NoMatchReason	Определяет возможные причины, по которым результат распознавания не распознается.
перечисление ActivityJSONType	Определяет возможные типы для значения json действия. Добавлено в версию 1.5.0.
перечисление SpeechSynthesisOutputFormat	Определяет возможные форматы звука синтеза речи. Обновлено в версии 1.19.0.
перечисление StreamStatus	Определяет возможное состояние потока звуковых данных. Добавлено в версию 1.4.0.
перечисление ServicePropertyChannel	Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.5.0.
перечисление VoiceProfileType	Определяет типы профилей голоса.
перечисление RecognitionFactorScope	Определяет область применения фактора распознавания.
перечисление "ПроизношениеAssessmentGradingSystem	Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.14.0.
перечислениеAssessmentGranularity	Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.14.0.
перечисление SynthesisVoiceType	Определяет тип голосов синтеза, добавленных в версию 1.16.0.
перечисление SynthesisVoiceGender	Определяет пол голосов синтеза, добавленных в версию 1.17.0.
перечисление SynthesisVoiceStatus	Определяет состояние голосов синтеза.
перечисление SpeechSynthesisBoundaryType	Определяет тип границы события границ синтеза речи, добавленного в версию 1.21.0.
перечисление SegmentationStrategy	Стратегия, используемая для определения окончания фразы и окончательного распознаваемого результата. Допустимые значения: Default, Time и "Semantic".
класса AsyncRecognizer	Абстрактный базовый класс AsyncRecognizer.
класса AudioDataStream	Представляет поток аудиоданных, используемый для работы звуковых данных в виде потока. Добавлено в версию 1.4.0.
класса AutoDetectSourceLanguageConfig	Класс, определяющий конфигурацию источника автоматического обнаружения, обновленную в версии 1.13.0.
класса AutoDetectSourceLanguageResult	Содержит результат автоматического обнаружения исходного языка, добавленный в версии 1.8.0.
класс BaseAsyncRecognizer	Класс BaseAsyncRecognizer.
класса CancellationDetails	Содержит подробные сведения о том, почему результат был отменен.
класс ClassLanguageModel	Представляет список грамматик для динамических сценариев грамматики. Добавлено в версию 1.7.0.
класса Connection	Подключение — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет дополнительные методы, которые пользователи могут явно открывать или закрывать подключение, а также подписываться на изменения состояния подключения. Использование подключения является необязательным. Он предназначен для сценариев, в которых требуется точное изменение поведения приложения на основе состояния подключения. Пользователи могут при необходимости вызвать Open(), чтобы вручную инициировать подключение к службе перед началом распознавания распознавателя, связанного с этим подключением. После запуска распознавания вызов Open() или Close() может завершиться ошибкой. Это не повлияет на распознавателя или текущее распознавание. Подключение может отпасть по различным причинам, распознаватель всегда пытается повторно переустановить подключение, как это необходимо для обеспечения текущих операций. Во всех этих случаях события connected/Disconnected указывают на изменение состояния подключения. Обновлено в версии 1.17.0.
класса ConnectionEventArgs	Предоставляет данные для ConnectionEvent. Добавлено в версию 1.2.0.
класс ConnectionMessage	ConnectionMessage представляет конкретные сообщения реализации, отправленные и полученные из службы речи. Эти сообщения предоставляются для отладки и не должны использоваться для рабочих вариантов использования с помощью службы "Речь Azure Cognitive Services". Сообщения, отправленные и полученные из службы "Речь", могут изменяться без уведомления. К ним относятся содержимое сообщения, заголовки, полезные данные, упорядочивание и т. д. Добавлено в версию 1.10.0.
класс ConnectionMessageEventArgs	Предоставляет данные для ConnectionMessageEvent.
класс EmbeddedSpeechConfig	Класс, определяющий встроенную (автономную) конфигурацию речи.
класса EventArgs	Базовый класс для аргументов событий.
класса EventSignal	Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы остановить получение событий.
класса EventSignalBase	Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы остановить получение событий.
класса Grammar	Представляет грамматику базового класса для настройки распознавания речи. Добавлено в версию 1.5.0.
класса GrammarList	Представляет список грамматик для динамических сценариев грамматики. Добавлено в версию 1.7.0.
класс GrammarPhrase	Представляет фразу, которую может говорить пользователь. Добавлено в версию 1.5.0.
класса HybridSpeechConfig	Класс, определяющий гибридные (облачные и внедренные) конфигурации для распознавания речи или синтеза речи.
класса KeywordRecognitionEventArgs	Класс для событий, эмитированных KeywordRecognizer.
класса KeywordRecognitionModel	Представляет модель распознавания ключевых слов, используемую с методами StartKeywordRecognitionAsync.
класс KeywordRecognitionResult	Класс, определяющий результаты, создаваемые KeywordRecognizer.
класс KeywordRecognizer	Тип распознавателя, специализированный для обработки только активации ключевых слов.
класс NoMatchDetails	Содержит подробные сведения о результатах распознавания NoMatch.
класс PersonalVoiceSynthesisRequest	Класс, определяющий запрос синтеза речи для личного голоса (aka.ms/azureai/personal-voice). Этот класс находится в предварительной версии и подлежит изменению. Добавлено в версию 1.39.0.
класс PhraseListGrammar	Представляет грамматику списка фраз для сценариев динамической грамматики. Добавлено в версию 1.5.0.
класс PronunciationAssessmentConfig	Класс, определяющий конфигурацию оценки произношения, добавленную в версии 1.14.0.
класс PronunciationAssessmentResult	Класс для результатов оценки произношения.
класс ПроизношениеContentAssessmentResult	Класс для результатов оценки содержимого.
класса PropertyCollection	Класс для получения или задания значения свойства из коллекции свойств.
класса RecognitionEventArgs	Предоставляет данные для RecognitionEvent.
класса RecognitionResult	Содержит подробные сведения о результатах операции распознавания.
класса Распознавателя	Базовый класс Распознавателя.
класса SessionEventArgs	Базовый класс для аргументов событий сеанса.
класс SmartHandle	Класс smart handle.
класса SourceLanguageConfig	Класс, определяющий конфигурацию исходного языка, добавленный в версию 1.8.0.
класс SourceLanguageRecognizer	Класс для распознавателей исходного языка. Этот класс можно использовать для автономного обнаружения языка. Добавлено в версию 1.17.0.
класса SpeechConfig	Класс, определяющий конфигурации для распознавания речи или намерения или синтеза речи.
класс SpeechRecognitionCanceledEventArgs	Класс для отмены аргументов события распознавания речи.
класс SpeechRecognitionEventArgs	Класс для аргументов событий распознавания речи.
класс SpeechRecognitionModel	Сведения о модели распознавания речи.
класса SpeechRecognitionResult	Базовый класс для результатов распознавания речи.
класса SpeechRecognizer	Класс для распознавателей речи.
класс SpeechSynthesisBookmarkEventArgs	Класс для аргументов события синтеза речи. Добавлено в версию 1.16.0.
класс SpeechSynthesisCancellationDetails	Содержит подробные сведения о том, почему результат был отменен. Добавлено в версию 1.4.0.
класс SpeechSynthesisEventArgs	Класс для аргументов события синтеза речи. Добавлено в версию 1.4.0.
класса SpeechSynthesisRequest	Класс, определяющий запрос синтеза речи. Этот класс находится в предварительной версии и подлежит изменению. Добавлено в версию 1.37.0.
класс SpeechSynthesisResult	Содержит сведения о результатах синтеза текста в речь. Добавлено в версию 1.4.0.
класс SpeechSynthesisVisemeEventArgs	Класс для аргументов события синтеза речи viseme. Добавлено в версию 1.16.0.
класс SpeechSynthesisWordBoundaryEventArgs	Класс для аргументов события границы слова синтеза речи. Добавлено в версию 1.7.0.
класс SpeechSynthesizer	Класс для синтезатора речи. Обновлено в версии 1.14.0.
класс SpeechTranslationModel	Сведения о модели перевода речи.
класса SynthesisVoicesResult	Содержит сведения о результатах из списка синтезаторов речи. Добавлено в версию 1.16.0.
класса VoiceInfo	Содержит сведения об синтезе голосовых сведений, обновленных в версии 1.17.0.

Члены

enum PropertyId

Значения	Описания
SpeechServiceConnection_Key	Ключ подписки Службы распознавания речи Cognitive Services. Если вы используете распознаватель намерений, необходимо указать ключ конечной точки LUIS для конкретного приложения LUIS. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint	Конечная точка службы распознавания речи Cognitive Services (URL-адрес). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromEndpoint. ПРИМЕЧАНИЕ. Эта конечная точка не совпадает с конечной точкой, используемой для получения маркера доступа.
SpeechServiceConnection_Region	Регион Службы распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token	Маркер авторизации Службы распознавания речи Cognitive Services (маркер доступа aka). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type	Тип авторизации Службы распознавания речи Cognitive Services. В настоящее время не используется.
SpeechServiceConnection_EndpointId	Идентификатор пользовательской речи Cognitive Services или конечной точки пользовательской голосовой службы. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetEndpointId. ПРИМЕЧАНИЕ. Идентификатор конечной точки доступен на пользовательском портале службы "Речь", указанном в разделе "Сведения о конечной точке".
SpeechServiceConnection_Host	Узел службы распознавания речи Cognitive Services (URL-адрес). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName	Имя узла прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_ProxyPort	Порт прокси-сервера, используемый для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_ProxyUserName	Имя пользователя прокси-сервера, используемого для подключения к службе "Речь" Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_ProxyPassword	Пароль прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.1.0.
SpeechServiceConnection_Url	Строка URL-адреса, созданная из конфигурации речи. Это свойство предназначено только для чтения. Пакет SDK используется внутри него. ПРИМЕЧАНИЕ. Добавлено в версию 1.5.0.
SpeechServiceConnection_ProxyHostBypass	Указывает список узлов, для которых не следует использовать прокси-серверы. Этот параметр переопределяет все остальные конфигурации. Имена узлов разделены запятыми и соответствуют регистру без учета регистра. Подстановочные знаки не поддерживаются.
SpeechServiceConnection_TranslationToLanguages	Список разделенных запятыми языков, используемых в качестве целевых языков перевода. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechTranslationConfig::AddTargetLanguage и SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice	Имя голосового голоса Службы "Когнитивный сервис" для службы "Речь". В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechTranslationConfig::SetVoiceName. ПРИМЕЧАНИЕ. Допустимые имена голосов можно найти здесь.
SpeechServiceConnection_TranslationFeatures	Функции перевода. Для внутреннего использования.
SpeechServiceConnection_IntentRegion	Регион службы распознавания речи. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode	Режим распознавания службы "Речь" Cognitive Services. Может быть "ИНТЕРАКТИВНЫЙ", "БЕСЕДА", "ДИКТОВКА". Это свойство предназначено только для чтения. Пакет SDK используется внутри него.
SpeechServiceConnection_RecoLanguage	Язык для распознавания речи (в формате BCP-47). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId	Идентификатор сеанса. Этот идентификатор является универсальным уникальным идентификатором (aka UUID), представляющим определенную привязку потока ввода звука и базовый экземпляр распознавания речи, к которому он привязан. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters	Параметры запроса, предоставляемые пользователями. Они будут переданы службе в качестве параметров запроса URL-адреса. Добавлено в версию 1.5.0.
SpeechServiceConnection_RecoBackend	Строка, указывающая серверную часть, используемую для распознавания речи; допустимые параметры доступны в сети и в автономном режиме. В обычных обстоятельствах вы не должны использовать это свойство напрямую. В настоящее время автономный параметр действителен только при использовании EmbeddedSpeechConfig. Добавлено в версию 1.19.0.
SpeechServiceConnection_RecoModelName	Имя модели, используемой для распознавания речи. В обычных обстоятельствах вы не должны использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версию 1.19.0.
SpeechServiceConnection_RecoModelKey	Это свойство устарело.
SpeechServiceConnection_RecoModelIniFile	Путь к файлу ini модели, который будет использоваться для распознавания речи. В обычных обстоятельствах вы не должны использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthLanguage	Синтезированный язык (например, en-US) добавлен в версию 1.4.0.
SpeechServiceConnection_SynthVoice	Имя голоса TTS, который будет использоваться для синтеза речи, добавленного в версии 1.4.0.
SpeechServiceConnection_SynthOutputFormat	Строка для указания формата звука вывода TTS, добавленного в версии 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission	Указывает, используется ли сжатый формат звука для передачи звука синтеза речи. Это свойство влияет только в том случае, если SpeechServiceConnection_SynthOutputFormat задан формат pcm. Если это свойство не задано и GStreamer доступно, пакет SDK будет использовать сжатый формат для синтезированного аудиопередачи и декодировать его. Это свойство можно задать значение false, чтобы использовать необработанный формат pcm для передачи по проводу. Добавлено в версию 1.16.0.
SpeechServiceConnection_SynthBackend	Строка для указания серверной части TTS; Допустимые параметры доступны в сети и в автономном режиме. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::FromPath или EmbeddedSpeechConfig::FromPaths, чтобы задать серверную часть синтеза в автономном режиме. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath	Пути к файлу данных для подсистемы автономного синтеза; допустимо только в том случае, если серверная часть синтеза находится в автономном режиме. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::FromPath или EmbeddedSpeechConfig::FromPaths. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthOfflineVoice	Имя автономного голоса TTS, используемого для синтеза речи в обычных условиях, не следует использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::SetSpeechSynthesisVoice и EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Добавлено в версию 1.19.0.
SpeechServiceConnection_SynthModelKey	Это свойство устарело.
SpeechServiceConnection_VoicesListEndpoint	Конечная точка API списка голосовых служб Cognitive Services (URL-адрес). В обычных условиях не нужно указывать это свойство, пакет SDK будет создавать его на основе региона или узла или конечной точки SpeechConfig. Добавлено в версию 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs	Начальное значение времени ожидания молчания (в миллисекундах), используемое службой. Добавлено в версию 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs	Значение времени ожидания окончания тишины (в миллисекундах), используемое службой. Добавлено в версию 1.5.0.
SpeechServiceConnection_EnableAudioLogging	Логическое значение, указывающее, включена ли ведение журнала звука в службе. Журналы звука и содержимого хранятся в хранилище майкрософт или в собственной учетной записи хранения, связанной с подпиской Cognitive Services (перенос ресурса службы "Речь" с поддержкой byOS). Добавлено в версию 1.5.0.
SpeechServiceConnection_LanguageIdMode	Режим идентификатора языка подключения службы распознавания речи. Может быть "AtStart" (по умолчанию) или "Непрерывный". См. документ идентификации языка. Добавлено в версии 1.25.0.
SpeechServiceConnection_TranslationCategoryId	Категория преобразования подключения службы распознавания речи.
SpeechServiceConnection_AutoDetectSourceLanguages	Языки источника, добавленные в версию 1.8.0, автоматически обнаруживаются.
SpeechServiceConnection_AutoDetectSourceLanguageResult	Результат автоматического обнаружения исходного языка добавлен в версию 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse	Запрошенный формат выходных данных ответа Службы распознавания речи Cognitive Services (простой или подробный). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse	Запрошенный уровень ненормативной лексики службы распознавания речи Cognitive Services. В настоящее время не используется.
SpeechServiceResponse_ProfanityOption	Запрошенный параметр ненормативной лексики службы распознавания речи Cognitive Services. Допустимые значения: "маскированные", "удаленные" и "необработанные". Добавлено в версию 1.5.0.
SpeechServiceResponse_PostProcessingOption	Строковое значение, указывающее, какой параметр после обработки должен использоваться службой. Допустимые значения : TrueText. Добавлено в версию 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps	Логическое значение, указывающее, следует ли включать метки времени уровня слова в результат ответа. Добавлено в версию 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold	Количество раз, когда слово должно быть возвращено в частичных результатах. Добавлено в версию 1.5.0.
SpeechServiceResponse_OutputFormatOption	Строковое значение, указывающее параметр формата выходных данных в результате ответа. Только внутреннее использование. Добавлено в версию 1.5.0.
SpeechServiceResponse_RequestSnr	Логическое значение, указывающее, следует ли включать SNR (сигнал к коэффициенту шума) в результат отклика. Добавлено в версию 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult	Логическое значение для запроса на стабилизацию частичных результатов перевода путем пропуска слов в конце. Добавлено в версию 1.5.0.
SpeechServiceResponse_RequestWordBoundary	Логическое значение, указывающее, следует ли запрашивать события WordBoundary. Добавлено в версию 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary	Логическое значение, указывающее, следует ли запрашивать границу препинания в событиях WordBoundary. Значение по умолчанию — true. Добавлено в версию 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary	Логическое значение, указывающее, следует ли запрашивать границу предложения в событиях WordBoundary. Значение по умолчанию — false. Добавлено в версию 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio	Логическое значение, указывающее, следует ли пакету SDK синхронизировать события метаданных синтеза (например, границы слов, viseme и т. д.) для воспроизведения звука. Это действует только при воспроизведении звука через пакет SDK. Значение по умолчанию — true. Если задано значение false, пакет SDK вызовет события, поступающие из службы, которые могут быть не синхронизированы с воспроизведением звука. Добавлено в версию 1.31.0.
SpeechServiceResponse_JsonResult	Выходные данные ответа Службы распознавания речи Cognitive Services (в формате JSON). Это свойство доступно только для объектов результатов распознавания.
SpeechServiceResponse_JsonErrorDetails	Сведения об ошибке Службы распознавания речи Cognitive Services (в формате JSON). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs	Задержка распознавания в миллисекундах. Доступные только для чтения результаты речи, перевода и намерения. Это измеряет задержку между получением звукового ввода пакетом SDK и моментом получения окончательного результата от службы. Пакет SDK вычисляет разницу времени между последним фрагментом звука из входного звука, который способствует окончательному результату, и время получения окончательного результата от службы речи. Добавлено в версию 1.3.0.
SpeechServiceResponse_RecognitionBackend	Серверная часть распознавания. Доступные только для чтения результаты распознавания речи. Это указывает, использовалось ли распознавание облачных (онлайн) или внедренных (автономных) для получения результата.
SpeechServiceResponse_SynthesisFirstByteLatencyMs	Первая задержка синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет задержку между началом обработки синтеза и моментом доступности первого байтового звука. Добавлено в версию 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs	Задержка синтеза речи всех байтов в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет задержку между процессом синтеза и моментом синтеза синтеза. Добавлено в версию 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs	Время выполнения для синтеза речи в миллисекундах. Доступные только для чтения результаты в событиях SynthesisCompleted. Это измеряет общее время запуска от PropertyId::AudioConfig_PlaybackBufferLengthInMs заполнено для завершения синтеза. Добавлено в версию 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs	Задержка соединения синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет задержку между началом обработки синтеза и моментом установления соединения HTTP/WebSocket. Добавлено в версию 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs	Задержка сети синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет время кругового пути сети. Добавлено в версию 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs	Задержка службы синтеза речи в миллисекундах. Доступные только для чтения результаты синтеза речи. Это измеряет время обработки службы для синтеза первого байта звука. Добавлено в версию 1.26.0.
SpeechServiceResponse_SynthesisBackend	Указывает, какая серверная часть синтеза завершена. Доступные только для чтения результаты синтеза речи, за исключением результата события SynthesisStarted, добавленного в версии 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults	Определяет, содержат ли промежуточные результаты идентификацию говорящего.
CancellationDetails_Reason	Причина отмены. В настоящее время не используется.
CancellationDetails_ReasonText	Текст отмены. В настоящее время не используется.
CancellationDetails_ReasonDetailedText	Подробный текст отмены. В настоящее время не используется.
LanguageUnderstandingServiceResponse_JsonResult	Выходные данные ответа службы распознавания речи (в формате JSON). Доступно через IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture	Имя устройства для записи звука. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте AudioConfig::FromMicrophoneInput. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_NumberOfChannelsForCapture	Количество каналов для записи звука. Только внутреннее использование. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_SampleRateForCapture	Частота выборки (в Гц) для записи звука. Только внутреннее использование. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_BitsPerSampleForCapture	Количество битов каждого примера для записи звука. Только внутреннее использование. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версию 1.3.0.
AudioConfig_AudioSource	Источник звука. Допустимые значения: "Микрофоны", "Файл" и "Stream". Добавлено в версию 1.3.0.
AudioConfig_DeviceNameForRender	Имя устройства для отрисовки звука. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте AudioConfig::FromSpeakerOutput. Добавлено в версию 1.14.0.
AudioConfig_PlaybackBufferLengthInMs	Длина буфера воспроизведения в миллисекундах по умолчанию составляет 50 миллисекундах.
AudioConfig_AudioProcessingOptions	Параметры обработки звука в формате JSON.
Speech_LogFilename	Имя файла для записи журналов. Добавлено в версию 1.4.0.
Speech_SegmentationSilenceTimeoutMs	Продолжительность обнаруженного молчания, измеряемая в миллисекундах, после чего речь в тексте определит, что произнесенная фраза закончилась и создаст окончательный распознанный результат. Настройка этого времени ожидания может оказаться полезной в ситуациях, когда реченные входные данные значительно быстрее или медленнее, чем обычно, и поведение сегментации по умолчанию последовательно дает результаты, которые слишком длинные или слишком короткие. Значения времени ожидания сегментации, которые несоответствуют высокой или низкой, могут отрицательно повлиять на точность речи к тексту; это свойство должно быть тщательно настроено, а результирующее поведение должно быть тщательно проверено как предполагаемое. Значение должно находиться в диапазоне [100, 5000] миллисекундах.
Speech_SegmentationMaximumTimeMs	Максимальная длина произнесенных фраз при использовании стратегии сегментации "Время". По мере того как длина речевых фраз приближается к этому значению, Speech_SegmentationSilenceTimeoutMs начнет уменьшаться до тех пор, пока не будет достигнуто время ожидания молчания фразы, или фраза достигает максимальной длины. Значение должно находиться в диапазоне [20000, 70000] миллисекундах.
Speech_SegmentationStrategy	Стратегия, используемая для определения окончания фразы и окончательного распознаваемого результата. Допустимые значения: Default, Time и "Semantic".
Conversation_ApplicationId	Идентификатор, используемый для подключения к серверной службе. Добавлено в версию 1.5.0.
Conversation_DialogType	Тип серверной части диалогового окна для подключения. Добавлено в версию 1.7.0.
Conversation_Initial_Silence_Timeout	Время ожидания молчания для прослушивания добавлено в версии 1.5.0.
Conversation_From_Id	Идентификатор, используемый для действий распознавания речи, добавленных в версии 1.5.0.
Conversation_Conversation_Id	ConversationId для сеанса. Добавлено в версию 1.8.0.
Conversation_Custom_Voice_Deployment_Ids	Разделенный запятыми список пользовательских идентификаторов голосового развертывания. Добавлено в версию 1.8.0.
Conversation_Speech_Activity_Template	Шаблон действия речи, свойства метки в шаблоне действия, созданного службой для речи. Добавлено в версию 1.10.0.
Conversation_ParticipantId	Идентификатор участника в текущей беседе. Добавлено в версию 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp	Метка времени, связанная с буфером данных, записанным клиентом при использовании потоков ввода входных данных по запросу или push-отправке. Метка времени — это 64-разрядное значение с разрешением 90 кГц. Это то же самое, что метка времени презентации в потоке транспорта MPEG. См. https://en.wikipedia.org/wiki/Presentation_timestamp добавлено в версию 1.5.0.
DataBuffer_UserId	Идентификатор пользователя, связанный с буфером данных, написанным клиентом, при использовании потоков ввода входных данных по запросу или push-отправке. Добавлено в версию 1.5.0.
PronunciationAssessment_ReferenceText	Справочный текст звука для оценки произношения. Для этого и следующих параметров оценки произношения см. в таблице параметры оценки произношения. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create или PronunciationAssessmentConfig::SetReferenceText. Добавлено в версию 1.14.0.
PronunciationAssessment_GradingSystem	Система точек для калибровки показателей произношения (FivePoint или HundredMark). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_Granularity	Степень детализации произношения (Phoneme, Word или FullText). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_EnableMiscue	Определяет, включена ли функция неправильного вычисления. В этом случае выраженные слова будут сравниваться с справочным текстом и будут помечены с пропуском и вставкой на основе сравнения. Значение по умолчанию — False. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_PhonemeAlphabet	Алфавит фонемы оценки произношения. Допустимые значения: SAPI (по умолчанию) и IPA в обычных обстоятельствах, вам не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::SetPhonemeAlphabet. Добавлено в версию 1.20.0.
PronunciationAssessment_NBestPhonemeCount	Оценка произношения nbest phoneme count. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::SetNBestPhonemeCount. Добавлено в версию 1.20.0.
PronunciationAssessment_EnableProsodyAssessment	Следует ли включить оценку просодии. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте произношениеAssessmentConfig::EnableProsodyAssessment. Добавлено в версию 1.33.0.
PronunciationAssessment_Json	Строка json параметров оценки произношения в обычных обстоятельствах не должна использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::Create. Добавлено в версию 1.14.0.
PronunciationAssessment_Params	Параметры оценки произношения. Это свойство предназначено только для чтения. Пакет SDK используется внутри него. Добавлено в версию 1.14.0.
PronunciationAssessment_ContentTopic	Тема содержимого оценки произношения. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте ПроизношениеAssessmentConfig::EnableContentAssessmentWithTopic. Добавлено в версию 1.33.0.
SpeakerRecognition_Api_Version	Версия API распознавания говорящего. Это свойство добавляется для разрешения тестирования и использования предыдущих версий API распознавания говорящего, где это применимо. Добавлено в версию 1.18.0.
SpeechTranslation_ModelName	Имя модели, используемой для перевода речи. Не используйте это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig.
SpeechTranslation_ModelKey	Это свойство устарело.
KeywordRecognition_ModelName	Имя модели, используемой для распознавания ключевых слов. Не используйте это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig.
KeywordRecognition_ModelKey	Это свойство устарело.
EmbeddedSpeech_EnablePerformanceMetrics	Включите коллекцию встроенных метрик производительности речи, которые можно использовать для оценки возможностей устройства для использования внедренной речи. Собранные данные включаются в результаты конкретных сценариев, таких как распознавание речи. Значение по умолчанию — false. Обратите внимание, что метрики могут быть недоступны во всех внедренных сценариях речи.
SpeechSynthesisRequest_Pitch	Шаг синтезированного слова.
SpeechSynthesisRequest_Rate	Скорость синтезированного речи.
SpeechSynthesisRequest_Volume	Объем синтезированного речи.
SpeechSynthesisRequest_Style	Стиль синтезированного речи.
SpeechSynthesisRequest_Temperature	Температура синтезированного речи. Параметр температуры действует только в том случае, если голос является голосом HD.
SpeechSynthesis_FrameTimeoutInterval	Интервал времени ожидания в миллисекундах между синтезируемыми звуковыми кадрами речи. Больше этого и 10 секунд используется в качестве жесткого времени ожидания кадров. Время ожидания синтеза речи возникает, если a) время, прошедшее с момента последнего кадра, превышает этот интервал времени ожидания, а Real-Time Фактор (RTF) превышает максимальное значение или б) время, прошедшее с момента последнего кадра, превышает трудное время ожидания кадров.
SpeechSynthesis_RtfTimeoutThreshold	Максимальный Real-Time фактор (RTF) для синтеза речи. RTF вычисляется как RTF = f(d)/d, где f(d) — это время, необходимое для синтеза звука речи d.

Определяет идентификаторы свойства речи. Изменено в версии 1.4.0.

перечисление OutputFormat

Значения	Описания
Простой
Подробный

Формат вывода.

enum ProfanityOption

Значения	Описания
Замаскированный	Заменяет буквы ненормативными словами звездными символами.
Удаленный	Удаляет ненормативные слова.
Сырой	Не делает ничего профилирования слов.

Удаляет ненормативную лексику (ношение) или заменяет буквы ненормативных слов звездами. Добавлено в версию 1.5.0.

перечисление ResultReason

Значения	Описания
NoMatch	Указывает, что не удалось распознать речь. Дополнительные сведения можно найти в объекте NoMatchDetails.
Аннулированный	Указывает, что распознавание было отменено. Дополнительные сведения можно найти с помощью объекта CancellationDetails.
РаспознаваниеSpeech	Указывает, что результат речи содержит текст гипотезы.
RecognizedSpeech	Указывает, что результат речи содержит окончательный текст, распознанный. Распознавание речи теперь завершено для этой фразы.
РаспознаниеIntent	Указывает результат намерения содержит текст гипотезы и намерение.
РаспознанныйIntent	Указывает, что результат намерения содержит окончательный текст и намерение. Определение распознавания речи и намерения теперь завершено для этой фразы.
ПереводSpeech	Указывает, что результат перевода содержит текст гипотезы и его переводы.
ПереводedSpeech	Указывает, что результат перевода содержит окончательный текст и соответствующие переводы. Распознавание речи и перевод теперь завершены для этой фразы.
СинтезированиеAudio	Указывает, что синтезированный результат звука содержит ненулевое количество звуковых данных.
СинтезированиеAudioCompleted	Указывает, что синтезированный звук теперь завершен для этой фразы.
Распознаваниеkeyword	Указывает, что результат речи содержит текст ключевого слова (непроверенный). Добавлено в версию 1.3.0.
РаспознанныйKeyword	Указывает, что распознавание ключевых слов завершило распознавание заданного ключевого слова. Добавлено в версию 1.3.0.
СинтезированиеAudioStarted	Указывает, что синтез речи теперь запущен в версии 1.4.0.
ПереводParticipantSpeech	Указывает, что результат транскрибирования содержит текст гипотезы и его переводы для других участников беседы. Добавлено в версию 1.8.0.
ПереводedParticipantSpeech	Указывает результат транскрибирования содержит окончательный текст и соответствующие переводы для других участников беседы. Распознавание речи и перевод теперь завершены для этой фразы. Добавлено в версию 1.8.0.
ПереводedInstantMessage	Указывает результат транскрибирования, содержащий мгновенное сообщение и соответствующие переводы. Добавлено в версию 1.8.0.
ПреобразованиеParticipantInstantMessage	Указывает, что результат транскрибирования содержит мгновенное сообщение для других участников беседы и соответствующих переводов. Добавлено в версию 1.8.0.
РегистрацияVoiceProfile	Указывает, что профиль голосовой связи регистрируется, и клиентам необходимо отправить больше звука для создания голосового профиля. Добавлено в версию 1.12.0.
EnrolledVoiceProfile	Профиль голосовой связи зарегистрирован. Добавлено в версию 1.12.0.
Распознанные фрагменты	Указывает на успешную идентификацию некоторых ораторов. Добавлено в версию 1.12.0.
РаспознанныйSpeaker	Указывает успешно проверенный один динамик. Добавлено в версию 1.12.0.
ResetVoiceProfile	Указывает, что профиль голосовой связи успешно сброшен. Добавлено в версию 1.12.0.
DeletedVoiceProfile	Указывает, что профиль голосовой связи успешно удален. Добавлено в версию 1.12.0.
VoicesListRetrieved	Указывает, что список голосов успешно получен. Добавлено в версию 1.16.0.

Указывает возможные причины, по которым может быть создан результат распознавания.

перечисление CancellationReason

Значения	Описания
Ошибка	Указывает, что во время распознавания речи произошла ошибка.
EndOfStream	Указывает, что достигнут конец аудиопотока.
ОтмененоByUser	Указывает, что запрос был отменен пользователем. Добавлено в версию 1.14.0.

Определяет возможные причины отмены результата распознавания.

перечисление CancellationErrorCode

Значения	Описания
NoError	Нет ошибки. Если Значение "ОтменаReason" имеет значение EndOfStream, значение "ОтменаErrorCode" имеет значение NoError.
AuthenticationFailure	Указывает ошибку проверки подлинности. Ошибка проверки подлинности возникает, если ключ подписки или маркер авторизации недопустим, истек или не соответствует используемому региону.
BadRequest	Указывает, что один или несколько параметров распознавания недопустимы или формат звука не поддерживается.
TooManyRequests	Указывает, что число параллельных запросов превысило число разрешенных параллельных транскрибирования для подписки.
Запретный	Указывает, что бесплатная подписка, используемая запросом, закончилась квотой.
ConnectionFailure	Указывает ошибку подключения.
ServiceTimeout	Указывает ошибку времени ожидания при ожидании ответа от службы.
ServiceError	Указывает, что служба возвращает ошибку.
ServiceUnavailable	Указывает, что служба в настоящее время недоступна.
RuntimeError	Указывает непредвиденная ошибка среды выполнения.
ServiceRedirectTemporary	Указывает, что служба "Речь" временно запрашивает повторное подключение к другой конечной точке.
ServiceRedirectPermanent	Указывает, что служба "Речь" постоянно запрашивает повторное подключение к другой конечной точке.
EmbeddedModelError	Указывает, что модель встроенной речи (SR или TTS) недоступна или повреждена.

Определяет код ошибки в случае ошибки, если отменаReason является ошибкой. Добавлено в версию 1.1.0.

перечисление NoMatchReason

Значения	Описания
NotRecognized	Указывает, что речь обнаружена, но не распознана.
InitialSilenceTimeout	Указывает, что начало аудиопотока содержало только молчание, и служба истекла время ожидания речи.
InitialBabbleTimeout	Указывает, что начало аудиопотока содержало только шум, а служба истекла время ожидания речи.
KeywordNotRecognized	Указывает, что обнаруженное ключевое слово было отклонено службой проверки ключевых слов. Добавлено в версию 1.5.0.
EndSilenceTimeout	Указывает, что аудиопоток содержал только молчание после последней распознанной фразы.

Определяет возможные причины, по которым результат распознавания не распознается.

перечисление ActivityJSONType

Значения	Описания
Недействительный
Объект
Массив
Струна
Двойной
UInt
Int
Булев

Определяет возможные типы для значения json действия. Добавлено в версию 1.5.0.

перечисление SpeechSynthesisOutputFormat

Значения	Описания
Raw8Khz8BitMonoMULaw	raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren	riff-16khz-16kbps-mono-siren Unsupported службой. Не используйте это значение.
Audio16Khz16KbpsMonoSiren	audio-16khz-16kbps-mono-siren Unsupported службой. Не используйте это значение.
Audio16Khz32KBitRateMonoMp3	audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3	audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3	audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3	audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3	audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3	audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk	raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm	riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm	riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm	riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw	riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm	raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm	raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm	raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus	ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus	ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm	raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm	riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3	audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3	audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus	ogg-48khz-16bit-mono-opus добавлено в версии 1.16.0
Webm16Khz16BitMonoOpus	webm-16khz-16bit-mono-opus добавлен в версии 1.16.0
Webm24Khz16BitMonoOpus	webm-24khz-16bit-mono-opus добавлен в версии 1.16.0
Raw24Khz16BitMonoTrueSilk	raw-24khz-16bit-mono-truesilk добавлен в версии 1.17.0
Raw8Khz8BitMonoALaw	raw-8khz-8bit-mono-alaw добавлен в версии 1.17.0
Riff8Khz8BitMonoALaw	riff-8khz-8bit-mono-alaw добавлен в версии 1.17.0
Webm24Khz16Bit24KbpsMonoOpus	webm-24khz-16bit-24kbps-mono-opus Audio, сжатый кодеком OPUS в контейнере WebM, с скоростью 24 кб/с, оптимизированной для сценария Интернета вещей. (Добавлено в версии 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus	audio-16khz-16bit-32kbps-mono-opus Audio, сжатый кодеком OPUS без контейнера, с скоростью 32 кб/с. (Добавлено в версии 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus	audio-24khz-16bit-48kbps-mono-opus Audio, сжатый кодеком OPUS без контейнера, с скоростью 48 кб/с. (Добавлено в версии 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus	audio-24khz-16bit-24kbps-mono-opus Audio, сжатый кодеком OPUS без контейнера, с скоростью 24 кб/с. (Добавлено в версии 1.20.0)
Raw22050Hz16BitMonoPcm	raw-22050hz-16bit-mono-pcm Raw PCM audio на частоте выборки 22050Гц и 16-разрядной глубине. (Добавлено в версии 1.22.0)
Riff22050Hz16BitMonoPcm	riff-22050hz-16bit-mono-pcm PCM audio на частоте выборки 22050Гц и 16-разрядной глубине с заголовком RIFF. (Добавлено в версии 1.22.0)
Raw44100Hz16BitMonoPcm	raw-44100hz-16bit-mono-pcm Raw PCM audio на частоте выборки 44100Гц и 16-разрядной глубине. (Добавлено в версии 1.22.0)
Riff44100Hz16BitMonoPcm	riff-44100hz-16bit-mono-pcm PCM аудио с частотой выборки 44100Гц и 16-разрядной глубиной с заголовком RIFF. (Добавлено в версии 1.22.0)
AmrWb16000Гц	amr-wb-16000гц AMR-WB звук с частотой выборки 16 кГц. (Добавлено в версии 1.24.0)
G72216Khz64Kbps	g722-16khz-64kbps G.722 аудио с частотой выборки 16 кГц и скоростью 64 кб/с. (Добавлено в версии 1.38.0)

Определяет возможные форматы звука синтеза речи. Обновлено в версии 1.19.0.

перечисление StreamStatus

Значения	Описания
Неизвестный	Состояние потока аудиоданных неизвестно.
NoData	Поток аудиоданных не содержит данных.
Частичные данные	Поток звуковых данных содержит частичные данные голосового запроса.
AllData	Поток аудиоданных содержит все данные голосового запроса.
Аннулированный	Поток аудиоданных был отменен.

Определяет возможное состояние потока звуковых данных. Добавлено в версию 1.4.0.

enum ServicePropertyChannel

Значения	Описания
UriQueryParameter	Использует параметр запроса URI для передачи параметров свойств в службу.
HttpHeader	Использует HttpHeader для задания ключа или значения в заголовке HTTP.

Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версию 1.5.0.

перечисление VoiceProfileType

Значения	Описания
TextIndependentIdentification	Идентификация независимого докладчика от текста.
TextDependentVerification	Проверка зависимых от текста динамиков.
TextIndependentVerification	Независимая проверка текста.

Определяет типы профилей голоса.

перечисление RecognitionFactorScope

Значения	Описания
Частичная фраза	Фактор распознавания будет применяться к грамматикам, на которые можно ссылаться как на отдельные частичные фразы.

Определяет область применения фактора распознавания.

перечисление PronunciationAssessmentGradingSystem

Значения	Описания
FivePoint	Пять точек калибровки.
Сотмарк	Сотня отметки.

Определяет систему точек для калибровки показателей произношения; значением по умолчанию является FivePoint. Добавлено в версию 1.14.0.

перечисление ПроизношениеAssessmentGranularity

Значения	Описания
Фонема	Отображает оценку на уровне полнотекстового текста, слова и фонемы.
Слово	Отображает оценку на уровне полнотекстового и текстового текста.
FullText	Отображает оценку только на уровне полнотекстового текста.

Определяет степень детализации оценки произношения; Значением по умолчанию является Phoneme. Добавлено в версию 1.14.0.

enum SynthesisVoiceType

Значения	Описания
OnlineNeural	Нейронный голос в Интернете.
OnlineStandard	Онлайн стандартный голос.
АвтономныйNeural	Автономный нейронный голос.
Автономныйstandard	Автономный стандартный голос.

Определяет тип голосов синтеза, добавленных в версию 1.16.0.

перечисление SynthesisVoiceGender

Значения	Описания
Неизвестный	Пол неизвестен.
Женский	Женский голос.
Мужской	Мужской голос.
Нейтральные	Нейтральный голос.

Определяет пол голосов синтеза, добавленных в версию 1.17.0.

перечисление SynthesisVoiceStatus

Значения	Описания
Неизвестный	Неизвестное состояние голоса.
GeneralAvailability	Голосовая связь общедоступна.
Предварительный просмотр	Голосовая связь доступна в предварительной версии.
Устарело	Голос не рекомендуется использовать.

Определяет состояние голосов синтеза.

enum SpeechSynthesisBoundaryType

Значения	Описания
Слово	Граница Word.
Пунктуация	Граница препинания.
Предложение	Граница предложения.

Определяет тип границы события границ синтеза речи, добавленного в версию 1.21.0.

перечисление SegmentationStrategy

Значения	Описания
По умолчанию	Используйте стратегию и параметры по умолчанию, определяемые службой "Речь". Используйте в большинстве случаев.
Время	Использует стратегию на основе времени, в которой используется количество молчания между речью, чтобы определить, когда создается окончательный результат.
Семантический	Использует модель искусственного интеллекта для сдерживания конца фразы на основе содержимого фразы.

Стратегия, используемая для определения окончания фразы и окончательного распознаваемого результата. Допустимые значения: Default, Time и "Semantic".

Поделиться через