Compartilhar via


Namespace Microsoft::CognitiveServices::Speech

Resumo

Membros Descrições
enum PropertyId Define ids de propriedade de fala. Alterado na versão 1.4.0.
OutputFormat enum Formato de saída.
enumeração ProfanityOption Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. Adicionado na versão 1.5.0.
enum ResultReason Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado.
enum CancellationReason Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado.
enum CancellationErrorCode Define o código de erro caso CancellationReason seja Error. Adicionado na versão 1.1.0.
enumeração NoMatchReason Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido.
ActivityJSONType enum Define os tipos possíveis para um valor json de atividade. Adicionado na versão 1.5.0.
SpeechSynthesisOutputFormat Define os possíveis formatos de áudio de saída de síntese de fala. Atualizado na versão 1.19.0.
enum StreamStatus Define o status possível do fluxo de dados de áudio. Adicionado na versão 1.4.0.
ServicePropertyChannel de enumeração Define os canais usados para passar as configurações de propriedade para o serviço. Adicionado na versão 1.5.0.
VoiceProfileType enum Define tipos de perfil de voz.
RecognitionFactorScope enum Define o escopo ao qual um Fator de Reconhecimento é aplicado.
enumeração PronúnciaAssessmentGradingSystem Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. Adicionado na versão 1.14.0.
enumeração PronúnciaAssessmentGranularity Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. Adicionado na versão 1.14.0.
SynthesisVoiceType Define o tipo de vozes de síntese adicionadas na versão 1.16.0.
enumeração SynthesisVoiceGender Define o gênero das vozes de síntese adicionadas na versão 1.17.0.
SpeechSynthesisBoundaryType Define o tipo de limite do evento de limite de síntese de fala adicionado na versão 1.21.0.
segmentationStrategy A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".
classe AsyncRecognizer Classe base abstrata AsyncRecognizer.
classe AudioDataStream Representa o fluxo de dados de áudio usado para operar dados de áudio como um fluxo. Adicionado na versão 1.4.0.
classe AutoDetectSourceLanguageConfig Classe que define a configuração de origem de detecção automática atualizada em 1.13.0.
classe AutoDetectSourceLanguageResult Contém o resultado do idioma de origem detectado automaticamente adicionado em 1.8.0.
classe BaseAsyncRecognizer Classe BaseAsyncRecognizer.
classe CancellationDetails Contém informações detalhadas sobre por que um resultado foi cancelado.
classe ClassLanguageModel Representa uma lista de gramáticas para cenários de gramática dinâmica. Adicionado na versão 1.7.0.
classe Connection A conexão é uma classe proxy para gerenciar a conexão com o serviço de fala do Reconhecedor especificado. Por padrão, um Reconhecedor gerencia de forma autônoma a conexão com o serviço quando necessário. A classe Connection fornece métodos adicionais para que os usuários abram ou fechem explicitamente uma conexão e assinem as alterações de status da conexão. O uso da Conexão é opcional. Destina-se a cenários em que o ajuste fino do comportamento do aplicativo com base no status da conexão é necessário. Opcionalmente, os usuários podem chamar Open() para iniciar manualmente uma conexão de serviço antes de iniciar o reconhecimento no Reconhecedor associado a essa Conexão. Depois de iniciar um reconhecimento, a chamada de Open() ou Close() pode falhar. Isso não afetará o Reconhecedor ou o reconhecimento contínuo. A conexão pode ser suspensa por vários motivos, o Reconhecedor sempre tentará reinstituir a conexão conforme necessário para garantir operações em andamento. Em todos esses casos, eventos conectados/desconectados indicarão a alteração do status da conexão. Atualizado na versão 1.17.0.
classe ConnectionEventArgs Fornece dados para o ConnectionEvent. Adicionado na versão 1.2.0.
classe ConnectionMessage ConnectionMessage representa mensagens específicas de implementação enviadas e recebidas do serviço de fala. Essas mensagens são fornecidas para fins de depuração e não devem ser usadas para casos de uso de produção com o Serviço de Fala dos Serviços Cognitivos do Azure. As mensagens enviadas e recebidas do Serviço de Fala estão sujeitas a alterações sem aviso prévio. Isso inclui conteúdo de mensagens, cabeçalhos, conteúdos, pedidos etc. Adicionado na versão 1.10.0.
classe ConnectionMessageEventArgs Fornece dados para o ConnectionMessageEvent.
classe EmbeddedSpeechConfig Classe que define a configuração de fala inserida (offline).
classe EventArgs Classe base para argumentos de evento.
eventSignal da classe Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos.
classe EventSignalBase Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos.
classe Grammar Representa a gramática de classe base para personalizar o reconhecimento de fala. Adicionado na versão 1.5.0.
classe GrammarList Representa uma lista de gramáticas para cenários de gramática dinâmica. Adicionado na versão 1.7.0.
classe GrammarPhrase Representa uma frase que pode ser dita pelo usuário. Adicionado na versão 1.5.0.
classe HybridSpeechConfig Classe que define configurações híbridas (na nuvem e inseridas) para reconhecimento de fala ou síntese de fala.
classe KeywordRecognitionEventArgs Classe para os eventos emmitidos pelo KeywordRecognizer.
classe KeywordRecognitionModel Representa o modelo de reconhecimento de palavra-chave usado com métodos StartKeywordRecognitionAsync.
classe KeywordRecognitionResult Classe que define os resultados emitidos pelo KeywordRecognizer.
classe KeywordRecognizer Tipo de reconhecedor especializado para manipular apenas a ativação da palavra-chave.
classe NoMatchDetails Contém informações detalhadas para resultados de reconhecimento noMatch.
classe PersonalVoiceSynthesisRequest Classe que define a solicitação de síntese de fala para voz pessoal (aka.ms/azureai/personal-voice). Essa classe está em versão prévia e está sujeita a alterações. Adicionado na versão 1.39.0.
classe PhraseListGrammar Representa uma gramática de lista de frases para cenários de gramática dinâmica. Adicionado na versão 1.5.0.
classe PronunciationAssessmentConfig Classe que define a configuração de avaliação de pronúncia adicionada em 1.14.0.
classe PronúnciaAssessmentResult Classe para resultados da avaliação de pronúncia.
classe PronúnciaContentAssessmentResult Classe para resultados da avaliação de conteúdo.
classe PropertyCollection Classe para recuperar ou definir um valor de propriedade de uma coleção de propriedades.
da classe RecognitionEventArgs Fornece dados para o RecognitionEvent.
classe RecognitionResult Contém informações detalhadas sobre o resultado de uma operação de reconhecimento.
do Reconhecedor de Classe Classe base do reconhecedor.
classe SessionEventArgs Classe base para argumentos de evento de sessão.
classe SmartHandle Classe de identificador inteligente.
classe SourceLanguageConfig Classe que define a configuração do idioma de origem, adicionada em 1.8.0.
classe SourceLanguageRecognizer Classe para reconhecedores de idioma de origem. Você pode usar essa classe para detecção de idioma autônomo. Adicionado na versão 1.17.0.
classe SpeechConfig Classe que define configurações para reconhecimento de fala/intenção ou síntese de fala.
classe SpeechRecognitionCanceledEventArgs Classe para reconhecimento de fala cancelou argumentos de evento.
classe SpeechRecognitionEventArgs Classe para argumentos de evento de reconhecimento de fala.
classe SpeechRecognitionModel Informações do modelo de reconhecimento de fala.
classe SpeechRecognitionResult Classe base para resultados de reconhecimento de fala.
classe SpeechRecognizer Classe para reconhecedores de fala.
classe SpeechSynthesisBookmarkEventArgs Classe para argumentos de evento de indicador de síntese de fala. Adicionado na versão 1.16.0.
classe SpeechSynthesisCancellationDetails Contém informações detalhadas sobre por que um resultado foi cancelado. Adicionado na versão 1.4.0.
classe SpeechSynthesisEventArgs Classe para argumentos de evento de síntese de fala. Adicionado na versão 1.4.0.
classe SpeechSynthesisRequest Classe que define a solicitação de síntese de fala. Essa classe está em versão prévia e está sujeita a alterações. Adicionado na versão 1.37.0.
classe SpeechSynthesisResult Contém informações sobre o resultado da síntese de texto em fala. Adicionado na versão 1.4.0.
classe SpeechSynthesisVisemeEventArgs Classe para argumentos de evento de viseme de síntese de fala. Adicionado na versão 1.16.0.
classe SpeechSynthesisWordBoundaryEventArgs Classe para argumentos de evento de limite de palavra de síntese de fala. Adicionado na versão 1.7.0.
classe SpeechSynthesizer Classe para sintetizador de fala. Atualizado na versão 1.14.0.
classe SpeechTranslationModel Informações do modelo de tradução de fala.
da classe SynthesisVoicesResult Contém informações sobre o resultado da lista de vozes de sintetizadores de fala. Adicionado na versão 1.16.0.
classe VoiceInfo Contém informações sobre informações de voz de síntese atualizadas na versão 1.17.0.

Membros

enum PropertyId

Valores Descrições
SpeechServiceConnection_Key A chave de assinatura do Serviço de Fala dos Serviços Cognitivos. Se você estiver usando um reconhecedor de intenção, precisará especificar a chave de ponto de extremidade do LUIS para seu aplicativo LUIS específico. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint O ponto de extremidade do Serviço de Fala dos Serviços Cognitivos (URL). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromEndpoint. OBSERVAÇÃO: esse ponto de extremidade não é o mesmo que o ponto de extremidade usado para obter um token de acesso.
SpeechServiceConnection_Region A região do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token O token de autorização do Serviço de Fala dos Serviços Cognitivos (também conhecido como token de acesso). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type O tipo de autorização do Serviço de Fala dos Serviços Cognitivos. Atualmente não utilizado.
SpeechServiceConnection_EndpointId A ID do ponto de extremidade do Serviço de Voz Personalizado ou de Fala Personalizada dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetEndpointId. OBSERVAÇÃO: a ID do ponto de extremidade está disponível no Portal de Fala Personalizada, listado em Detalhes do Ponto de Extremidade.
SpeechServiceConnection_Host O host (URL) do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName O nome do host do servidor proxy usado para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_ProxyPort A porta do servidor proxy usada para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_ProxyUserName O nome de usuário do servidor proxy usado para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_ProxyPassword A senha do servidor proxy usada para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_Url A cadeia de caracteres de URL criada a partir da configuração de fala. Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. OBSERVAÇÃO: adicionado na versão 1.5.0.
SpeechServiceConnection_ProxyHostBypass Especifica a lista de hosts para os quais os proxies não devem ser usados. Essa configuração substitui todas as outras configurações. Os nomes de host são separados por vírgulas e são correspondidos de maneira que não diferencia maiúsculas de minúsculas. Não há suporte para curingas.
SpeechServiceConnection_TranslationToLanguages A lista de idiomas separados por vírgulas usados como idiomas de tradução de destino. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechTranslationConfig::AddTargetLanguage e SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice O nome da voz do Serviço Cognitivo de Texto em Fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechTranslationConfig::SetVoiceName. OBSERVAÇÃO: Nomes de voz válidos podem ser encontrados aqui.
SpeechServiceConnection_TranslationFeatures Recursos de tradução. Para uso interno.
SpeechServiceConnection_IntentRegion A região do Serviço de Reconhecimento Vocal. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode O modo de reconhecimento do Serviço de Fala dos Serviços Cognitivos. Pode ser "INTERATIVO", "CONVERSA", "DITADO". Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente.
SpeechServiceConnection_RecoLanguage O idioma falado a ser reconhecido (no formato BCP-47). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId A ID da sessão. Essa ID é um identificador universalmente exclusivo (também conhecido como UUID) que representa uma associação específica de um fluxo de entrada de áudio e a instância de reconhecimento de fala subjacente à qual ela está associada. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Os parâmetros de consulta fornecidos pelos usuários. Eles serão passados para o serviço como parâmetros de consulta de URL. Adicionado na versão 1.5.0.
SpeechServiceConnection_RecoBackend A cadeia de caracteres para especificar o back-end a ser usado para reconhecimento de fala; as opções permitidas estão online e offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, a opção offline só é válida quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0.
SpeechServiceConnection_RecoModelName O nome do modelo a ser usado para reconhecimento de fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0.
SpeechServiceConnection_RecoModelKey Essa propriedade foi preterida.
SpeechServiceConnection_RecoModelIniFile O caminho para o arquivo ini do modelo a ser usado para reconhecimento de fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthLanguage O idioma falado a ser sintetizado (por exemplo, en-US) adicionado na versão 1.4.0.
SpeechServiceConnection_SynthVoice O nome da voz TTS a ser usada para síntese de fala adicionada na versão 1.4.0.
SpeechServiceConnection_SynthOutputFormat A cadeia de caracteres para especificar o formato de áudio de saída do TTS adicionado na versão 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Indica se usar o formato de áudio compactado para transmissão de áudio de síntese de fala. Essa propriedade afeta somente quando SpeechServiceConnection_SynthOutputFormat é definido como um formato pcm. Se essa propriedade não estiver definida e o GStreamer estiver disponível, o SDK usará o formato compactado para transmissão de áudio sintetizada e a decodificará. Você pode definir essa propriedade como "false" para usar o formato pcm bruto para transmissão na transmissão. Adicionado na versão 1.16.0.
SpeechServiceConnection_SynthBackend A cadeia de caracteres para especificar o back-end do TTS; as opções válidas estão online e offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::FromPath ou EmbeddedSpeechConfig::FromPaths para definir o back-end de síntese como offline. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Os caminhos do arquivo de dados para o mecanismo de síntese offline; válido somente quando o back-end de síntese está offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::FromPath ou EmbeddedSpeechConfig::FromPaths. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthOfflineVoice O nome da voz TTS offline a ser usada para síntese de fala em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::SetSpeechSynthesisVoice e EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthModelKey Essa propriedade foi preterida.
SpeechServiceConnection_VoicesListEndpoint O ponto de extremidade de API (URL) da lista de vozes do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não precisa especificar essa propriedade, o SDK a construirá com base na região/host/ponto de extremidade de SpeechConfig. Adicionado na versão 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs O valor de tempo limite de silêncio inicial (em milissegundos) usado pelo serviço. Adicionado na versão 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs O valor do tempo limite do silêncio final (em milissegundos) usado pelo serviço. Adicionado na versão 1.5.0.
SpeechServiceConnection_EnableAudioLogging Um valor booliano que especifica se o log de áudio está habilitado no serviço ou não. Os logs de áudio e conteúdo são armazenados no armazenamento de propriedade da Microsoft ou em sua própria conta de armazenamento vinculada ao recurso de Fala habilitado para ByOS (Traga Seu Próprio Armazenamento). Adicionado na versão 1.5.0.
SpeechServiceConnection_LanguageIdMode O modo de identificador de linguagem de conexão do serviço de fala. Pode ser "AtStart" (o padrão) ou "Contínuo". Consulte documento de Identificação de Idioma. Adicionado em 1.25.0.
SpeechServiceConnection_TranslationCategoryId A categoryId de conversão de conexão do serviço de fala.
SpeechServiceConnection_AutoDetectSourceLanguages Os idiomas de origem de detecção automática adicionados na versão 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult O resultado do idioma de origem de detecção automática adicionado na versão 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse O formato de saída de resposta do Serviço de Fala dos Serviços Cognitivos solicitado (simples ou detalhado). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse O nível de profanidade de saída da resposta do Serviço de Fala dos Serviços Cognitivos solicitado. Atualmente não utilizado.
SpeechServiceResponse_ProfanityOption A configuração de profanidade de saída da resposta do Serviço de Fala dos Serviços Cognitivos solicitada. Os valores permitidos são "mascarados", "removidos" e "brutos". Adicionado na versão 1.5.0.
SpeechServiceResponse_PostProcessingOption Um valor de cadeia de caracteres que especifica qual opção de pós-processamento deve ser usada pelo serviço. Os valores permitidos são "TrueText". Adicionado na versão 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Um valor booliano que especifica se os carimbos de data/hora de nível de palavra devem ser incluídos no resultado da resposta. Adicionado na versão 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold O número de vezes que uma palavra precisa estar em resultados parciais a serem retornados. Adicionado na versão 1.5.0.
SpeechServiceResponse_OutputFormatOption Um valor de cadeia de caracteres que especifica a opção de formato de saída no resultado da resposta. Somente uso interno. Adicionado na versão 1.5.0.
SpeechServiceResponse_RequestSnr Um valor booliano que especifica se o SNR (taxa de sinal para ruído) deve ser incluído no resultado da resposta. Adicionado na versão 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Um valor booliano a ser solicitado para estabilizar os resultados parciais da tradução omitindo palavras no final. Adicionado na versão 1.5.0.
SpeechServiceResponse_RequestWordBoundary Um valor booliano que especifica se os eventos WordBoundary devem ser solicitados. Adicionado na versão 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Um valor booliano que especifica se o limite de pontuação deve ser solicitado em Eventos WordBoundary. O padrão é verdadeiro. Adicionado na versão 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Um valor booliano que especifica se o limite de sentença deve ser solicitado em Eventos WordBoundary. O padrão é false. Adicionado na versão 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio Um valor booliano que especifica se o SDK deve sincronizar eventos de metadados de síntese (por exemplo, limite de palavra, viseme etc.) com a reprodução de áudio. Isso só entra em vigor quando o áudio é reproduzido por meio do SDK. O padrão é verdadeiro. Se definido como false, o SDK disparará os eventos conforme eles vêm do serviço, o que pode estar fora de sincronia com a reprodução de áudio. Adicionado na versão 1.31.0.
SpeechServiceResponse_JsonResult A saída de resposta do Serviço de Fala dos Serviços Cognitivos (no formato JSON). Essa propriedade está disponível somente em objetos de resultado de reconhecimento.
SpeechServiceResponse_JsonErrorDetails Os detalhes de erro do Serviço de Fala dos Serviços Cognitivos (no formato JSON). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs A latência de reconhecimento em milissegundos. Somente leitura, disponível nos resultados finais de fala/tradução/intenção. Isso mede a latência entre quando uma entrada de áudio é recebida pelo SDK e o momento em que o resultado final é recebido do serviço. O SDK calcula a diferença de tempo entre o último fragmento de áudio da entrada de áudio que está contribuindo para o resultado final e a hora em que o resultado final é recebido do serviço de fala. Adicionado na versão 1.3.0.
SpeechServiceResponse_RecognitionBackend O back-end de reconhecimento. Somente leitura, disponível nos resultados do reconhecimento de fala. Isso indica se o reconhecimento de nuvem (online) ou incorporado (offline) foi usado para produzir o resultado.
SpeechServiceResponse_SynthesisFirstByteLatencyMs A síntese de fala primeiro byte latência em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que o primeiro áudio de byte está disponível. Adicionado na versão 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs A síntese de fala sintetiza a latência de todos os bytes em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que todo o áudio é sintetizado. Adicionado na versão 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs O tempo de execução inferior da síntese de fala em milissegundos. Somente leitura, disponível em resultados em eventos SynthesisCompleted. Isso mede o tempo total de subexecução de PropertyId::AudioConfig_PlaybackBufferLengthInMs é preenchido para a síntese concluída. Adicionado na versão 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs A latência de conexão de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que a conexão HTTP/WebSocket é estabelecida. Adicionado na versão 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs A latência de rede de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede o tempo de ida e volta da rede. Adicionado na versão 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs A latência do serviço de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede o tempo de processamento do serviço para sintetizar o primeiro byte de áudio. Adicionado na versão 1.26.0.
SpeechServiceResponse_SynthesisBackend Indica por qual back-end a síntese foi concluída. Somente leitura, disponível nos resultados da síntese de fala, exceto pelo resultado no evento SynthesisStarted adicionado na versão 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults Determina se os resultados intermediários contêm identificação do locutor.
CancellationDetails_Reason O motivo do cancelamento. Atualmente não utilizado.
CancellationDetails_ReasonText O texto de cancelamento. Atualmente não utilizado.
CancellationDetails_ReasonDetailedText O texto detalhado do cancelamento. Atualmente não utilizado.
LanguageUnderstandingServiceResponse_JsonResult A saída de resposta do Serviço de Reconhecimento Vocal (no formato JSON). Disponível por meio de IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture O nome do dispositivo para captura de áudio. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use AudioConfig::FromMicrophoneInput. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_NumberOfChannelsForCapture O número de canais para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_SampleRateForCapture A taxa de exemplo (em Hz) para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_BitsPerSampleForCapture O número de bits de cada exemplo para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_AudioSource A fonte de áudio. Os valores permitidos são "Microfones", "Arquivo" e "Fluxo". Adicionado na versão 1.3.0.
AudioConfig_DeviceNameForRender O nome do dispositivo para renderização de áudio. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use AudioConfig::FromSpeakerOutput. Adicionado na versão 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Comprimento do buffer de reprodução em milissegundos, o padrão é 50 milissegundos.
AudioConfig_AudioProcessingOptions Opções de processamento de áudio no formato JSON.
Speech_LogFilename O nome do arquivo para gravar logs. Adicionado na versão 1.4.0.
Speech_SegmentationSilenceTimeoutMs Uma duração do silêncio detectado, medida em milissegundos, após a qual a conversão de fala em texto determinará que uma frase falada terminou e gerará um resultado reconhecido final. Configurar esse tempo limite pode ser útil em situações em que a entrada falada é significativamente mais rápida ou mais lenta do que o normal e o comportamento de segmentação padrão produz consistentemente resultados que são muito longos ou muito curtos. Valores de tempo limite de segmentação inadequadamente altos ou baixos podem afetar negativamente a precisão de fala em texto; essa propriedade deve ser cuidadosamente configurada e o comportamento resultante deve ser validado minuciosamente conforme o esperado.
Speech_SegmentationMaximumTimeMs O comprimento máximo de uma frase falada ao usar a estratégia de segmentação "Time". À medida que o comprimento de uma frase falada se aproxima desse valor, o Speech_SegmentationSilenceTimeoutMs começará a ser reduzido até que o tempo limite do silêncio da frase seja atingido ou a frase atinja o comprimento máximo.
Speech_SegmentationStrategy A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".
Conversation_ApplicationId Identificador usado para se conectar ao serviço de back-end. Adicionado na versão 1.5.0.
Conversation_DialogType Tipo de back-end de caixa de diálogo ao qual se conectar. Adicionado na versão 1.7.0.
Conversation_Initial_Silence_Timeout Tempo limite de silêncio para ouvir Adicionado na versão 1.5.0.
Conversation_From_Id Da ID a ser usada nas atividades de reconhecimento de fala adicionadas na versão 1.5.0.
Conversation_Conversation_Id ConversationId para a sessão. Adicionado na versão 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Lista separada por vírgulas de IDs de implantação de voz personalizada. Adicionado na versão 1.8.0.
Conversation_Speech_Activity_Template Modelo de atividade de fala, propriedades de carimbo no modelo na atividade gerada pelo serviço de fala. Adicionado na versão 1.10.0.
Conversation_ParticipantId O identificador do participante na conversa atual. Adicionado na versão 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp O carimbo de data/hora associado ao buffer de dados gravado pelo cliente ao usar fluxos de entrada de áudio pull/push. O carimbo de data/hora é um valor de 64 bits com uma resolução de 90 kHz. É o mesmo que o carimbo de data/hora da apresentação em um fluxo de transporte MPEG. Consulte https://en.wikipedia.org/wiki/Presentation_timestamp Adicionado na versão 1.5.0.
DataBuffer_UserId A ID do usuário associada ao buffer de dados gravado pelo cliente ao usar fluxos de entrada de áudio pull/push. Adicionado na versão 1.5.0.
PronunciationAssessment_ReferenceText O texto de referência do áudio para avaliação de pronúncia. Para este e os seguintes parâmetros de avaliação de pronúncia, consulte a tabela parâmetros de avaliação de pronúncia. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Create ou PronúnciaAssessmentConfig::SetReferenceText. Adicionado na versão 1.14.0.
PronunciationAssessment_GradingSystem O sistema de pontos para calibragem de pontuação de pronúncia (FivePoint ou HundredMark). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_Granularity A granularidade da avaliação de pronúncia (Phoneme, Word ou FullText). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_EnableMiscue Define se habilitar o cálculo de erro. Com isso habilitado, as palavras pronunciadas serão comparadas ao texto de referência e serão marcadas com omissão/inserção com base na comparação. A configuração padrão é False. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_PhonemeAlphabet O alfabeto phoneme de avaliação de pronúncia. Os valores válidos são "SAPI" (padrão) e "IPA" Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::SetPhonemeAlphabet. Adicionado na versão 1.20.0.
PronunciationAssessment_NBestPhonemeCount A avaliação de pronúncia nbest phoneme count. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::SetNBestPhonemeCount. Adicionado na versão 1.20.0.
PronunciationAssessment_EnableProsodyAssessment Se deseja habilitar a avaliação prosody. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::EnableProsodyAssessment. Adicionado na versão 1.33.0.
PronunciationAssessment_Json A cadeia de caracteres json dos parâmetros de avaliação de pronúncia em circunstâncias normais, você não deve precisar usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_Params Parâmetros de avaliação de pronúncia. Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. Adicionado na versão 1.14.0.
PronunciationAssessment_ContentTopic O tópico de conteúdo da avaliação de pronúncia. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::EnableContentAssessmentWithTopic. Adicionado na versão 1.33.0.
SpeakerRecognition_Api_Version Versão da API de back-end do Reconhecimento do Locutor. Essa propriedade é adicionada para permitir o teste e o uso de versões anteriores das APIs de Reconhecimento do Locutor, quando aplicável. Adicionado na versão 1.18.0.
SpeechTranslation_ModelName O nome de um modelo a ser usado para tradução de fala. Não use essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado.
SpeechTranslation_ModelKey Essa propriedade foi preterida.
KeywordRecognition_ModelName O nome de um modelo a ser usado para o reconhecimento de palavra-chave. Não use essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado.
KeywordRecognition_ModelKey Essa propriedade foi preterida.
EmbeddedSpeech_EnablePerformanceMetrics Habilite a coleção de métricas de desempenho de fala inseridas que podem ser usadas para avaliar a capacidade de um dispositivo usar fala inserida. Os dados coletados são incluídos nos resultados de cenários específicos, como o reconhecimento de fala. A configuração padrão é "false". Observe que as métricas podem não estar disponíveis em todos os cenários de fala inseridos.
SpeechSynthesisRequest_Pitch O tom da fala sintetizada.
SpeechSynthesisRequest_Rate A taxa da fala sintetizada.
SpeechSynthesisRequest_Volume O volume da fala sintetizada.

Define ids de propriedade de fala. Alterado na versão 1.4.0.

enum OutputFormat

Valores Descrições
Simples
Circunstanciado

Formato de saída.

enum ProfanityOption

Valores Descrições
Mascarado Substitui letras em palavras profanas por caracteres de estrela.
Removido Remove palavras profanas.
Cru Não faz nada para palavras profanas.

Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. Adicionado na versão 1.5.0.

enum ResultReason

Valores Descrições
NoMatch Indica que a fala não pôde ser reconhecida. Mais detalhes podem ser encontrados no objeto NoMatchDetails.
Cancelado Indica que o reconhecimento foi cancelado. Mais detalhes podem ser encontrados usando o objeto CancellationDetails.
RecognizingSpeech Indica que o resultado da fala contém texto de hipótese.
RecognizedSpeech Indica que o resultado da fala contém o texto final que foi reconhecido. O Reconhecimento de Fala agora está completo para esta frase.
ReconhecendoIntent Indica que o resultado da intenção contém texto de hipótese e intenção.
RecognizedIntent Indica que o resultado da intenção contém texto final e intenção. A determinação de Reconhecimento de Fala e Intenção agora está concluída para esta frase.
TranslatingSpeech Indica que o resultado da tradução contém texto de hipótese e suas traduções.
TranslatedSpeech Indica que o resultado da tradução contém o texto final e as traduções correspondentes. O Reconhecimento de Fala e a Tradução agora estão concluídos para esta frase.
SynthesizingAudio Indica que o resultado do áudio sintetizado contém uma quantidade diferente de zero de dados de áudio.
SynthesizingAudioCompleted Indica que o áudio sintetizado agora está completo para esta frase.
RecognizingKeyword Indica que o resultado da fala contém texto de palavra-chave (não verificado). Adicionado na versão 1.3.0.
RecognizedKeyword Indica que o reconhecimento de palavra-chave foi concluído reconhecendo a palavra-chave fornecida. Adicionado na versão 1.3.0.
SynthesizingAudioStarted Indica que a síntese de fala agora foi iniciada adicionada na versão 1.4.0.
TranslatingParticipantSpeech Indica que o resultado da transcrição contém o texto da hipótese e suas traduções para outros participantes na conversa. Adicionado na versão 1.8.0.
TranslatedParticipantSpeech Indica que o resultado da transcrição contém texto final e conversões correspondentes para outros participantes na conversa. O Reconhecimento de Fala e a Tradução agora estão concluídos para esta frase. Adicionado na versão 1.8.0.
TranslatedInstantMessage Indica que o resultado da transcrição contém a mensagem instantânea e as traduções correspondentes. Adicionado na versão 1.8.0.
TranslatedParticipantInstantMessage Indica que o resultado da transcrição contém a mensagem instantânea para outros participantes na conversa e nas traduções correspondentes. Adicionado na versão 1.8.0.
EnrollingVoiceProfile Indica que o perfil de voz está sendo registrado e os clientes precisam enviar mais áudio para criar um perfil de voz. Adicionado na versão 1.12.0.
EnrolledVoiceProfile O perfil de voz foi registrado. Adicionado na versão 1.12.0.
RecognizedSpeakers Indica a identificação bem-sucedida de alguns alto-falantes. Adicionado na versão 1.12.0.
RecognizedSpeaker Indica um alto-falante verificado com êxito. Adicionado na versão 1.12.0.
ResetVoiceProfile Indica que um perfil de voz foi redefinido com êxito. Adicionado na versão 1.12.0.
DeletedVoiceProfile Indica que um perfil de voz foi excluído com êxito. Adicionado na versão 1.12.0.
VoicesListRetrieved Indica que a lista de vozes foi recuperada com êxito. Adicionado na versão 1.16.0.

Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado.

enum CancellationReason

Valores Descrições
Erro Indica que ocorreu um erro durante o reconhecimento de fala.
EndOfStream Indica que o final do fluxo de áudio foi atingido.
CancelledByUser Indica que a solicitação foi cancelada pelo usuário. Adicionado na versão 1.14.0.

Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado.

enum CancellationErrorCode

Valores Descrições
Noerror Nenhum erro. Se CancellationReason for EndOfStream, CancellationErrorCode será definido como NoError.
AuthenticationFailure Indica um erro de autenticação. Ocorrerá um erro de autenticação se a chave de assinatura ou o token de autorização for inválido, tiver expirado ou não corresponder à região que está sendo usada.
BadRequest Indica que um ou mais parâmetros de reconhecimento são inválidos ou não há suporte para o formato de áudio.
TooManyRequests Indica que o número de solicitações paralelas excedeu o número de transcrições simultâneas permitidas para a assinatura.
Proibido Indica que a assinatura gratuita usada pela solicitação ficou sem cota.
ConnectionFailure Indica um erro de conexão.
ServiceTimeout Indica um erro de tempo limite ao aguardar a resposta do serviço.
ServiceError Indica que um erro é retornado pelo serviço.
ServiceUnavailable Indica que o serviço está indisponível no momento.
RuntimeError Indica um erro de runtime inesperado.
ServiceRedirectTemporary Indica que o Serviço de Fala está solicitando temporariamente uma reconexão a um ponto de extremidade diferente.
ServiceRedirectPermanent Indica que o Serviço de Fala está solicitando permanentemente uma reconexão a um ponto de extremidade diferente.
EmbeddedModelError Indica que o modelo de fala inserida (SR ou TTS) não está disponível ou corrompido.

Define o código de erro caso CancellationReason seja Error. Adicionado na versão 1.1.0.

enum NoMatchReason

Valores Descrições
NotRecognized Indica que a fala foi detectada, mas não reconhecida.
InitialSilenceTimeout Indica que o início do fluxo de áudio continha apenas silêncio e o serviço atingiu o tempo limite aguardando fala.
InitialBabbleTimeout Indica que o início do fluxo de áudio continha apenas ruído e o serviço atingiu o tempo limite aguardando fala.
Palavra-chaveNotRecognized Indica que a palavra-chave detectada foi rejeitada pelo serviço de verificação de palavra-chave. Adicionado na versão 1.5.0.
EndSilenceTimeout Indica que o fluxo de áudio continha apenas silêncio após a última frase reconhecida.

Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido.

enum ActivityJSONType

Valores Descrições
Zero
Objeto
Array
Corda
Dobrar
UInt
Int
Booleano

Define os tipos possíveis para um valor json de atividade. Adicionado na versão 1.5.0.

enum SpeechSynthesisOutputFormat

Valores Descrições
Raw8Khz8BitMonoMULaw raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16khz-16kbps-mono-siren Sem suporte pelo serviço. Não use esse valor.
Audio16Khz16KbpsMonoSiren audio-16khz-16kbps-mono-siren Sem suporte pelo serviço. Não use esse valor.
Audio16Khz32KBitRateMonoMp3 audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48khz-16bit-mono-opus adicionado na versão 1.16.0
Webm16Khz16BitMonoOpus webm-16khz-16bit-mono-opus adicionado na versão 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus adicionado na versão 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24khz-16bit-mono-truesilk Adicionado na versão 1.17.0
Raw8Khz8BitMonoALaw raw-8khz-8bit-mono-alaw Adicionado na versão 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw Adicionado na versão 1.17.0
Webm24Khz16Bit24KbpsMonoOpus Webm-24khz-16bit-24kbps-mono-opus Audio compactado pelo codec OPUS em um contêiner de WebM, com taxa de bits de 24kbps, otimizado para o cenário de IoT. (Adicionado em 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus áudio-16khz-16bit-32kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 32kbps. (Adicionado em 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus áudio-24khz-16bit-48kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 48kbps. (Adicionado em 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus áudio-24khz-16bit-24kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 24kbps. (Adicionado em 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Áudio PCM bruto a 22050Hz taxa de amostragem e profundidade de 16 bits. (Adicionado em 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM áudio a 22050Hz taxa de amostragem e profundidade de 16 bits, com cabeçalho RIFF. (Adicionado em 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Áudio PCM bruto a 44100Hz taxa de amostragem e profundidade de 16 bits. (Adicionado em 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm áudio PCM a 44100Hz taxa de amostragem e profundidade de 16 bits, com cabeçalho RIFF. (Adicionado em 1.22.0)
AmrWb16000Hz amr-wb-16000hz AMR-WB áudio a uma taxa de amostragem de 16kHz. (Adicionado em 1.24.0)
G72216Khz64Kbps g722-16khz-64kbps G.722 áudio a 16kHz taxa de amostragem e taxa de bits de 64kbps. (Adicionado em 1.38.0)

Define os possíveis formatos de áudio de saída de síntese de fala. Atualizado na versão 1.19.0.

enum StreamStatus

Valores Descrições
Desconhecido O status do fluxo de dados de áudio é desconhecido.
NoData O fluxo de dados de áudio não contém dados.
PartialData O fluxo de dados de áudio contém dados parciais de uma solicitação de fala.
AllData O fluxo de dados de áudio contém todos os dados de uma solicitação de fala.
Cancelado O fluxo de dados de áudio foi cancelado.

Define o status possível do fluxo de dados de áudio. Adicionado na versão 1.4.0.

enum ServicePropertyChannel

Valores Descrições
UriQueryParameter Usa o parâmetro de consulta URI para passar as configurações de propriedade para o serviço.
HttpHeader Usa HttpHeader para definir uma chave/valor em um cabeçalho HTTP.

Define os canais usados para passar as configurações de propriedade para o serviço. Adicionado na versão 1.5.0.

enum VoiceProfileType

Valores Descrições
TextIndependentIdentification Identificação de alto-falante independente de texto.
TextDependentVerification Verificação de alto-falante dependente de texto.
TextIndependentVerification Verificação independente de texto.

Define tipos de perfil de voz.

enum RecognitionFactorScope

Valores Descrições
PartialPhrase Um Fator de Reconhecimento será aplicado a gramáticas que podem ser referenciadas como frases parciais individuais.

Define o escopo ao qual um Fator de Reconhecimento é aplicado.

enumationAssessmentGradingSystem

Valores Descrições
FivePoint Calibragem de cinco pontos.
HundredMark Marca de cem.

Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. Adicionado na versão 1.14.0.

enumationAssessmentGranularity

Valores Descrições
Fonema Mostra a pontuação no nível completo de texto, palavra e phoneme.
Palavra Mostra a pontuação no nível de texto e palavra completos.
FullText Mostra a pontuação somente no nível de texto completo.

Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. Adicionado na versão 1.14.0.

enumEração SynthesisVoiceType

Valores Descrições
OnlineNeural Voz neural online.
OnlineStandard Voz padrão online.
OfflineNeural Voz neural offline.
OfflineStandard Voz padrão offline.

Define o tipo de vozes de síntese adicionadas na versão 1.16.0.

enum SynthesisVoiceGender

Valores Descrições
Desconhecido Gênero desconhecido.
Fêmea Voz feminina.
Macho Voz masculina.

Define o gênero das vozes de síntese adicionadas na versão 1.17.0.

enum SpeechSynthesisBoundaryType

Valores Descrições
Palavra Limite do Word.
Pontuação Limite de pontuação.
Frase Limite de sentença.

Define o tipo de limite do evento de limite de síntese de fala adicionado na versão 1.21.0.

enum SegmentationStrategy

Valores Descrições
Inadimplência Use a estratégia e as configurações padrão, conforme determinado pelo Serviço de Fala. Use na maioria das situações.
Hora Usa uma estratégia baseada em tempo em que a quantidade de silêncio entre a fala é usada para determinar quando gerar um resultado final.
Semântico Usa um modelo de IA para deter o final de uma frase falada com base no conteúdo da frase.

A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".