Partilhar via


SpeechRecognizer Classe

public final class SpeechRecognizer
extends Recognizer

Executa o reconhecimento de fala de microfone, arquivo ou outros fluxos de entrada de áudio e obtém texto transcrito como resultado. Observação: close() deve ser chamado para liberar recursos subjacentes mantidos pelo objeto .

Resumo do campo

Modificador e tipo Campo e descrição
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs> canceled

O evento cancelado sinaliza que o reconhecimento foi cancelado.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognized

O evento reconhecido sinaliza que um resultado de reconhecimento final é recebido.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognizing

O evento que reconhece sinaliza que um resultado de reconhecimento intermediário é recebido.

Resumo do Construtor

Construtor Description
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

SpeechRecognizer(SpeechConfig speechConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Inicializa uma nova instância do Reconhecimento de Fala.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Resumo do método

Modificador e tipo Método e descrição
protected void dispose(boolean disposing)

Esse método executa a limpeza de recursos.

java.lang.String getAuthorizationToken()

Obtém o token de autorização usado para se comunicar com o serviço.

java.lang.String getEndpointId()

Obtém a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala.

OutputFormat getOutputFormat()

Obtém o formato de saída do reconhecimento.

PropertyCollection getProperties()

A coleção de propriedades e seus valores definidos para este Reconhecimento de Fala.

java.lang.String getSpeechRecognitionLanguage()

Obtém o idioma falado do reconhecimento.

java.util.concurrent.Future<SpeechRecognitionResult> recognizeOnceAsync()

Inicia o reconhecimento de fala e retorna depois que um único enunciado é reconhecido.

void setAuthorizationToken(String token)

Define o token de autorização usado para se comunicar com o serviço.

java.util.concurrent.Future<java.lang.Void> startContinuousRecognitionAsync()

Inicia o reconhecimento de fala em um fluxo de áudio contínuo, até que pararo ReconhecimentoContínuoAssíncrono() seja chamado.

java.util.concurrent.Future<java.lang.Void> startKeywordRecognitionAsync(KeywordRecognitionModel model)

Configura o reconhecedor com o modelo de palavra-chave fornecido.

java.util.concurrent.Future<java.lang.Void> stopContinuousRecognitionAsync()

Interrompe uma operação de reconhecimento em execução assim que possível e solicita imediatamente um resultado com base na entrada que foi processada até agora.

java.util.concurrent.Future<java.lang.Void> stopKeywordRecognitionAsync()

Encerra o reconhecimento iniciado palavra-chave.

Métodos herdados de Recognizer

Métodos herdados de java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Detalhes do campo

canceled

public final EventHandlerImpl canceled

O evento cancelado sinaliza que o reconhecimento foi cancelado.

recognized

public final EventHandlerImpl recognized

O evento reconhecido sinaliza que um resultado de reconhecimento final é recebido.

recognizing

public final EventHandlerImpl recognizing

O evento que reconhece sinaliza que um resultado de reconhecimento intermediário é recebido.

Detalhes do construtor

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido. Adicionado na versão 1.19.0

Parâmetros:

embeddedSpeechConfig - configuração de fala inserida.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido. Adicionado na versão 1.20.0

Parâmetros:

embeddedSpeechConfig - configuração de fala inserida.
autoDetectSourceLangConfig - configuração para detectar automaticamente o idioma de origem.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido. Adicionado na versão 1.20.0

Parâmetros:

embeddedSpeechConfig - configuração de fala inserida.
autoDetectSourceLangConfig - configuração para detectar automaticamente o idioma de origem.
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala inserido. Adicionado na versão 1.19.0

Parâmetros:

embeddedSpeechConfig - configuração de fala inserida.
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

Parâmetros:

hybridSpeechConfig - configuração de fala híbrida.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

Parâmetros:

hybridSpeechConfig - configuração de fala híbrida.
autoDetectSourceLangConfig - a configuração para detectar automaticamente o idioma de origem

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

Parâmetros:

hybridSpeechConfig - configuração de fala híbrida.
autoDetectSourceLangConfig - a configuração para detectar automaticamente o idioma de origem
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala para reconhecimento de fala híbrida.

Parâmetros:

hybridSpeechConfig - configuração de fala híbrida.
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
autoDetectSourceLangConfig - a configuração para detectar automaticamente o idioma de origem

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
autoDetectSourceLangConfig - a configuração para detectar automaticamente o idioma de origem
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
sourceLanguageConfig - a configuração do idioma de origem

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
sourceLanguageConfig - a configuração do idioma de origem
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
audioConfig - configuração de áudio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
sourceLanguage - o idioma de origem do reconhecimento

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Inicializa uma nova instância do Reconhecimento de Fala.

Parâmetros:

speechConfig - configuração de fala.
sourceLanguage - o idioma de origem do reconhecimento
audioConfig - configuração de áudio.

Detalhes do método

dispose

protected void dispose(boolean disposing)

Esse método executa a limpeza de recursos. O descarte do parâmetro booliano indica se o método é chamado de Dispose (se disposing for true) ou do finalizador (se disposing for false). As classes derivadas devem substituir esse método para descartar o recurso, se necessário.

Substituições:

SpeechRecognizer.dispose(boolean disposing)

Parâmetros:

disposing

getAuthorizationToken

public String getAuthorizationToken()

Obtém o token de autorização usado para se comunicar com o serviço.

Retornos:

Token de autorização.

getEndpointId

public String getEndpointId()

Obtém a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala.

Retornos:

a ID do ponto de extremidade de um modelo de fala personalizado que é usado para reconhecimento de fala.

getOutputFormat

public OutputFormat getOutputFormat()

Obtém o formato de saída do reconhecimento.

Retornos:

O formato de saída do reconhecimento.

getProperties

public PropertyCollection getProperties()

A coleção de propriedades e seus valores definidos para este SpeechRecognizer.

Retornos:

A coleção de propriedades e seus valores definidos para este SpeechRecognizer.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Obtém o idioma falado do reconhecimento.

Retornos:

A linguagem falada de reconhecimento.

recognizeOnceAsync

public Future recognizeOnceAsync()

Inicia o reconhecimento de fala e retorna depois que um único enunciado é reconhecido. O fim de um único enunciado é determinado pela escuta de silêncio no fim ou até o máximo de 15 segundos de áudio processado. A tarefa retorna o texto de reconhecimento como resultado. Observação: como recognizeOnceAsync() retorna apenas um único enunciado, ele é adequado apenas para o reconhecimento de captura única, como comando ou consulta. Para reconhecimento de vários enunciados de execução prolongada, use startContinuousRecognitionAsync() em vez disso.

Retornos:

Uma tarefa que representa a operação de reconhecimento. A tarefa retorna um valor de SpeechRecognitionResult

setAuthorizationToken

public void setAuthorizationToken(String token)

Define o token de autorização usado para se comunicar com o serviço. Observação: o chamador precisa garantir que o token de autorização seja válido. Antes que o token de autorização expire, o chamador precisa atualizá-lo chamando esse setter com um novo token válido. Caso contrário, o reconhecedor encontrará erros durante o reconhecimento.

Parâmetros:

token - Token de autorização.

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

Inicia o reconhecimento de fala em um fluxo de áudio contínuo, até que stopContinuousRecognitionAsync() seja chamado. O usuário deve assinar eventos para receber resultados de reconhecimento.

Retornos:

Uma tarefa que representa a operação assíncrona que inicia o reconhecimento.

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

Configura o reconhecedor com o modelo de palavra-chave fornecido. Depois de chamar esse método, o reconhecedor está escutando o palavra-chave para iniciar o reconhecimento. Chame stopKeywordRecognitionAsync() para encerrar o reconhecimento iniciado palavra-chave. O usuário deve assinar eventos para receber resultados de reconhecimento.

Parâmetros:

model - O modelo de reconhecimento palavra-chave que especifica o palavra-chave a ser reconhecido.

Retornos:

Uma tarefa que representa a operação assíncrona que inicia o reconhecimento.

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

Interrompe uma operação de reconhecimento em execução assim que possível e solicita imediatamente um resultado com base na entrada que foi processada até agora. Isso funciona para todas as operações de reconhecimento, não apenas as contínuas, e facilita o uso de botões push-to-talk ou "concluir agora" para pontos de extremidade de áudio manuais.

Retornos:

Um futuro que será concluído quando o processamento de entrada for interrompido. A geração de resultados, se aplicável à entrada fornecida, pode ocorrer após a conclusão dessa tarefa e deve ser tratada com o evento apropriado.

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

Encerra o reconhecimento iniciado palavra-chave.

Retornos:

Uma tarefa que representa a operação assíncrona que interrompe o reconhecimento.

Aplica-se a