Compartir a través de


SpeechRecognizer Clase

public final class SpeechRecognizer
extends Recognizer

Realiza el reconocimiento de voz desde micrófono, archivo u otras secuencias de entrada de audio y obtiene texto transcrito como resultado. Nota: se debe llamar a close() para liberar los recursos subyacentes mantenidos por el objeto .

Resumen del campo

Modificador y tipo Campo y descripción
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs> canceled

El evento canceló indica que se canceló el reconocimiento.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognized

El evento reconocido indica que se recibe un resultado de reconocimiento final.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognizing

El evento que reconoce señales de que se recibe un resultado intermedio de reconocimiento.

Resumen del constructor

Constructor Description
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

SpeechRecognizer(SpeechConfig speechConfig)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Inicializa una nueva instancia de Speech Recognizer.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

Resumen del método

Modificador y tipo Método y descripción
protected void dispose(boolean disposing)

Este método realiza la limpieza de recursos.

java.lang.String getAuthorizationToken()

Obtiene el token de autorización usado para comunicarse con el servicio.

java.lang.String getEndpointId()

Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz.

OutputFormat getOutputFormat()

Obtiene el formato de salida del reconocimiento.

PropertyCollection getProperties()

Colección de propiedades y sus valores definidos para speechRecognizer.

java.lang.String getSpeechRecognitionLanguage()

Obtiene el idioma hablado del reconocimiento.

java.util.concurrent.Future<SpeechRecognitionResult> recognizeOnceAsync()

Inicia el reconocimiento de voz y devuelve después de que se reconozca una sola expresión.

void setAuthorizationToken(String token)

Establece el token de autorización usado para comunicarse con el servicio.

java.util.concurrent.Future<java.lang.Void> startContinuousRecognitionAsync()

Inicia el reconocimiento de voz en una secuencia de audio continua, hasta quese llame a Async() de reconocimientocontinuo.

java.util.concurrent.Future<java.lang.Void> startKeywordRecognitionAsync(KeywordRecognitionModel model)

Configura el reconocedor con el modelo de palabras clave especificado.

java.util.concurrent.Future<java.lang.Void> stopContinuousRecognitionAsync()

Detiene una operación de reconocimiento en ejecución tan pronto como sea posible y solicita inmediatamente un resultado en función de la entrada que se ha procesado hasta ahora.

java.util.concurrent.Future<java.lang.Void> stopKeywordRecognitionAsync()

Finaliza el reconocimiento iniciado por la palabra clave.

Métodos heredados de Recognizer

Métodos heredados de java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Detalles del campo

canceled

public final EventHandlerImpl canceled

El evento canceló indica que se canceló el reconocimiento.

recognized

public final EventHandlerImpl recognized

El evento reconocido indica que se recibe un resultado de reconocimiento final.

recognizing

public final EventHandlerImpl recognizing

El evento que reconoce señales de que se recibe un resultado intermedio de reconocimiento.

Detalles del constructor

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Agregado en la versión 1.19.0

Parámetros:

embeddedSpeechConfig - configuración de voz insertada.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Se agregó en la versión 1.20.0

Parámetros:

embeddedSpeechConfig - configuración de voz insertada.
autoDetectSourceLangConfig - configuración para detectar automáticamente el idioma de origen.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Se agregó en la versión 1.20.0

Parámetros:

embeddedSpeechConfig - configuración de voz insertada.
autoDetectSourceLangConfig - configuración para detectar automáticamente el idioma de origen.
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Agregado en la versión 1.19.0

Parámetros:

embeddedSpeechConfig - configuración de voz insertada.
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

Parámetros:

hybridSpeechConfig - configuración de voz híbrida.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

Parámetros:

hybridSpeechConfig - configuración de voz híbrida.
autoDetectSourceLangConfig - la configuración para detectar automáticamente el idioma de origen

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

Parámetros:

hybridSpeechConfig - configuración de voz híbrida.
autoDetectSourceLangConfig - la configuración para detectar automáticamente el idioma de origen
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.

Parámetros:

hybridSpeechConfig - configuración de voz híbrida.
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
autoDetectSourceLangConfig - la configuración para detectar automáticamente el idioma de origen

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
autoDetectSourceLangConfig - la configuración para detectar automáticamente el idioma de origen
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
sourceLanguageConfig - la configuración del idioma de origen

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
sourceLanguageConfig - la configuración del idioma de origen
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
audioConfig - configuración de audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
sourceLanguage - el idioma de origen del reconocimiento

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Inicializa una nueva instancia de Speech Recognizer.

Parámetros:

speechConfig - configuración de voz.
sourceLanguage - el idioma de origen del reconocimiento
audioConfig - configuración de audio.

Detalles del método

dispose

protected void dispose(boolean disposing)

Este método realiza la limpieza de recursos. El parámetro booleano que elimina indica si se llama al método desde Dispose (si la eliminación es true) o desde el finalizador (si la eliminación es false). Las clases derivadas deben invalidar este método para eliminar el recurso si es necesario.

Invalidaciones:

SpeechRecognizer.dispose(boolean disposing)

Parámetros:

disposing

getAuthorizationToken

public String getAuthorizationToken()

Obtiene el token de autorización usado para comunicarse con el servicio.

Devoluciones:

Token de autorización.

getEndpointId

public String getEndpointId()

Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz.

Devoluciones:

el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz.

getOutputFormat

public OutputFormat getOutputFormat()

Obtiene el formato de salida del reconocimiento.

Devoluciones:

Formato de salida del reconocimiento.

getProperties

public PropertyCollection getProperties()

Colección de propiedades y sus valores definidos para speechRecognizer.

Devoluciones:

Colección de propiedades y sus valores definidos para speechRecognizer.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Obtiene el idioma hablado del reconocimiento.

Devoluciones:

Idioma hablado del reconocimiento.

recognizeOnceAsync

public Future recognizeOnceAsync()

Inicia el reconocimiento de voz y devuelve después de que se reconozca una sola expresión. El final de una expresión única se determina mediante la escucha de un silencio al final o hasta que se procesa un máximo de 15 segundos de audio. La tarea devuelve el texto de reconocimiento como resultado. Nota: Dado que recognizeOnceAsync() solo devuelve una sola expresión, solo es adecuado para el reconocimiento de captura única, como el comando o la consulta. Para el reconocimiento de varias expresiones de ejecución prolongada, use startContinuousRecognitionAsync() en su lugar.

Devoluciones:

Tarea que representa la operación de reconocimiento. La tarea devuelve un valor de SpeechRecognitionResult.

setAuthorizationToken

public void setAuthorizationToken(String token)

Establece el token de autorización usado para comunicarse con el servicio. Nota: El autor de la llamada debe asegurarse de que el token de autorización es válido. Antes de que expire el token de autorización, el autor de la llamada debe actualizarlo llamando a este establecedor con un nuevo token válido. De lo contrario, el reconocedor encontrará errores durante el reconocimiento.

Parámetros:

token - Token de autorización.

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

Inicia el reconocimiento de voz en una secuencia de audio continua, hasta que se llama a stopContinuousRecognitionAsync(). El usuario debe suscribirse a eventos para recibir resultados de reconocimiento.

Devoluciones:

Tarea que representa la operación asincrónica que inicia el reconocimiento.

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

Configura el reconocedor con el modelo de palabras clave especificado. Después de llamar a este método, el reconocedor escucha la palabra clave para iniciar el reconocimiento. Llame a stopKeywordRecognitionAsync() para finalizar el reconocimiento iniciado por la palabra clave. El usuario debe suscribirse a eventos para recibir resultados de reconocimiento.

Parámetros:

model - Modelo de reconocimiento de palabras clave que especifica la palabra clave que se va a reconocer.

Devoluciones:

Tarea que representa la operación asincrónica que inicia el reconocimiento.

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

Detiene una operación de reconocimiento en ejecución tan pronto como sea posible y solicita inmediatamente un resultado en función de la entrada que se ha procesado hasta ahora. Esto funciona para todas las operaciones de reconocimiento, no solo para las continuas, y facilita el uso de botones push-to-talk o "finish now" para el punto de conexión de audio manual.

Devoluciones:

Un futuro que se completará cuando se haya detenido el procesamiento de entrada. La generación de resultados, si procede para la entrada proporcionada, puede producirse una vez completada esta tarea y debe controlarse con el evento adecuado.

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

Finaliza el reconocimiento iniciado por la palabra clave.

Devoluciones:

Tarea que representa la operación asincrónica que detiene el reconocimiento.

Se aplica a