SpeechRecognizer Clase
- java.
lang. Object - com.
microsoft. cognitiveservices. speech. Recognizer - com.
microsoft. cognitiveservices. speech. SpeechRecognizer
- com.
- com.
public final class SpeechRecognizer
extends Recognizer
Realiza el reconocimiento de voz desde micrófono, archivo u otras secuencias de entrada de audio y obtiene texto transcrito como resultado. Nota: se debe llamar a close() para liberar los recursos subyacentes mantenidos por el objeto .
Resumen del campo
Modificador y tipo | Campo y descripción |
---|---|
final
Event |
canceled
El evento canceló indica que se canceló el reconocimiento. |
final
Event |
recognized
El evento reconocido indica que se recibe un resultado de reconocimiento final. |
final
Event |
recognizing
El evento que reconoce señales de que se recibe un resultado intermedio de reconocimiento. |
Resumen del constructor
Resumen del método
Modificador y tipo | Método y descripción |
---|---|
protected void |
dispose(boolean disposing)
Este método realiza la limpieza de recursos. |
java.lang.String |
getAuthorizationToken()
Obtiene el token de autorización usado para comunicarse con el servicio. |
java.lang.String |
getEndpointId()
Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz. |
Output |
getOutputFormat()
Obtiene el formato de salida del reconocimiento. |
Property |
getProperties()
Colección de propiedades y sus valores definidos para speech |
java.lang.String |
getSpeechRecognitionLanguage()
Obtiene el idioma hablado del reconocimiento. |
java.util.concurrent.Future<Speech |
recognizeOnceAsync()
Inicia el reconocimiento de voz y devuelve después de que se reconozca una sola expresión. |
void |
setAuthorizationToken(String token)
Establece el token de autorización usado para comunicarse con el servicio. |
java.util.concurrent.Future<java.lang.Void> |
startContinuousRecognitionAsync()
Inicia el reconocimiento de voz en una secuencia de audio continua, hasta que |
java.util.concurrent.Future<java.lang.Void> |
startKeywordRecognitionAsync(KeywordRecognitionModel model)
Configura el reconocedor con el modelo de palabras clave especificado. |
java.util.concurrent.Future<java.lang.Void> |
stopContinuousRecognitionAsync()
Detiene una operación de reconocimiento en ejecución tan pronto como sea posible y solicita inmediatamente un resultado en función de la entrada que se ha procesado hasta ahora. |
java.util.concurrent.Future<java.lang.Void> |
stopKeywordRecognitionAsync()
Finaliza el reconocimiento iniciado por la palabra clave. |
Métodos heredados de Recognizer
Métodos heredados de java.lang.Object
Detalles del campo
canceled
public final EventHandlerImpl
El evento canceló indica que se canceló el reconocimiento.
recognized
public final EventHandlerImpl
El evento reconocido indica que se recibe un resultado de reconocimiento final.
recognizing
public final EventHandlerImpl
El evento que reconoce señales de que se recibe un resultado intermedio de reconocimiento.
Detalles del constructor
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Agregado en la versión 1.19.0
Parámetros:
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Se agregó en la versión 1.20.0
Parámetros:
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Se agregó en la versión 1.20.0
Parámetros:
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz incrustado. Agregado en la versión 1.19.0
Parámetros:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer para el reconocimiento de voz híbrido.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)
Inicializa una nueva instancia de Speech Recognizer.
Parámetros:
Detalles del método
dispose
protected void dispose(boolean disposing)
Este método realiza la limpieza de recursos. El parámetro booleano que elimina indica si se llama al método desde Dispose (si la eliminación es true) o desde el finalizador (si la eliminación es false). Las clases derivadas deben invalidar este método para eliminar el recurso si es necesario.
Invalidaciones:
SpeechRecognizer.dispose(boolean disposing)Parámetros:
getAuthorizationToken
public String getAuthorizationToken()
Obtiene el token de autorización usado para comunicarse con el servicio.
Devoluciones:
getEndpointId
public String getEndpointId()
Obtiene el identificador de punto de conexión de un modelo de voz personalizado que se usa para el reconocimiento de voz.
Devoluciones:
getOutputFormat
public OutputFormat getOutputFormat()
Obtiene el formato de salida del reconocimiento.
Devoluciones:
getProperties
public PropertyCollection getProperties()
Colección de propiedades y sus valores definidos para speechRecognizer.
Devoluciones:
getSpeechRecognitionLanguage
public String getSpeechRecognitionLanguage()
Obtiene el idioma hablado del reconocimiento.
Devoluciones:
recognizeOnceAsync
public Future
Inicia el reconocimiento de voz y devuelve después de que se reconozca una sola expresión. El final de una expresión única se determina mediante la escucha de un silencio al final o hasta que se procesa un máximo de 15 segundos de audio. La tarea devuelve el texto de reconocimiento como resultado. Nota: Dado que recognizeOnceAsync() solo devuelve una sola expresión, solo es adecuado para el reconocimiento de captura única, como el comando o la consulta. Para el reconocimiento de varias expresiones de ejecución prolongada, use startContinuousRecognitionAsync() en su lugar.
Devoluciones:
setAuthorizationToken
public void setAuthorizationToken(String token)
Establece el token de autorización usado para comunicarse con el servicio. Nota: El autor de la llamada debe asegurarse de que el token de autorización es válido. Antes de que expire el token de autorización, el autor de la llamada debe actualizarlo llamando a este establecedor con un nuevo token válido. De lo contrario, el reconocedor encontrará errores durante el reconocimiento.
Parámetros:
startContinuousRecognitionAsync
public Future
Inicia el reconocimiento de voz en una secuencia de audio continua, hasta que se llama a stopContinuousRecognitionAsync(). El usuario debe suscribirse a eventos para recibir resultados de reconocimiento.
Devoluciones:
startKeywordRecognitionAsync
public Future
Configura el reconocedor con el modelo de palabras clave especificado. Después de llamar a este método, el reconocedor escucha la palabra clave para iniciar el reconocimiento. Llame a stopKeywordRecognitionAsync() para finalizar el reconocimiento iniciado por la palabra clave. El usuario debe suscribirse a eventos para recibir resultados de reconocimiento.
Parámetros:
Devoluciones:
stopContinuousRecognitionAsync
public Future
Detiene una operación de reconocimiento en ejecución tan pronto como sea posible y solicita inmediatamente un resultado en función de la entrada que se ha procesado hasta ahora. Esto funciona para todas las operaciones de reconocimiento, no solo para las continuas, y facilita el uso de botones push-to-talk o "finish now" para el punto de conexión de audio manual.
Devoluciones:
stopKeywordRecognitionAsync
public Future
Finaliza el reconocimiento iniciado por la palabra clave.
Devoluciones:
Se aplica a
Azure SDK for Java