SpeechRecognizer クラス
音声認識エンジン。 ソース言語情報を指定する必要がある場合は、言語、source_language_config、またはauto_detect_source_language_configの 3 つのパラメーターのいずれかを指定してください。
- 継承
-
SpeechRecognizer
コンストラクター
SpeechRecognizer(speech_config: SpeechConfig, audio_config: AudioConfig = None, language: str = None, source_language_config: SourceLanguageConfig = None, auto_detect_source_language_config: AutoDetectSourceLanguageConfig = None)
パラメーター
名前 | 説明 |
---|---|
speech_config
必須
|
音声認識エンジンの構成 |
audio_config
|
オーディオ入力の構成 既定値: None
|
language
|
ソース言語 既定値: None
|
source_language_config
|
ソース言語の構成 既定値: None
|
auto_detect_source_language_config
|
自動検出ソース言語の構成 既定値: None
|
メソッド
recognize_once |
ブロッキング (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。 |
recognize_once_async |
非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。 |
start_continuous_recognition |
継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。 |
start_continuous_recognition_async |
継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。 |
start_keyword_recognition |
指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。 |
start_keyword_recognition_async |
指定したキーワード (keyword) モデルを使用して認識エンジンを非同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。 |
stop_continuous_recognition |
継続的な継続的な認識操作を同期的に終了します。 |
stop_continuous_recognition_async |
継続的な継続的な認識操作を非同期的に終了します。 |
stop_keyword_recognition |
キーワード (keyword)開始された認識を同期的に終了します。 |
stop_keyword_recognition_async |
キーワード (keyword)開始された認識を非同期的に終了します。 |
recognize_once
ブロッキング (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。
recognize_once() -> SpeechRecognitionResult
戻り値
型 | 説明 |
---|---|
同期認識の結果値。 |
recognize_once_async
非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。
recognize_once_async() -> ResultFuture
戻り値
型 | 説明 |
---|---|
非同期認識の結果値を含む将来。 |
start_continuous_recognition
継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。
start_continuous_recognition()
start_continuous_recognition_async
継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。
start_continuous_recognition_async() -> ResultFuture
戻り値
型 | 説明 |
---|---|
認識が初期化されると満たされる未来。 |
start_keyword_recognition
指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。
start_keyword_recognition(model: KeywordRecognitionModel)
パラメーター
名前 | 説明 |
---|---|
model
必須
|
認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。 |
start_keyword_recognition_async
指定したキーワード (keyword) モデルを使用して認識エンジンを非同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。
start_keyword_recognition_async(model: KeywordRecognitionModel) -> ResultFuture
パラメーター
名前 | 説明 |
---|---|
model
必須
|
認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。 |
戻り値
型 | 説明 |
---|---|
認識が初期化されると満たされる未来。 |
stop_continuous_recognition
継続的な継続的な認識操作を同期的に終了します。
stop_continuous_recognition()
stop_continuous_recognition_async
継続的な継続的な認識操作を非同期的に終了します。
stop_continuous_recognition_async()
戻り値
型 | 説明 |
---|---|
認識が停止されると満たされる未来。 |
stop_keyword_recognition
キーワード (keyword)開始された認識を同期的に終了します。
stop_keyword_recognition()
stop_keyword_recognition_async
キーワード (keyword)開始された認識を非同期的に終了します。
stop_keyword_recognition_async()
戻り値
型 | 説明 |
---|---|
認識が停止されると満たされる未来。 |
属性
authorization_token
サービスへの接続に使用される承認トークン。
Note
呼び出し元は、認証トークンが有効であることを確認する必要があります。 の前に
承認トークンの有効期限が切れます。呼び出し元は、 を使用してこのセッターを呼び出して更新する必要があります。
新しい有効なトークン。 そうしないと、認識中に認識エンジンでエラーが発生します。
canceled
取り消された認識結果を含むイベントのシグナル (結果として取り消された認識の試行、または直接の取り消し要求、またはトランスポートまたはプロトコルの失敗を示します)。
このシグナルに接続されているコールバックは、 インスタンスを SpeechRecognitionCanceledEventArgs1 つの引数として使用して呼び出されます。
endpoint_id
認識に使用されるカスタマイズされた音声モデルのエンドポイント ID、または音声合成用のカスタム音声モデル。
properties
この Recognizer に対して定義されているプロパティとその値のコレクション。
recognized
最終的な認識結果を含むイベントのシグナル (認識試行が成功したことを示します)。
このシグナルに接続されているコールバックは、認識エンジンの種類に応じて、 インスタンスを 1 つの引数として呼び出 SpeechRecognitionEventArgs します。
recognizing
中間認識結果を含むイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを SpeechRecognitionEventArgs 1 つの引数として使用して呼び出されます。
session_started
認識セッションの開始 (操作) を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として使用して呼び出されます。
session_stopped
認識セッションの終了を示すイベントのシグナル (操作)。
このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として使用して呼び出されます。
speech_end_detected
音声の終了を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として使用して呼び出されます。
speech_start_detected
音声の開始を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として使用して呼び出されます。
Azure SDK for Python