次の方法で共有


SpeechRecognizer クラス

音声認識エンジン。 ソース言語情報を指定する必要がある場合は、言語、source_language_config、またはauto_detect_source_language_configの 3 つのパラメーターのいずれかを指定してください。

継承
SpeechRecognizer

コンストラクター

SpeechRecognizer(speech_config: SpeechConfig, audio_config: AudioConfig = None, language: str = None, source_language_config: SourceLanguageConfig = None, auto_detect_source_language_config: AutoDetectSourceLanguageConfig = None)

パラメーター

名前 説明
speech_config
必須

音声認識エンジンの構成

audio_config

オーディオ入力の構成

既定値: None
language

ソース言語

既定値: None
source_language_config

ソース言語の構成

既定値: None
auto_detect_source_language_config

自動検出ソース言語の構成

既定値: None

メソッド

recognize_once

ブロッキング (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

recognize_once_async

非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

start_continuous_recognition

継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_continuous_recognition_async

継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_keyword_recognition

指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_keyword_recognition_async

指定したキーワード (keyword) モデルを使用して認識エンジンを非同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。

stop_continuous_recognition

継続的な継続的な認識操作を同期的に終了します。

stop_continuous_recognition_async

継続的な継続的な認識操作を非同期的に終了します。

stop_keyword_recognition

キーワード (keyword)開始された認識を同期的に終了します。

stop_keyword_recognition_async

キーワード (keyword)開始された認識を非同期的に終了します。

recognize_once

ブロッキング (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

recognize_once() -> SpeechRecognitionResult

戻り値

説明

同期認識の結果値。

recognize_once_async

非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

recognize_once_async() -> ResultFuture

戻り値

説明

非同期認識の結果値を含む将来。

start_continuous_recognition

継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_continuous_recognition()

start_continuous_recognition_async

継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_continuous_recognition_async() -> ResultFuture

戻り値

説明

認識が初期化されると満たされる未来。

start_keyword_recognition

指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_keyword_recognition(model: KeywordRecognitionModel)

パラメーター

名前 説明
model
必須

認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。

start_keyword_recognition_async

指定したキーワード (keyword) モデルを使用して認識エンジンを非同期的に構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_keyword_recognition_async(model: KeywordRecognitionModel) -> ResultFuture

パラメーター

名前 説明
model
必須

認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。

戻り値

説明

認識が初期化されると満たされる未来。

stop_continuous_recognition

継続的な継続的な認識操作を同期的に終了します。

stop_continuous_recognition()

stop_continuous_recognition_async

継続的な継続的な認識操作を非同期的に終了します。

stop_continuous_recognition_async()

戻り値

説明

認識が停止されると満たされる未来。

stop_keyword_recognition

キーワード (keyword)開始された認識を同期的に終了します。

stop_keyword_recognition()

stop_keyword_recognition_async

キーワード (keyword)開始された認識を非同期的に終了します。

stop_keyword_recognition_async()

戻り値

説明

認識が停止されると満たされる未来。

属性

authorization_token

サービスへの接続に使用される承認トークン。

Note

呼び出し元は、認証トークンが有効であることを確認する必要があります。 の前に

承認トークンの有効期限が切れます。呼び出し元は、 を使用してこのセッターを呼び出して更新する必要があります。

新しい有効なトークン。 そうしないと、認識中に認識エンジンでエラーが発生します。

canceled

取り消された認識結果を含むイベントのシグナル (結果として取り消された認識の試行、または直接の取り消し要求、またはトランスポートまたはプロトコルの失敗を示します)。

このシグナルに接続されているコールバックは、 インスタンスを SpeechRecognitionCanceledEventArgs1 つの引数として使用して呼び出されます。

endpoint_id

認識に使用されるカスタマイズされた音声モデルのエンドポイント ID、または音声合成用のカスタム音声モデル。

properties

この Recognizer に対して定義されているプロパティとその値のコレクション。

recognized

最終的な認識結果を含むイベントのシグナル (認識試行が成功したことを示します)。

このシグナルに接続されているコールバックは、認識エンジンの種類に応じて、 インスタンスを 1 つの引数として呼び出 SpeechRecognitionEventArgs します。

recognizing

中間認識結果を含むイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechRecognitionEventArgs 1 つの引数として使用して呼び出されます。

session_started

認識セッションの開始 (操作) を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として使用して呼び出されます。

session_stopped

認識セッションの終了を示すイベントのシグナル (操作)。

このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として使用して呼び出されます。

speech_end_detected

音声の終了を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として使用して呼び出されます。

speech_start_detected

音声の開始を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として使用して呼び出されます。