ConversationTranscriber クラス
会話の文字起こし操作を実行する オブジェクト。 ソース言語情報を指定する必要がある場合は、言語、source_language_config、またはauto_detect_source_language_configの 3 つのパラメーターのいずれかを指定してください。
- 継承
-
ConversationTranscriber
コンストラクター
ConversationTranscriber(speech_config: SpeechConfig, audio_config: AudioConfig = None, language: str = None, source_language_config: SourceLanguageConfig = None, auto_detect_source_language_config: AutoDetectSourceLanguageConfig = None)
パラメーター
名前 | 説明 |
---|---|
speech_config
必須
|
会話文字起こしの構成 |
audio_config
|
オーディオ入力の構成 既定値: None
|
language
|
ソース言語 既定値: None
|
source_language_config
|
ソース言語の構成 既定値: None
|
auto_detect_source_language_config
|
自動検出ソース言語の構成 既定値: None
|
メソッド
recognize_once |
ブロック (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。 |
recognize_once_async |
非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。 |
start_continuous_recognition |
継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。 |
start_continuous_recognition_async |
継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。 |
start_keyword_recognition |
指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。 |
start_keyword_recognition_async |
指定したキーワード (keyword) モデルを使用して認識エンジンを非同期に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。 |
start_transcribing_async |
会話文字起こしを非同期的に開始します。 |
stop_continuous_recognition |
継続的な継続的な認識操作を同期的に終了します。 |
stop_continuous_recognition_async |
継続的な継続的認識操作を非同期的に終了します。 |
stop_keyword_recognition |
キーワード (keyword)開始された認識を同期的に終了します。 |
stop_keyword_recognition_async |
キーワード (keyword)開始された認識を非同期的に終了します。 |
stop_transcribing_async |
会話の文字起こしを非同期的に停止します。 |
recognize_once
ブロック (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。
recognize_once() -> SpeechRecognitionResult
戻り値
型 | 説明 |
---|---|
同期認識の結果値。 |
recognize_once_async
非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。
recognize_once_async() -> ResultFuture
戻り値
型 | 説明 |
---|---|
非同期認識の結果値を含む未来。 |
start_continuous_recognition
継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。
start_continuous_recognition()
start_continuous_recognition_async
継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。
start_continuous_recognition_async()
戻り値
型 | 説明 |
---|---|
認識が初期化されると満たされる未来。 |
start_keyword_recognition
指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。
start_keyword_recognition(model: KeywordRecognitionModel)
パラメーター
名前 | 説明 |
---|---|
model
必須
|
認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。 |
start_keyword_recognition_async
指定したキーワード (keyword) モデルを使用して認識エンジンを非同期に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。
start_keyword_recognition_async(model: KeywordRecognitionModel)
パラメーター
名前 | 説明 |
---|---|
model
必須
|
認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。 |
戻り値
型 | 説明 |
---|---|
認識が初期化されると満たされる未来。 |
start_transcribing_async
会話文字起こしを非同期的に開始します。
start_transcribing_async() -> ResultFuture
戻り値
型 | 説明 |
---|---|
会話の文字起こしが開始されると満たされる未来。 |
stop_continuous_recognition
継続的な継続的な認識操作を同期的に終了します。
stop_continuous_recognition()
stop_continuous_recognition_async
継続的な継続的認識操作を非同期的に終了します。
stop_continuous_recognition_async()
戻り値
型 | 説明 |
---|---|
認識が停止されると満たされる未来。 |
stop_keyword_recognition
キーワード (keyword)開始された認識を同期的に終了します。
stop_keyword_recognition()
stop_keyword_recognition_async
キーワード (keyword)開始された認識を非同期的に終了します。
stop_keyword_recognition_async()
戻り値
型 | 説明 |
---|---|
認識が停止されると満たされる未来。 |
stop_transcribing_async
会話の文字起こしを非同期的に停止します。
stop_transcribing_async() -> ResultFuture
戻り値
型 | 説明 |
---|---|
会話の文字起こしが停止されると満たされる未来。 |
属性
authorization_token
サービスへの接続に使用される承認トークン。
注意
呼び出し元は、認証トークンが有効であることを確認する必要があります。 の前に
承認トークンの有効期限が切れます。呼び出し元は、 を使用してこのセッターを呼び出して更新する必要があります。
新しい有効なトークン。 新しい認識エンジンの作成時に構成値がコピーされるため、
新しいトークン値は、既に作成されている認識エンジンには適用されません。 For
以前に作成された認識エンジンでは、 の承認トークンを設定する必要があります。
トークンを更新するための対応する認識エンジン。 それ以外の場合、認識エンジンは
文字起こし中にエラーが発生します。
canceled
取り消された文字起こしの結果を含むイベントのシグナル (結果として取り消された文字起こしの試行、または直接の取り消し要求、またはトランスポートまたはプロトコルの失敗を示します)。
このシグナルに接続されているコールバックは、 インスタンスを ConversationTranscriptionCanceledEventArgs1 つの引数として使用して呼び出されます。
endpoint_id
認識に使用されるカスタマイズされた音声モデルのエンドポイント ID、または音声合成用のカスタム音声モデル。
properties
この Participant に対して定義されているプロパティとその値のコレクション。
recognized
最終的な認識結果を含むイベントのシグナル (認識試行が成功したことを示します)。
このシグナルに接続されているコールバックは、認識エンジンの種類に応じて、 インスタンスまたは IntentRecognitionEventArgs インスタンスを 1 つの引数として呼び出SpeechRecognitionEventArgsTranslationRecognitionEventArgsします。
recognizing
中間認識結果を含むイベントのシグナル。
このシグナルに接続されているコールバックは、認識エンジンの種類に応じて、 インスタンスまたは IntentRecognitionEventArgs インスタンスを 1 つの引数として呼び出SpeechRecognitionEventArgsTranslationRecognitionEventArgsします。
session_started
認識セッションの開始 (操作) を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として呼び出します。
session_stopped
認識セッションの終了 (操作) を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として呼び出します。
speech_end_detected
音声の終了を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として呼び出します。
speech_start_detected
音声の開始を示すイベントのシグナル。
このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として呼び出します。
transcribed
最終的な文字起こしの結果を含むイベントのシグナル (正常な文字起こし試行を示します)。
このシグナルに接続されているコールバックは、 インスタンスを ConversationTranscriptionEventArgs1 つの引数として使用して呼び出されます。
transcribing
中間文字起こしの結果を含むイベントのシグナル。
このシグナルに接続されているコールバックは、 インスタンスを ConversationTranscriptionEventArgs1 つの引数として使用して呼び出されます。
Azure SDK for Python