次の方法で共有


ConversationTranscriber クラス

会話の文字起こし操作を実行する オブジェクト。 ソース言語情報を指定する必要がある場合は、言語、source_language_config、またはauto_detect_source_language_configの 3 つのパラメーターのいずれかを指定してください。

継承
ConversationTranscriber

コンストラクター

ConversationTranscriber(speech_config: SpeechConfig, audio_config: AudioConfig = None, language: str = None, source_language_config: SourceLanguageConfig = None, auto_detect_source_language_config: AutoDetectSourceLanguageConfig = None)

パラメーター

名前 説明
speech_config
必須

会話文字起こしの構成

audio_config

オーディオ入力の構成

既定値: None
language

ソース言語

既定値: None
source_language_config

ソース言語の構成

既定値: None
auto_detect_source_language_config

自動検出ソース言語の構成

既定値: None

メソッド

recognize_once

ブロック (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

recognize_once_async

非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

start_continuous_recognition

継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_continuous_recognition_async

継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_keyword_recognition

指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_keyword_recognition_async

指定したキーワード (keyword) モデルを使用して認識エンジンを非同期に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_transcribing_async

会話文字起こしを非同期的に開始します。

stop_continuous_recognition

継続的な継続的な認識操作を同期的に終了します。

stop_continuous_recognition_async

継続的な継続的認識操作を非同期的に終了します。

stop_keyword_recognition

キーワード (keyword)開始された認識を同期的に終了します。

stop_keyword_recognition_async

キーワード (keyword)開始された認識を非同期的に終了します。

stop_transcribing_async

会話の文字起こしを非同期的に停止します。

recognize_once

ブロック (同期) モードで認識を実行します。 1 つの発話が認識された後に、返されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

recognize_once() -> SpeechRecognitionResult

戻り値

説明

同期認識の結果値。

recognize_once_async

非ブロッキング (非同期) モードで認識を実行します。 これにより、1 つの発話が認識されます。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 時間の長い複数の発話の認識には、代わりに start_continuous_recognition_async を使用します。

recognize_once_async() -> ResultFuture

戻り値

説明

非同期認識の結果値を含む未来。

start_continuous_recognition

継続的な認識操作を同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_continuous_recognition()

start_continuous_recognition_async

継続的な認識操作を非同期的に開始します。 ユーザーが認識結果を受け取るには、EventSignal に接続する必要があります。 を呼び出 stop_continuous_recognition_async して認識を停止します。

start_continuous_recognition_async()

戻り値

説明

認識が初期化されると満たされる未来。

start_keyword_recognition

指定したキーワード (keyword) モデルを使用して認識エンジンを同期的に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_keyword_recognition(model: KeywordRecognitionModel)

パラメーター

名前 説明
model
必須

認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。

start_keyword_recognition_async

指定したキーワード (keyword) モデルを使用して認識エンジンを非同期に構成します。 このメソッドを呼び出すと、認識エンジンは認識を開始するキーワード (keyword)をリッスンします。 stop_keyword_recognition_async() を呼び出して、キーワード (keyword)開始された認識を終了します。

start_keyword_recognition_async(model: KeywordRecognitionModel)

パラメーター

名前 説明
model
必須

認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。

戻り値

説明

認識が初期化されると満たされる未来。

start_transcribing_async

会話文字起こしを非同期的に開始します。

start_transcribing_async() -> ResultFuture

戻り値

説明

会話の文字起こしが開始されると満たされる未来。

stop_continuous_recognition

継続的な継続的な認識操作を同期的に終了します。

stop_continuous_recognition()

stop_continuous_recognition_async

継続的な継続的認識操作を非同期的に終了します。

stop_continuous_recognition_async()

戻り値

説明

認識が停止されると満たされる未来。

stop_keyword_recognition

キーワード (keyword)開始された認識を同期的に終了します。

stop_keyword_recognition()

stop_keyword_recognition_async

キーワード (keyword)開始された認識を非同期的に終了します。

stop_keyword_recognition_async()

戻り値

説明

認識が停止されると満たされる未来。

stop_transcribing_async

会話の文字起こしを非同期的に停止します。

stop_transcribing_async() -> ResultFuture

戻り値

説明

会話の文字起こしが停止されると満たされる未来。

属性

authorization_token

サービスへの接続に使用される承認トークン。

注意

呼び出し元は、認証トークンが有効であることを確認する必要があります。 の前に

承認トークンの有効期限が切れます。呼び出し元は、 を使用してこのセッターを呼び出して更新する必要があります。

新しい有効なトークン。 新しい認識エンジンの作成時に構成値がコピーされるため、

新しいトークン値は、既に作成されている認識エンジンには適用されません。 For

以前に作成された認識エンジンでは、 の承認トークンを設定する必要があります。

トークンを更新するための対応する認識エンジン。 それ以外の場合、認識エンジンは

文字起こし中にエラーが発生します。

canceled

取り消された文字起こしの結果を含むイベントのシグナル (結果として取り消された文字起こしの試行、または直接の取り消し要求、またはトランスポートまたはプロトコルの失敗を示します)。

このシグナルに接続されているコールバックは、 インスタンスを ConversationTranscriptionCanceledEventArgs1 つの引数として使用して呼び出されます。

endpoint_id

認識に使用されるカスタマイズされた音声モデルのエンドポイント ID、または音声合成用のカスタム音声モデル。

properties

この Participant に対して定義されているプロパティとその値のコレクション。

recognized

最終的な認識結果を含むイベントのシグナル (認識試行が成功したことを示します)。

このシグナルに接続されているコールバックは、認識エンジンの種類に応じて、 インスタンスまたは IntentRecognitionEventArgs インスタンスを 1 つの引数として呼び出SpeechRecognitionEventArgsTranslationRecognitionEventArgsします。

recognizing

中間認識結果を含むイベントのシグナル。

このシグナルに接続されているコールバックは、認識エンジンの種類に応じて、 インスタンスまたは IntentRecognitionEventArgs インスタンスを 1 つの引数として呼び出SpeechRecognitionEventArgsTranslationRecognitionEventArgsします。

session_started

認識セッションの開始 (操作) を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として呼び出します。

session_stopped

認識セッションの終了 (操作) を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SessionEventArgs 1 つの引数として呼び出します。

speech_end_detected

音声の終了を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として呼び出します。

speech_start_detected

音声の開始を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを RecognitionEventArgs 1 つの引数として呼び出します。

transcribed

最終的な文字起こしの結果を含むイベントのシグナル (正常な文字起こし試行を示します)。

このシグナルに接続されているコールバックは、 インスタンスを ConversationTranscriptionEventArgs1 つの引数として使用して呼び出されます。

transcribing

中間文字起こしの結果を含むイベントのシグナル。

このシグナルに接続されているコールバックは、 インスタンスを ConversationTranscriptionEventArgs1 つの引数として使用して呼び出されます。