microsoft-cognitiveservices-speech-sdk package
類別
ActivityReceivedEventArgs |
定義已接收訊息/事件的內容。 |
AudioConfig |
表示用來指定要使用何種輸入類型的音訊輸入組態, (麥克風、檔案、資料流程) 。 |
AudioInputStream |
表示用於自訂音訊輸入組態的音訊輸入資料流程。 |
AudioOutputStream |
表示用於自訂音訊輸出組態的音訊輸出資料流程。 |
AudioStreamFormat |
表示用於自訂音訊輸入組態的音訊資料流程格式。 |
AutoDetectSourceLanguageConfig |
語言自動偵測組態。 |
AutoDetectSourceLanguageResult |
輸出格式 |
AvatarConfig |
定義交談虛擬人偶組態。 |
AvatarEventArgs |
定義交談虛擬人偶事件的內容。 |
AvatarSynthesizer |
定義虛擬人偶合成器。 |
AvatarVideoFormat |
定義虛擬人偶輸出視訊格式。 |
AvatarWebRTCConnectionResult |
定義虛擬人偶 WebRTC 連線結果。 |
BaseAudioPlayer |
基底音訊播放程式類別 TODO:目前僅播放 PCM。 |
BotFrameworkConfig |
類別,定義使用 Bot Framework 後端之對話方塊服務連接器物件的組態。 |
CancellationDetails |
包含取消結果原因的詳細資訊。 |
CancellationDetailsBase |
包含取消結果原因的詳細資訊。 |
Connection |
Connection 是一種 Proxy 類別,可用來管理與指定辨識器之語音服務的連線。 根據預設,辨識器會在需要時自動管理服務的連線。 Connection 類別會提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱線上狀態變更。 使用 Connection 是選擇性的,主要是針對需要根據線上狀態微調應用程式行為的案例。 使用者可以選擇性地呼叫 Open () ,在開始辨識與此連線相關聯的辨識器之前,事先手動設定連線。 如果辨識器需要連線或中斷連線至服務,則會獨立設定或關閉連線。 在此情況下,連線會透過連線/已中斷線上活動變更來收到通知。 已在 1.2.1 版中新增。 |
ConnectionEventArgs |
定義線上活動的承載,例如 Connected/Disconnected。 已在 1.2.0 版中新增 |
ConnectionMessage |
ConnectionMessage 代表傳送至語音服務及從語音服務接收的實作特定訊息。 這些訊息是為了偵錯而提供,不應用於 Azure 認知服務語音服務的生產使用案例。 傳送至語音服務及從語音服務接收的訊息可能會變更,而不需通知。 這包括訊息內容、標頭、承載、排序等。已在 1.11.0 版中新增。 |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。 |
ConversationParticipantsChangedEventArgs |
定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。 |
ConversationTranscriber |
使用麥克風、檔案或其他音訊輸入串流的說話者分隔來執行語音辨識,並取得轉譯的文字。 |
ConversationTranscriptionCanceledEventArgs |
定義 RecognitionErrorEvent 的內容。 |
ConversationTranscriptionEventArgs |
定義交談轉譯/轉譯事件的內容。 |
ConversationTranscriptionResult |
定義交談轉譯的結果。 |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
定義會話事件的承載,例如偵測到語音開始/結束 |
ConversationTranslationResult |
翻譯文字結果。 |
ConversationTranslator |
加入、離開或連線至交談。 |
Coordinate |
定義 2D 空間中的座標。 |
CustomCommandsConfig |
類別,定義使用 CustomCommands 後端之對話方塊服務連接器物件的組態。 |
Diagnostics |
定義診斷 API 以管理 1.21.0 版中新增的主控台輸出 |
DialogServiceConfig |
定義對話服務連接器基底組態的類別 |
DialogServiceConnector |
對話方塊服務連接器 |
IntentRecognitionCanceledEventArgs |
定義意圖辨識已取消結果事件的承載。 |
IntentRecognitionEventArgs |
意圖辨識結果事件引數。 |
IntentRecognitionResult |
意圖辨識結果。 |
IntentRecognizer |
意圖辨識器。 |
KeywordRecognitionModel |
表示當使用者說出關鍵字來起始進一步語音辨識時,用於辨識的關鍵字辨識模型。 |
LanguageUnderstandingModel |
語言理解模型 |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
定義 MeetingTranscriptionCanceledEvent 的內容。 |
MeetingTranscriptionEventArgs |
定義會議轉譯/轉譯事件的內容。 |
NoMatchDetails |
包含 NoMatch 辨識結果的詳細資訊。 |
Participant |
代表交談中的參與者。 已在 1.4.0 版中新增 |
PhraseListGrammar |
允許新增片語以改善語音辨識。 新增至辨識器的片語在下一次辨識開始時有效,或下次 SpeechSDK 必須重新連線到語音服務時有效。 |
PronunciationAssessmentConfig |
發音評定組態。 |
PronunciationAssessmentResult |
發音評定結果。 |
PropertyCollection |
表示屬性及其值的集合。 |
PullAudioInputStream |
表示用於自訂音訊輸入組態的音訊輸入資料流程。 |
PullAudioInputStreamCallback |
抽象基類,定義自訂音訊輸入資料流程) (read () 和 close () ) 的回呼方法。 |
PullAudioOutputStream |
表示用於自訂音訊輸出組態的記憶體支援推播音訊輸出資料流程。 |
PushAudioInputStream |
表示用於自訂音訊輸入組態的記憶體支援推播音訊輸入資料流程。 |
PushAudioOutputStream |
表示用於自訂音訊輸出組態的音訊輸出資料流程。 |
PushAudioOutputStreamCallback |
抽象基類,定義自訂音訊輸出資料流程) (寫入 () 和 close () ) 的回呼方法。 |
RecognitionEventArgs |
定義會話事件的承載,例如偵測到語音開始/結束 |
RecognitionResult |
定義語音辨識的結果。 |
Recognizer |
定義基類辨識器,主要包含常見的事件處理常式。 |
ServiceEventArgs |
定義 1.9.0 版中新增的任何服務訊息事件的承載 |
SessionEventArgs |
定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。 |
SourceLanguageConfig |
來來源語言組態。 |
SpeakerAudioDestination |
代表喇叭播放音訊目的地,其僅適用于瀏覽器。 注意:SDK 會嘗試使用 媒體來源延伸模組 播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari (桌面) 上具有更好的支援,因此最好指定 mp3 格式來播放。 |
SpeakerIdentificationModel |
定義說話者辨識模型的 SpeakerIdentificationModel 類別包含一組設定檔,用來識別說話者 () |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
輸出格式 |
SpeakerRecognizer |
針對語音設定檔作業 (的使用者定義 SpeakerRecognizer 類別,例如 createProfile、deleteProfile) |
SpeakerVerificationModel |
定義說話者辨識模型的 SpeakerVerificationModel 類別包含用來驗證說話者的設定檔 |
SpeechConfig |
語音設定。 |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
定義語音辨識/辨識事件的內容。 |
SpeechRecognitionResult |
定義語音辨識的結果。 |
SpeechRecognizer |
從麥克風、檔案或其他音訊輸入資料流程執行語音辨識,並取得轉譯的文字。 |
SpeechSynthesisBookmarkEventArgs |
定義語音合成書簽事件的內容。 |
SpeechSynthesisEventArgs |
定義語音合成事件的內容。 |
SpeechSynthesisResult |
定義語音合成的結果。 |
SpeechSynthesisVisemeEventArgs |
定義語音合成 viseme 事件的內容。 |
SpeechSynthesisWordBoundaryEventArgs |
定義語音合成文字界限事件的內容。 |
SpeechSynthesizer |
定義語音轉換文字的 SpeechSynthesizer 類別。 1.16.0 版已更新 |
SpeechTranslationConfig |
語音翻譯組態。 |
SynthesisResult |
合成結果的基類 |
SynthesisVoicesResult |
定義語音合成的結果。 |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
定義語音辨識已取消結果事件的承載。 |
TranslationRecognitionEventArgs |
翻譯文字結果事件引數。 |
TranslationRecognitionResult |
翻譯文字結果。 |
TranslationRecognizer |
翻譯辨識器 |
TranslationSynthesisEventArgs |
翻譯合成事件引數 |
TranslationSynthesisResult |
定義翻譯合成結果,也就是目的語言中翻譯文字的語音輸出。 |
Translations |
表示參數及其值的集合。 |
TurnStatusReceivedEventArgs |
定義已接收訊息/事件的內容。 |
User | |
VoiceInfo |
在 1.20.0 版中新增的語音合成語音相關資訊。 |
VoiceProfile |
定義說話者辨識的語音設定檔類別 |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
針對語音設定檔作業的使用者定義 VoiceProfileClient 類別 (,例如 createProfile、deleteProfile) |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
輸出格式 |
VoiceProfilePhraseResult |
輸出格式 |
VoiceProfileResult |
輸出格式 |
介面
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
代表交談中的參與者。 已在 1.4.0 版中新增 |
IPlayer |
表示用來控制音訊播放的音訊播放程式介面,例如暫停、繼續等等。 |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
列舉
AudioFormatTag | |
CancellationErrorCode |
定義當 CancellationReason 為 Error 時的錯誤碼。 已在 1.1.0 版中新增。 |
CancellationReason |
定義可能取消辨識結果的可能原因。 |
LanguageIdMode |
語言識別模式 |
LogLevel | |
NoMatchReason |
定義無法辨識辨識結果的可能原因。 |
OutputFormat |
定義語音辨識器輸出格式。 |
ParticipantChangedReason | |
ProfanityOption |
粗話選項。 已在 1.7.0 版中新增。 |
PronunciationAssessmentGradingSystem |
定義發音分數校正的點系統;預設值為 FivePoint。 已在 1.15.0 版中新增 |
PronunciationAssessmentGranularity |
定義發音評估資料細微性;預設值為 Phoneme。 已在 1.15.0 版中新增 |
PropertyId |
定義語音屬性識別碼。 |
ResultReason |
定義可能產生辨識結果的可能原因。 |
ServicePropertyChannel |
定義用來將屬性設定傳遞至服務的通道。 已在 1.7.0 版中新增。 |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
定義語音合成界限事件的界限類型。 |
SpeechSynthesisOutputFormat |
定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新 |
VoiceProfileType |
輸出格式 |