microsoft-cognitiveservices-speech-sdk package
類別
ActivityReceivedEventArgs |
定義已接收訊息/事件的內容。 |
AudioConfig |
表示用於指定要使用之輸入類型的音訊輸入組態(麥克風、檔案、數據流)。 |
AudioInputStream |
表示用於自定義音訊輸入組態的音訊輸入數據流。 |
AudioOutputStream |
表示用於自定義音訊輸出組態的音訊輸出數據流。 |
AudioStreamFormat |
表示用於自定義音訊輸入組態的音訊數據流格式。 |
AutoDetectSourceLanguageConfig |
語言自動偵測組態。 |
AutoDetectSourceLanguageResult |
輸出格式 |
AvatarConfig |
定義交談虛擬人偶組態。 |
AvatarEventArgs |
定義交談虛擬人偶事件的內容。 |
AvatarSynthesizer |
定義虛擬人偶合成器。 |
AvatarVideoFormat |
定義虛擬人偶輸出影片格式。 |
AvatarWebRTCConnectionResult |
定義虛擬人偶 WebRTC 連線結果。 |
BaseAudioPlayer |
基底音訊播放程式類別 TODO:目前僅播放 PCM。 |
BotFrameworkConfig |
類別,定義使用 Bot Framework 後端之對話服務連接器物件的組態。 |
CancellationDetails |
包含為何取消結果的詳細資訊。 |
CancellationDetailsBase |
包含為何取消結果的詳細資訊。 |
Connection |
Connection 是一種 Proxy 類別,用於管理與指定辨識器之語音服務的連線。 根據預設,辨識器會視需要自主管理服務的連線。 Connection 類別會提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱連線狀態變更。 使用 Connection 是選擇性的,主要是針對需要根據連線狀態微調應用程式行為的情況。 用戶可以選擇性地呼叫 Open() 來手動設定連線,然後再開始辨識與此聯機相關聯的辨識器。 如果辨識器需要連線或中斷連線至服務,則會獨立設定或關閉連線。 在此情況下,連線將會透過連線/中斷連線事件變更來通知連線狀態。 已在1.2.1版中新增。 |
ConnectionEventArgs |
定義連線事件的承載,例如連線/中斷連線。 已在1.2.0版中新增 |
ConnectionMessage |
ConnectionMessage 代表從語音服務傳送和接收的實作特定訊息。 這些訊息僅供偵錯之用,不應用於 Azure 認知服務語音服務的生產使用案例。 從語音服務傳送和接收的訊息可能會變更,而不通知。 這包括訊息內容、標頭、承載、排序等。已在1.11.0版中新增。 |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。 |
ConversationParticipantsChangedEventArgs |
定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。 |
ConversationTranscriber |
使用麥克風、檔案或其他音訊輸入數據流的說話者分離來執行語音辨識,並因此取得轉譯的文字。 |
ConversationTranscriptionCanceledEventArgs |
定義 RecognitionErrorEvent 的內容。 |
ConversationTranscriptionEventArgs |
定義交談轉譯/轉譯事件的內容。 |
ConversationTranscriptionResult |
定義交談轉譯的結果。 |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
定義會話事件的承載,例如偵測到語音開始/結束 |
ConversationTranslationResult |
翻譯文字結果。 |
ConversationTranslator |
加入、離開或連線至交談。 |
Coordinate |
定義 2D 空間中的座標。 |
CustomCommandsConfig |
類別,定義使用 CustomCommands 後端之對話框服務連接器物件的組態。 |
Diagnostics |
定義診斷 API,以管理 1.21.0 版中新增的控制台輸出 |
DialogServiceConfig |
定義對話服務連接器基底組態的類別 |
DialogServiceConnector |
對話框服務連接器 |
IntentRecognitionCanceledEventArgs |
定義意圖辨識已取消結果事件的承載。 |
IntentRecognitionEventArgs |
意圖辨識結果事件自變數。 |
IntentRecognitionResult |
意圖辨識結果。 |
IntentRecognizer |
意圖辨識器。 |
KeywordRecognitionModel |
表示當使用者指出要起始進一步語音辨識的關鍵詞時辨識的關鍵詞辨識模型。 |
LanguageUnderstandingModel |
語言理解模型 |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
定義 MeetingTranscriptionCanceledEvent 的內容。 |
MeetingTranscriptionEventArgs |
定義會議轉譯/轉譯事件的內容。 |
NoMatchDetails |
包含 NoMatch 辨識結果的詳細資訊。 |
Participant |
代表交談中的參與者。 已在1.4.0版中新增 |
PhraseListGrammar |
允許新增片語以改善語音辨識。 新增至辨識器的片語會在下一次辨識開始時生效,或下次SpeechSDK必須重新連線至語音服務時生效。 |
PronunciationAssessmentConfig |
發音評定設定。 |
PronunciationAssessmentResult |
發音評估結果。 |
PropertyCollection |
表示屬性及其值的集合。 |
PullAudioInputStream |
表示用於自定義音訊輸入組態的音訊輸入數據流。 |
PullAudioInputStreamCallback |
抽象基類,定義自定義音訊輸入數據流的回呼方法(read() 和 close())。 |
PullAudioOutputStream |
表示用於自定義音訊輸出組態的記憶體支援推播音訊輸出數據流。 |
PushAudioInputStream |
表示用於自定義音訊輸入組態的記憶體支援的推播音訊輸入數據流。 |
PushAudioOutputStream |
表示用於自定義音訊輸出組態的音訊輸出數據流。 |
PushAudioOutputStreamCallback |
抽象基類,定義自定義音訊輸出數據流的回呼方法(write() 和 close())。 |
RecognitionEventArgs |
定義會話事件的承載,例如偵測到語音開始/結束 |
RecognitionResult |
定義語音辨識的結果。 |
Recognizer |
定義基類辨識器,主要包含常見的事件處理程式。 |
ServiceEventArgs |
定義 1.9.0 版中新增之任何服務訊息事件的承載 |
SessionEventArgs |
定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。 |
SourceLanguageConfig |
來源語言設定。 |
SpeakerAudioDestination |
代表說話者播放音訊目的地,其只適用於瀏覽器。 注意:SDK 會嘗試使用媒體來源延伸模組 播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari 上有更好的支援,因此最好指定 mp3 格式播放。 |
SpeakerIdentificationModel |
定義說話者辨識模型的SpeakerIdentificationModel類別包含一組配置檔,用來識別說話者 |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
輸出格式 |
SpeakerRecognizer |
為語音配置檔作業的使用者定義說話者辨識句柄作業的 SpeakerRecognizer 類別(例如 createProfile、deleteProfile) |
SpeakerVerificationModel |
定義說話者辨識模型的 SpeakerVerificationModel 類別包含用來驗證說話者的配置檔 |
SpeechConfig |
語音設定。 |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
定義語音辨識事件的內容。 |
SpeechRecognitionResult |
定義語音辨識的結果。 |
SpeechRecognizer |
從麥克風、檔案或其他音訊輸入數據流執行語音辨識,並因此取得轉譯的文字。 |
SpeechSynthesisBookmarkEventArgs |
定義語音合成書籤事件的內容。 |
SpeechSynthesisEventArgs |
定義語音合成事件的內容。 |
SpeechSynthesisResult |
定義語音合成的結果。 |
SpeechSynthesisVisemeEventArgs |
定義語音合成viseme事件的內容。 |
SpeechSynthesisWordBoundaryEventArgs |
定義語音合成文字界限事件的內容。 |
SpeechSynthesizer |
定義語音轉換文字的SpeechSynthesizer類別。 在 1.16.0 版中更新 |
SpeechTranslationConfig |
語音翻譯組態。 |
SynthesisResult |
合成結果的基類 |
SynthesisVoicesResult |
定義語音合成的結果。 |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
定義語音辨識已取消結果事件的承載。 |
TranslationRecognitionEventArgs |
翻譯文字結果事件自變數。 |
TranslationRecognitionResult |
翻譯文字結果。 |
TranslationRecognizer |
翻譯辨識器 |
TranslationSynthesisEventArgs |
翻譯合成事件自變數 |
TranslationSynthesisResult |
定義翻譯合成結果,也就是目標語言中翻譯文字的語音輸出。 |
Translations |
表示參數及其值的集合。 |
TurnStatusReceivedEventArgs |
定義已接收訊息/事件的內容。 |
User | |
VoiceInfo |
1.20.0 版中新增語音合成語音的相關信息。 |
VoiceProfile |
定義說話者辨識的語音配置檔類別 |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
針對語音配置檔作業的使用者定義語音辨識句柄作業的 VoiceProfileClient 類別(例如 createProfile、deleteProfile) |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
輸出格式 |
VoiceProfilePhraseResult |
輸出格式 |
VoiceProfileResult |
輸出格式 |
介面
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
代表交談中的參與者。 已在1.4.0版中新增 |
IPlayer |
表示控制音訊播放的音訊播放介面,例如暫停、繼續等。 |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
列舉
AudioFormatTag | |
CancellationErrorCode |
定義當 CancellationReason 為 Error 時的錯誤碼。 已在1.1.0版中新增。 |
CancellationReason |
定義可能取消辨識結果的可能原因。 |
LanguageIdMode |
語言識別模式 |
LogLevel | |
NoMatchReason |
定義無法辨識辨識結果的可能原因。 |
OutputFormat |
定義語音辨識器輸出格式。 |
ParticipantChangedReason | |
ProfanityOption |
不雅內容選項。 已在1.7.0版中新增。 |
PronunciationAssessmentGradingSystem |
定義發音分數校正的點系統;預設值為 FivePoint。 已在1.15.0版中新增 |
PronunciationAssessmentGranularity |
定義發音評估粒度;預設值為 Phoneme。 已在1.15.0版中新增 |
PropertyId |
定義語音屬性識別碼。 |
ResultReason |
定義可能產生辨識結果的可能原因。 |
ServicePropertyChannel |
定義用來將屬性設定傳遞至服務的通道。 已在1.7.0版中新增。 |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
定義語音合成界限事件的界限類型。 |
SpeechSynthesisOutputFormat |
定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新 |
VoiceProfileType |
輸出格式 |