microsoft-cognitiveservices-speech-sdk package

參考

類別

ActivityReceivedEventArgs	定義已接收訊息/事件的內容。
AudioConfig	表示用於指定要使用之輸入類型的音訊輸入組態（麥克風、檔案、數據流）。
AudioInputStream	表示用於自定義音訊輸入組態的音訊輸入數據流。
AudioOutputStream	表示用於自定義音訊輸出組態的音訊輸出數據流。
AudioStreamFormat	表示用於自定義音訊輸入組態的音訊數據流格式。
AutoDetectSourceLanguageConfig	語言自動偵測組態。
AutoDetectSourceLanguageResult	輸出格式
AvatarConfig	定義交談虛擬人偶組態。
AvatarEventArgs	定義交談虛擬人偶事件的內容。
AvatarSynthesizer	定義虛擬人偶合成器。
AvatarVideoFormat	定義虛擬人偶輸出影片格式。
AvatarWebRTCConnectionResult	定義虛擬人偶 WebRTC 連線結果。
BaseAudioPlayer	基底音訊播放程式類別 TODO：目前僅播放 PCM。
BotFrameworkConfig	類別，定義使用 Bot Framework 後端之對話服務連接器物件的組態。
CancellationDetails	包含為何取消結果的詳細資訊。
CancellationDetailsBase	包含為何取消結果的詳細資訊。
Connection	Connection 是一種 Proxy 類別，用於管理與指定辨識器之語音服務的連線。根據預設，辨識器會視需要自主管理服務的連線。 Connection 類別會提供其他方法，讓使用者明確開啟或關閉連線，以及訂閱連線狀態變更。使用 Connection 是選擇性的，主要是針對需要根據連線狀態微調應用程式行為的情況。用戶可以選擇性地呼叫 Open（）來手動設定連線，然後再開始辨識與此聯機相關聯的辨識器。如果辨識器需要連線或中斷連線至服務，則會獨立設定或關閉連線。在此情況下，連線將會透過連線/中斷連線事件變更來通知連線狀態。已在1.2.1版中新增。
ConnectionEventArgs	定義連線事件的承載，例如連線/中斷連線。已在1.2.0版中新增
ConnectionMessage	ConnectionMessage 代表從語音服務傳送和接收的實作特定訊息。這些訊息僅供偵錯之用，不應用於 Azure 認知服務語音服務的生產使用案例。從語音服務傳送和接收的訊息可能會變更，而不通知。這包括訊息內容、標頭、承載、排序等。已在1.11.0版中新增。
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	定義會話事件的內容，例如 SessionStarted/Stopped、SoundStarted/Stopped。
ConversationParticipantsChangedEventArgs	定義會話事件的內容，例如 SessionStarted/Stopped、SoundStarted/Stopped。
ConversationTranscriber	使用麥克風、檔案或其他音訊輸入數據流的說話者分離來執行語音辨識，並因此取得轉譯的文字。
ConversationTranscriptionCanceledEventArgs	定義 RecognitionErrorEvent 的內容。
ConversationTranscriptionEventArgs	定義交談轉譯/轉譯事件的內容。
ConversationTranscriptionResult	定義交談轉譯的結果。
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	定義會話事件的承載，例如偵測到語音開始/結束
ConversationTranslationResult	翻譯文字結果。
ConversationTranslator	加入、離開或連線至交談。
Coordinate	定義 2D 空間中的座標。
CustomCommandsConfig	類別，定義使用 CustomCommands 後端之對話框服務連接器物件的組態。
Diagnostics	定義診斷 API，以管理 1.21.0 版中新增的控制台輸出
DialogServiceConfig	定義對話服務連接器基底組態的類別
DialogServiceConnector	對話框服務連接器
IntentRecognitionCanceledEventArgs	定義意圖辨識已取消結果事件的承載。
IntentRecognitionEventArgs	意圖辨識結果事件自變數。
IntentRecognitionResult	意圖辨識結果。
IntentRecognizer	意圖辨識器。
KeywordRecognitionModel	表示當使用者指出要起始進一步語音辨識的關鍵詞時辨識的關鍵詞辨識模型。
LanguageUnderstandingModel	語言理解模型
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	定義 MeetingTranscriptionCanceledEvent 的內容。
MeetingTranscriptionEventArgs	定義會議轉譯/轉譯事件的內容。
NoMatchDetails	包含 NoMatch 辨識結果的詳細資訊。
Participant	代表交談中的參與者。已在1.4.0版中新增
PhraseListGrammar	允許新增片語以改善語音辨識。新增至辨識器的片語會在下一次辨識開始時生效，或下次SpeechSDK必須重新連線至語音服務時生效。
PronunciationAssessmentConfig	發音評定設定。
PronunciationAssessmentResult	發音評估結果。
PropertyCollection	表示屬性及其值的集合。
PullAudioInputStream	表示用於自定義音訊輸入組態的音訊輸入數據流。
PullAudioInputStreamCallback	抽象基類，定義自定義音訊輸入數據流的回呼方法（read（）和 close（））。
PullAudioOutputStream	表示用於自定義音訊輸出組態的記憶體支援推播音訊輸出數據流。
PushAudioInputStream	表示用於自定義音訊輸入組態的記憶體支援的推播音訊輸入數據流。
PushAudioOutputStream	表示用於自定義音訊輸出組態的音訊輸出數據流。
PushAudioOutputStreamCallback	抽象基類，定義自定義音訊輸出數據流的回呼方法（write（）和 close（））。
RecognitionEventArgs	定義會話事件的承載，例如偵測到語音開始/結束
RecognitionResult	定義語音辨識的結果。
Recognizer	定義基類辨識器，主要包含常見的事件處理程式。
ServiceEventArgs	定義 1.9.0 版中新增之任何服務訊息事件的承載
SessionEventArgs	定義會話事件的內容，例如 SessionStarted/Stopped、SoundStarted/Stopped。
SourceLanguageConfig	來源語言設定。
SpeakerAudioDestination	代表說話者播放音訊目的地，其只適用於瀏覽器。注意：SDK 會嘗試使用媒體來源延伸模組播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari 上有更好的支援，因此最好指定 mp3 格式播放。
SpeakerIdentificationModel	定義說話者辨識模型的SpeakerIdentificationModel類別包含一組配置檔，用來識別說話者
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	輸出格式
SpeakerRecognizer	為語音配置檔作業的使用者定義說話者辨識句柄作業的 SpeakerRecognizer 類別（例如 createProfile、deleteProfile）
SpeakerVerificationModel	定義說話者辨識模型的 SpeakerVerificationModel 類別包含用來驗證說話者的配置檔
SpeechConfig	語音設定。
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	定義語音辨識事件的內容。
SpeechRecognitionResult	定義語音辨識的結果。
SpeechRecognizer	從麥克風、檔案或其他音訊輸入數據流執行語音辨識，並因此取得轉譯的文字。
SpeechSynthesisBookmarkEventArgs	定義語音合成書籤事件的內容。
SpeechSynthesisEventArgs	定義語音合成事件的內容。
SpeechSynthesisResult	定義語音合成的結果。
SpeechSynthesisVisemeEventArgs	定義語音合成viseme事件的內容。
SpeechSynthesisWordBoundaryEventArgs	定義語音合成文字界限事件的內容。
SpeechSynthesizer	定義語音轉換文字的SpeechSynthesizer類別。在 1.16.0 版中更新
SpeechTranslationConfig	語音翻譯組態。
SynthesisResult	合成結果的基類
SynthesisVoicesResult	定義語音合成的結果。
Synthesizer
TranslationRecognitionCanceledEventArgs	定義語音辨識已取消結果事件的承載。
TranslationRecognitionEventArgs	翻譯文字結果事件自變數。
TranslationRecognitionResult	翻譯文字結果。
TranslationRecognizer	翻譯辨識器
TranslationSynthesisEventArgs	翻譯合成事件自變數
TranslationSynthesisResult	定義翻譯合成結果，也就是目標語言中翻譯文字的語音輸出。
Translations	表示參數及其值的集合。
TurnStatusReceivedEventArgs	定義已接收訊息/事件的內容。
User
VoiceInfo	1.20.0 版中新增語音合成語音的相關信息。
VoiceProfile	定義說話者辨識的語音配置檔類別
VoiceProfileCancellationDetails
VoiceProfileClient	針對語音配置檔作業的使用者定義語音辨識句柄作業的 VoiceProfileClient 類別（例如 createProfile、deleteProfile）
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	輸出格式
VoiceProfilePhraseResult	輸出格式
VoiceProfileResult	輸出格式

介面

CancellationEventArgs
ConversationInfo
IParticipant	代表交談中的參與者。已在1.4.0版中新增
IPlayer	表示控制音訊播放的音訊播放介面，例如暫停、繼續等。
IVoiceJson
MeetingInfo
VoiceSignature

列舉

AudioFormatTag
CancellationErrorCode	定義當 CancellationReason 為 Error 時的錯誤碼。已在1.1.0版中新增。
CancellationReason	定義可能取消辨識結果的可能原因。
LanguageIdMode	語言識別模式
LogLevel
NoMatchReason	定義無法辨識辨識結果的可能原因。
OutputFormat	定義語音辨識器輸出格式。
ParticipantChangedReason
ProfanityOption	不雅內容選項。已在1.7.0版中新增。
PronunciationAssessmentGradingSystem	定義發音分數校正的點系統;預設值為 FivePoint。已在1.15.0版中新增
PronunciationAssessmentGranularity	定義發音評估粒度;預設值為 Phoneme。已在1.15.0版中新增
PropertyId	定義語音屬性識別碼。
ResultReason	定義可能產生辨識結果的可能原因。
ServicePropertyChannel	定義用來將屬性設定傳遞至服務的通道。已在1.7.0版中新增。
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	定義語音合成界限事件的界限類型。
SpeechSynthesisOutputFormat	定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新
VoiceProfileType	輸出格式

共用方式為

microsoft-cognitiveservices-speech-sdk package

類別

介面

列舉

其他資源