共用方式為


microsoft-cognitiveservices-speech-sdk package

類別

ActivityReceivedEventArgs

定義已接收訊息/事件的內容。

AudioConfig

表示用於指定要使用之輸入類型的音訊輸入組態(麥克風、檔案、數據流)。

AudioInputStream

表示用於自定義音訊輸入組態的音訊輸入數據流。

AudioOutputStream

表示用於自定義音訊輸出組態的音訊輸出數據流。

AudioStreamFormat

表示用於自定義音訊輸入組態的音訊數據流格式。

AutoDetectSourceLanguageConfig

語言自動偵測組態。

AutoDetectSourceLanguageResult

輸出格式

AvatarConfig

定義交談虛擬人偶組態。

AvatarEventArgs

定義交談虛擬人偶事件的內容。

AvatarSynthesizer

定義虛擬人偶合成器。

AvatarVideoFormat

定義虛擬人偶輸出影片格式。

AvatarWebRTCConnectionResult

定義虛擬人偶 WebRTC 連線結果。

BaseAudioPlayer

基底音訊播放程式類別 TODO:目前僅播放 PCM。

BotFrameworkConfig

類別,定義使用 Bot Framework 後端之對話服務連接器物件的組態。

CancellationDetails

包含為何取消結果的詳細資訊。

CancellationDetailsBase

包含為何取消結果的詳細資訊。

Connection

Connection 是一種 Proxy 類別,用於管理與指定辨識器之語音服務的連線。 根據預設,辨識器會視需要自主管理服務的連線。 Connection 類別會提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱連線狀態變更。 使用 Connection 是選擇性的,主要是針對需要根據連線狀態微調應用程式行為的情況。 用戶可以選擇性地呼叫 Open() 來手動設定連線,然後再開始辨識與此聯機相關聯的辨識器。 如果辨識器需要連線或中斷連線至服務,則會獨立設定或關閉連線。 在此情況下,連線將會透過連線/中斷連線事件變更來通知連線狀態。 已在1.2.1版中新增。

ConnectionEventArgs

定義連線事件的承載,例如連線/中斷連線。 已在1.2.0版中新增

ConnectionMessage

ConnectionMessage 代表從語音服務傳送和接收的實作特定訊息。 這些訊息僅供偵錯之用,不應用於 Azure 認知服務語音服務的生產使用案例。 從語音服務傳送和接收的訊息可能會變更,而不通知。 這包括訊息內容、標頭、承載、排序等。已在1.11.0版中新增。

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

ConversationParticipantsChangedEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

ConversationTranscriber

使用麥克風、檔案或其他音訊輸入數據流的說話者分離來執行語音辨識,並因此取得轉譯的文字。

ConversationTranscriptionCanceledEventArgs

定義 RecognitionErrorEvent 的內容。

ConversationTranscriptionEventArgs

定義交談轉譯/轉譯事件的內容。

ConversationTranscriptionResult

定義交談轉譯的結果。

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

定義會話事件的承載,例如偵測到語音開始/結束

ConversationTranslationResult

翻譯文字結果。

ConversationTranslator

加入、離開或連線至交談。

Coordinate

定義 2D 空間中的座標。

CustomCommandsConfig

類別,定義使用 CustomCommands 後端之對話框服務連接器物件的組態。

Diagnostics

定義診斷 API,以管理 1.21.0 版中新增的控制台輸出

DialogServiceConfig

定義對話服務連接器基底組態的類別

DialogServiceConnector

對話框服務連接器

IntentRecognitionCanceledEventArgs

定義意圖辨識已取消結果事件的承載。

IntentRecognitionEventArgs

意圖辨識結果事件自變數。

IntentRecognitionResult

意圖辨識結果。

IntentRecognizer

意圖辨識器。

KeywordRecognitionModel

表示當使用者指出要起始進一步語音辨識的關鍵詞時辨識的關鍵詞辨識模型。

LanguageUnderstandingModel

語言理解模型

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

定義 MeetingTranscriptionCanceledEvent 的內容。

MeetingTranscriptionEventArgs

定義會議轉譯/轉譯事件的內容。

NoMatchDetails

包含 NoMatch 辨識結果的詳細資訊。

Participant

代表交談中的參與者。 已在1.4.0版中新增

PhraseListGrammar

允許新增片語以改善語音辨識。

新增至辨識器的片語會在下一次辨識開始時生效,或下次SpeechSDK必須重新連線至語音服務時生效。

PronunciationAssessmentConfig

發音評定設定。

PronunciationAssessmentResult

發音評估結果。

PropertyCollection

表示屬性及其值的集合。

PullAudioInputStream

表示用於自定義音訊輸入組態的音訊輸入數據流。

PullAudioInputStreamCallback

抽象基類,定義自定義音訊輸入數據流的回呼方法(read() 和 close())。

PullAudioOutputStream

表示用於自定義音訊輸出組態的記憶體支援推播音訊輸出數據流。

PushAudioInputStream

表示用於自定義音訊輸入組態的記憶體支援的推播音訊輸入數據流。

PushAudioOutputStream

表示用於自定義音訊輸出組態的音訊輸出數據流。

PushAudioOutputStreamCallback

抽象基類,定義自定義音訊輸出數據流的回呼方法(write() 和 close())。

RecognitionEventArgs

定義會話事件的承載,例如偵測到語音開始/結束

RecognitionResult

定義語音辨識的結果。

Recognizer

定義基類辨識器,主要包含常見的事件處理程式。

ServiceEventArgs

定義 1.9.0 版中新增之任何服務訊息事件的承載

SessionEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

SourceLanguageConfig

來源語言設定。

SpeakerAudioDestination

代表說話者播放音訊目的地,其只適用於瀏覽器。 注意:SDK 會嘗試使用媒體來源延伸模組 播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari 上有更好的支援,因此最好指定 mp3 格式播放。

SpeakerIdentificationModel

定義說話者辨識模型的SpeakerIdentificationModel類別包含一組配置檔,用來識別說話者

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

輸出格式

SpeakerRecognizer

為語音配置檔作業的使用者定義說話者辨識句柄作業的 SpeakerRecognizer 類別(例如 createProfile、deleteProfile)

SpeakerVerificationModel

定義說話者辨識模型的 SpeakerVerificationModel 類別包含用來驗證說話者的配置檔

SpeechConfig

語音設定。

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

定義語音辨識事件的內容。

SpeechRecognitionResult

定義語音辨識的結果。

SpeechRecognizer

從麥克風、檔案或其他音訊輸入數據流執行語音辨識,並因此取得轉譯的文字。

SpeechSynthesisBookmarkEventArgs

定義語音合成書籤事件的內容。

SpeechSynthesisEventArgs

定義語音合成事件的內容。

SpeechSynthesisResult

定義語音合成的結果。

SpeechSynthesisVisemeEventArgs

定義語音合成viseme事件的內容。

SpeechSynthesisWordBoundaryEventArgs

定義語音合成文字界限事件的內容。

SpeechSynthesizer

定義語音轉換文字的SpeechSynthesizer類別。 在 1.16.0 版中更新

SpeechTranslationConfig

語音翻譯組態。

SynthesisResult

合成結果的基類

SynthesisVoicesResult

定義語音合成的結果。

Synthesizer
TranslationRecognitionCanceledEventArgs

定義語音辨識已取消結果事件的承載。

TranslationRecognitionEventArgs

翻譯文字結果事件自變數。

TranslationRecognitionResult

翻譯文字結果。

TranslationRecognizer

翻譯辨識器

TranslationSynthesisEventArgs

翻譯合成事件自變數

TranslationSynthesisResult

定義翻譯合成結果,也就是目標語言中翻譯文字的語音輸出。

Translations

表示參數及其值的集合。

TurnStatusReceivedEventArgs

定義已接收訊息/事件的內容。

User
VoiceInfo

1.20.0 版中新增語音合成語音的相關信息。

VoiceProfile

定義說話者辨識的語音配置檔類別

VoiceProfileCancellationDetails
VoiceProfileClient

針對語音配置檔作業的使用者定義語音辨識句柄作業的 VoiceProfileClient 類別(例如 createProfile、deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

輸出格式

VoiceProfilePhraseResult

輸出格式

VoiceProfileResult

輸出格式

介面

CancellationEventArgs
ConversationInfo
IParticipant

代表交談中的參與者。 已在1.4.0版中新增

IPlayer

表示控制音訊播放的音訊播放介面,例如暫停、繼續等。

IVoiceJson
MeetingInfo
VoiceSignature

列舉

AudioFormatTag
CancellationErrorCode

定義當 CancellationReason 為 Error 時的錯誤碼。 已在1.1.0版中新增。

CancellationReason

定義可能取消辨識結果的可能原因。

LanguageIdMode

語言識別模式

LogLevel
NoMatchReason

定義無法辨識辨識結果的可能原因。

OutputFormat

定義語音辨識器輸出格式。

ParticipantChangedReason
ProfanityOption

不雅內容選項。 已在1.7.0版中新增。

PronunciationAssessmentGradingSystem

定義發音分數校正的點系統;預設值為 FivePoint。 已在1.15.0版中新增

PronunciationAssessmentGranularity

定義發音評估粒度;預設值為 Phoneme。 已在1.15.0版中新增

PropertyId

定義語音屬性識別碼。

ResultReason

定義可能產生辨識結果的可能原因。

ServicePropertyChannel

定義用來將屬性設定傳遞至服務的通道。 已在1.7.0版中新增。

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

定義語音合成界限事件的界限類型。

SpeechSynthesisOutputFormat

定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新

VoiceProfileType

輸出格式