參考文件 | 套件 (NuGet) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 C# 的 語音 SDK。
文件中的程式碼範例是以 C# 8 撰寫,並在 .NET standard 2.0 上執行。
適用於 C# 的語音 SDK 與 Windows、Linux 和 macOS 相容。
適用於 C# 的語音 SDK 只支援 x64、ARM32 和 ARM64 架構上的下列散發套件:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統程式庫:
- GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。
libpthreads
- OpenSSL 程式庫 1.x 版 (
libssl1
) 或 3.x 版 (libssl3
),以及憑證 (ca-certificates
)。
- ALSA 應用程式的共用程式庫 (
libasound2
)。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget
執行以下命令:
sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget
安裝適用於 C# 的語音 SDK。
適用於 C# 的語音 SDK 可以 NuGet 套件的形式取得,並且實作 .NET Standard 2.0。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech。
您可以使用下列 dotnet add
命令,從 .NET CLI 安裝適用於 C# 的語音 SDK:
dotnet add package Microsoft.CognitiveServices.Speech
您可以使用下列 Install-Package
命令來安裝適用於 C# 的語音 SDK:
Install-Package Microsoft.CognitiveServices.Speech
您可以遵循這些指南以取得更多選項。
本指南說明如何安裝適用於 .NET Framework (Windows) 主控台應用程式的語音 SDK。
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
您需要安裝語音 SDK NuGet 套件,以便在程式碼中加以參考。 若要這麼做,您可能必須先建立 helloworld 專案。 如果您已經有 .NET 桌面開發工作負載的專案,您可以使用該專案,並跳至 使用 NuGet 套件管理員來安裝語音 SDK。
建立 helloworld 專案
開啟 Visual Studio。
在 [開始使用] 下,選取 [建立新專案]。
在 [建立新專案] 中,選擇 [主控台應用程式 (.NET Framework)],然後選取 [下一步]。
在 [設定您的新專案] 視窗中,在 [專案名稱] 中輸入 helloworld、在 [位置] 中選擇或建立目錄路徑,然後選取 [建立]。
從 Visual Studio 功能表列,選取 [工具] > [取得工具和功能]。 此步驟會開啟 Visual Studio 安裝程式,並顯示 [修改] 對話方塊。
請檢查 [.NET 桌面開發] 工作負載是否可用。 如果未安裝工作負載,請加以選取,然後選取 [修改] 以啟動安裝。 下載及安裝可能需要幾分鐘的時間。
如果 [.NET 桌面開發] 旁邊的核取方塊已經選取,請選取 [關閉] 來關閉對話方塊。
關閉 Visual Studio 安裝程式。
使用 NuGet 套件管理員來安裝語音 SDK
在 [方案總管] 中,以滑鼠右鍵按一下 helloworld 專案,然後選取 [管理 NuGet 套件] 以顯示 NuGet 套件管理員。
在右上角找到 [套件來源] 下拉式方塊,並確定已選取 [nuget.org]。
選取左上角的 [瀏覽]。
在搜尋方塊中,輸入 Microsoft.CognitiveServices.Speech ,然後選取 [輸入]。
從搜尋結果中,選取 [Microsoft.CognitiveServices.Speech] 套件,然後選取 [安裝] 以安裝最新的穩定版本。
接受所有合約和授權,即可開始安裝。
安裝套件之後,[套件管理員主控台] 視窗中會出現確認訊息。
選擇目標架構
若要建置及執行主控台應用程式,請建立符合電腦結構的平台設定。
從功能表中,選取 [組建]>Configuration Manager。 [組態管理員] 對話方塊隨即出現。
在 [使用中的解決方案平台] 下拉式方塊中,選取 [新增]。 [新增方案平台] 對話方塊隨即出現。
在 [輸入或選取新平台] 下拉式方塊中:
- 如果您執行 64 位元的 Windows,請選取 x64。
- 如果您執行 32 位元的 Windows,請選取 x86。
選取 [確定],然後選取 [關閉]。
本指南說明如何安裝適用於 .NET Core 主控台應用程式的語音 SDK。 .NET Core 是實作 .NET Standard 規格的開放原始碼跨平台 .NET 平台。
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
啟動 Visual Studio 2017。
請確認 .NET 跨平台開發 工作負載可用。 從 Visual Studio 功能表列選取 [工具]>[取得工具和功能],以開啟 Visual Studio 安裝程式。 如果已啟用此工作負載,請關閉對話方塊。
否則,請選取 [.NET Core 跨平台開發],然後選取 [修改]。 安裝新功能需要一些時間。
在 [新增專案] 對話方塊中,建立新的 Visual C# .NET Core 控制台應用程式。 從左窗格中,展開 已安裝的>Visual C#>.NET Core。 然後選取 [主控台應用程式 (.NET Core)]。 針對專案名稱,請輸入 helloworld。
安裝並參考 Speech SDK NuGet 封裝。 在 [方案總管] 中,以滑鼠右鍵按一下解決方案,然後選取 [管理解決方案的 NuGet 套件]。
選取 [瀏覽],然後在右上角選取 [套件來源],選取 [nuget.org]。
搜尋 Microsoft.CognitiveServices.Speech 套件,並將其安裝到 helloworld專案中。
接受顯示的授權,才會開始安裝 NuGet 套件。
安裝套件之後, 套件管理員 控制台中會出現確認訊息。
本指南說明如何安裝適用於 Unity 的語音 SDK。
對於 Unity 開發,語音 SDK 支援 Windows Desktop (x86 和 x64) 或通用 Windows 平台 (x86、x64、ARM/ARM64)、Android (x86、ARM32/64)、iOS (x64 模擬器和 ARM64),以及 Mac (x64)。
必要條件
本指南需要:
安裝適用於 Unity 的語音 SDK
若要安裝適用於 Unity 的語音 SDK,請遵循下列步驟:
下載並開啟適用於 Unity 語音 SDK。 SDK 會封裝為 Unity 資產套件 (.unitypackage),且應該已與 Unity 關聯。 當資產套件開啟時,[匯入 Unity 套件] 對話方塊隨即出現。 您可能需要建立並開啟空白的專案,才能讓此步驟正常執行。
確定所有檔案皆已選取,然後選取 [匯入]。 一會兒之後,Unity 資產套件就會匯入到您的專案中。
如需將資產套件匯入到 Unity 的詳細資訊,請參閱 Unity 文件。
本指南會說明如何建立通用 Windows 平台 (UWP) 專案並安裝適用於 C# 的語音 SDK。 通用 Windows 平台可讓您開發應用程式,以在任何支援 Windows 10 的裝置 (包括 PC、Xbox、Surface Hub 與其他裝置) 上執行。
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
若要建立適用於 UWP 開發的 Visual Studio 專案,您需要:
- 設定 Visual Studio 開發選項。
- 建立專案並選取目標架構。
- 設定音訊擷取。
- 安裝語音 SDK。
設定 Visual Studio 開發選項
若要開始,請確認您已在適用於 UWP 開發的 Visual Studio 中正確設定:
開啟 Visual Studio 以顯示開始視窗。
選取 [不使用程式碼繼續],以移至 Visual Studio IDE。
從 [Visual Studio] 功能表列中,選取 [工具]>[取得工具和功能] 以開啟 Visual Studio 安裝程式並檢視 [修改] 對話方塊。
在 [工作負載] 索引標籤上,尋找 [通用 Windows 平台開發] 工作負載。 如果已選取該工作負載,請關閉 [修改] 對話方塊,然後關閉 Visual Studio 安裝程式。 跳過此程序的其餘部分。
選取 [通用 Windows 平台開發] 核取方塊,然後選取 [修改]。
從 [在我們開始之前] 對話方塊中選取 [繼續],以安裝 UWP 開發工作負載。 安裝新功能可能需要一些時間。
關閉 Visual Studio 安裝程式。
建立專案
接下來,建立專案並選取目標結構:
在 [Visual Studio] 功能表列中,選取 [檔案]>[新增]>[專案] 以顯示 [建立新專案] 視窗。
尋找並選取 [空白應用程式 (通用 Windows)]。 請確認您選取的是此專案類型的 C# 版本 (而不是 Visual Basic)。
選取 [下一步]。
在 [設定新專案] 對話方塊的 [專案名稱] 中,輸入 helloworld。
在 [位置] 中,移至並選取或建立專案的儲存資料夾。
選取 建立。
在 [新增通用 Windows 平台專案] 視窗中,於 [最低版本] (第二個下拉式方塊),選取 [Windows 10 Fall Creators Update (10.0;組建 16299)]。 該需求是語音 SDK 的最低需求。
在 [目標版本] (第一個下拉式方塊) 中,選擇與 [最小版本] 中的值相同或之後的值。
選取 [確定]。 您會返回 Visual Studio IDE,新專案已建立,且在 [方案總管] 窗格中可見。
選取您的目標平台結構。 在 Visual Studio 工具列上,尋找 [方案平台] 下拉式方塊。 如果您沒有看到該方塊,請選取 [檢視] > [工具列] > [標準] 以顯示包含 [解決方案平台] 的工具列。
如果您執行的是 64 位元 Windows,請在下拉式方塊中選取 [x64]。 64 位元 Windows 也可執行 32 位元應用程式,因此您可以依需求選擇 [x86]。
注意
語音 SDK 支援所有 Intel 相容處理器,但是僅限 x64 版本的 ARM 處理器。
設定音訊擷取
允許專案擷取音訊輸入:
在 [方案總管]中,選取 [Package.appxmanifest],以開啟套件應用程式資訊清單。
選取 [功能] 索引標籤,然後選取 [麥克風] 功能。
從功能表列中,選取 [檔案] > [儲存 Package.appxmanifest] 來儲存變更。
安裝適用於 UWP 的語音 SDK
最後,安裝語音 SDK NuGet 套件 \(英文\),並在您的專案中參考語音 SDK:
在 [方案總管] 中,以滑鼠右鍵按一下解決方案,然後選取 [管理解決方案的 NuGet 套件] 以移至 [NuGet - 解決方案] 視窗。
選取瀏覽。 在 [套件來源] 中,選取 [nuget.org]。
在 [搜尋] 方塊中輸入 Microsoft.CognitiveServices.Speech。 然後當搜尋結果中出現該套件後,選擇該套件。
在搜尋結果旁的 [套件狀態] 窗格中,選取您的 helloworld 專案。
選取 [安裝]。
在 [預覽變更] 對話方塊中,選取 [套用]。
在 [接受授權] 對話方塊中,檢視授權,然後選取 [我接受]。 套件安裝隨即開始。
當安裝完成時,[輸出] 窗格會顯示類似下列文字的訊息:Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld
。
本指南說明如何建立 Xamarin 表單專案並安裝語音 SDK。 Xamarin 是一個開放原始碼平台,可使用 .NET 建立適用於 iOS、Android 和 Windows 的現代化且高效能應用程式。
針對 Xamarin 開發,語音 SDK 支援:
- Windows Desktop x86 和 x64
- 通用 Windows 平台 x86、x64、ARM/ARM64
- Android x86,ARM32/64
- iOS x64 模擬器和 ARM64
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
若要使用 .NET 和 Xamarin 建立適用於跨平台行動應用程式開發的 Visual Studio 專案,您需要:
- 設定 Visual Studio 開發選項。
- 建立專案並選取目標架構。
- 安裝語音 SDK。
設定 Visual Studio 開發選項
請確認您已在 Visual Studio 中正確設定,以使用 .NET 進行跨平台行動開發:
開啟 Visual Studio 2019。 然後選取 [不使用程式碼繼續]。
從 Visual Studio 功能表中,選取 [工具]>[取得工具和功能],以開啟 Visual Studio 安裝程式,然後檢視 [修改] 對話方塊。
在 [工作負載] 索引標籤上,尋找 [使用 .NET 進行行動開發] 工作負載。 如果已選取該工作負載,請關閉 [修改] 對話方塊,然後關閉 Visual Studio 安裝程式。 跳過此程序的其餘部分。
選取 [使用 .NET 進行行動開發] 核取方塊,然後選取 [修改]。
從 [在我們開始之前] 對話方塊中選取 [繼續],以安裝使用 .NET 進行行動開發的工作負載。 安裝新功能可能需要一些時間。
關閉 Visual Studio 安裝程式。
建立專案
接下來,建立專案並選取目標結構:
在 [Visual Studio] 功能表列中,選取 [檔案]>[新增]>[專案] 以顯示 [建立新專案] 視窗。
尋找並選取 [行動應用程式 (Xamarin.Forms)]。
選取 [下一步]。
在 [設定新專案] 對話方塊的 [專案名稱] 中,輸入 helloworld。
在 [位置] 中,移至並選取或建立專案的儲存資料夾。
選取 建立。
在 [新增跨平台應用程式] 視窗中,選取 [空白] 範本,然後選取 Android、 iOS,以及 Windows (UWP)。 選取 建立。
選取 [確定]。 您會返回 Visual Studio IDE,新專案已建立,且在 [方案總管] 窗格中可見。
請選取目標平台結構與啟始專案。 在 Visual Studio 工具列上,尋找 [方案平台] 下拉式方塊。 如果您沒有看到該方塊,請選取 [檢視] > [工具列] > [標準] 以顯示包含 [解決方案平台] 的工具列。
如果您執行的是 64 位元 Windows,請在下拉式方塊中選取 [x64]。 您可以視需要選取 [x86],因為 64 位元Windows 也可以執行 32 位元應用程式。
在 [啟動專案] 下拉式方塊中,選取 [helloworld.UWP (通用 Windows)]。
安裝適用於 Xamarin 的語音 SDK
安裝語音 SDK NuGet 套件 \(英文\),並在您的專案中參考語音 SDK:
在 [方案總管] 中,以滑鼠右鍵按一下您的方案。 選取 [管理方案的 NuGet 套件],以移至 [NuGet - 解決方案] 視窗。
選取瀏覽。
在 [套件來源] 中,選取 [nuget.org]。
在 [搜尋] 方塊中輸入 Microsoft.CognitiveServices.Speech。 然後當搜尋結果中出現該套件後,將其選取。
注意
Microsoft.CognitiveServices.Speech NuGet 內的 iOS 程式庫未啟用 Bitcode。 若您的應用程式需要已啟用 Bitcode 的程式庫,請特別為 iOS 專案使用 Microsoft.CognitiveServices.Speech.Xamarin.iOS NuGet。
在搜尋結果旁的 [套件狀態] 窗格中,選取所有專案。
選取 [安裝]。
在 [預覽變更] 對話方塊中,選取 [確定]。
在 [接受授權] 對話方塊中,檢視授權,然後選取 [我接受]。 在所有專案中安裝語音 SDK 套件參考。
安裝成功完成之後,您可能會看到 helloworld.iOS 的下列警告。 此警告是已知問題,應該不會影響您應用程式的功能。
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
現在已安裝語音 SDK。 您現在可以刪除或重複使用您在先前步驟中建立的 helloworld 專案。
參考文件 | 套件 (NuGet) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 C++ 的 語音 SDK。
適用於 C++ 的語音 SDK 與 Windows、Linux 和 macOS 相容。
適用於 C++ 的語音 SDK 只支援 x64、ARM32 和 ARM64 架構上的下列散發套件:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統程式庫:
- GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。
libpthreads
- OpenSSL 程式庫 1.x 版 (
libssl1
) 或 3.x 版 (libssl3
),以及憑證 (ca-certificates
)。
- ALSA 應用程式的共用程式庫 (
libasound2
)。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget
執行以下命令:
sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget
安裝適用於 C++ 的語音 SDK
可以 NuGet 套件的形式取得適用於 C++ 的語音 SDK。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech。
您可以使用下列 dotnet add
命令,從 .NET CLI 安裝適用於 C++ 的語音 SDK:
dotnet add package Microsoft.CognitiveServices.Speech
您可以使用下列 Install-Package
命令來安裝適用於 C++ 的語音 SDK:
Install-Package Microsoft.CognitiveServices.Speech
您可以遵循這些指南以取得更多選項。
本指南說明如何安裝適用於 Linux 的語音 SDK。
使用下列程序下載並安裝 SDK。 這些步驟包括以 .zip 檔案形式 下載必要的連結庫和標頭檔。
選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT
環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。
若要在主目錄中使用目錄 speechsdk,請執行下列命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
如果目錄不存在,請建立目錄:
mkdir -p "$SPEECHSDK_ROOT"
下載並解壓縮包含語音 SDK 二進位檔的 .tar.gz 封存:
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
驗證已壓縮套件之最上層目錄的內容:
ls -l "$SPEECHSDK_ROOT"
目錄清單應包含合作夥伴通知和授權檔案。 此清單也應該包含其中保存標頭 (.h) 檔的 include 目錄,以及其中保存 arm32、arm64、x64 和 x86 程式庫的 lib 目錄。
路徑 |
描述 |
license.md |
授權 |
ThirdPartyNotices.md |
合作夥伴通知 |
REDIST.txt |
轉散發注意事項 |
include |
C++ 的必要標頭檔 |
lib/arm32 |
要連結您應用程式所需的 ARM32 原生程式庫 |
lib/arm64 |
要連結您應用程式所需的 ARM64 原生程式庫 |
lib/x64 |
要連結您的應用程式所需的 x64 原生程式庫 |
lib/x86 |
要連結您的應用程式所需的 x86 原生程式庫 |
本指南說明如何在 macOS 10.14 和更新版本上安裝適用於 C++ 的語音 SDK。 這些步驟包括以 .zip 檔案形式下載 必要的程式庫和標頭檔。
選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT
環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。
若要在主目錄中使用目錄 speechsdk,請執行下列命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
如果目錄不存在,請建立目錄:
mkdir -p "$SPEECHSDK_ROOT"
下載並擷取包含語音 SDK XCFramework 的 .zip 封存:
wget -O SpeechSDK-macOS.zip https://aka.ms/csspeech/macosbinary
unzip SpeechSDK-macOS.zip -d "$SPEECHSDK_ROOT"
驗證已壓縮套件之最上層目錄的內容:
ls -l "$SPEECHSDK_ROOT"
目錄清單應包含合作夥伴通知、授權檔案和 MicrosoftCognitiveServicesSpeech.xcframework 目錄。
本指南說明如何在 Windows 桌面作業系統上安裝適用於 C++ 的語音 SDK。
此設定指南需要:
在 Visual Studio 中建立專案並安裝語音 SDK
若要建立適用於 C++ 桌面開發的 Visual Studio 專案,您需要:
- 設定 Visual Studio 開發選項。
- 建立專案。
- 選取目標結構。
- 安裝語音 SDK。
設定 Visual Studio 開發選項
若要開始,請確定您在 Visual Studio 中已正確地設定,以進行 C++桌面開發:
開啟 Visual Studio 2019 以顯示 [開始] 視窗。
選取 [不使用程式碼繼續],以移至 Visual Studio IDE。
從 [Visual Studio] 功能表列中,選取 [工具]>[取得工具和功能] 以開啟 Visual Studio 安裝程式並檢視 [修改] 對話方塊。
在 [Windows] 底下的 [工作負載] 索引標籤,尋找 [使用 C++ 的桌面開發] 工作負載。 如果尚未選取該工作負載,請加以選取。
在 [個別元件] 索引標籤中,尋找 [NuGet 套件管理員]。 如果尚未選取,請選取它。
選取 [關閉] 或 [修改]。 按鈕名稱會根據您是否選取了任何安裝功能而有所不同。
如果您選取 [修改],則會開始安裝。 此程序可能需要一些時間。
關閉 Visual Studio 安裝程式。
建立專案
接下來,建立專案並選取目標結構:
從 Visual Studio 功能表中,選取 [檔案]>[新增>專案] ,以顯示 [建立新專案] 視窗。
尋找並選取 [容器應用程式]。 請確定您選取的是此專案類型的 C++ 版本 (而不是 C# 或 Visual Basic)。
選取 [下一步]。
在 [設定新專案] 對話方塊的 [專案名稱] 中,輸入 helloworld。
在 [位置] 中,前往並選取或建立儲存專案的資料夾,然後選取 [建立]。
選取您的目標平台結構。 在 Visual Studio 工具列上,尋找 [方案平台] 下拉式方塊。 如果您沒有看到該方塊,請選取 [檢視] > [工具列] > [標準] 以顯示包含 [解決方案平台] 的工具列。
如果您正在執行 64 位元 Windows,請在下拉式方塊中選取 [x64]。 64 位元 Windows 也可執行 32 位元應用程式,因此您可以依需求選擇 [x86]。
使用 Visual Studio Code 安裝語音 SDK
最後,安裝語音 SDK NuGet 套件,並在您的專案中參考語音 SDK:
在 [方案總管] 中,以滑鼠右鍵按一下解決方案,然後選取 [管理解決方案的 NuGet 套件] 以移至 [NuGet - 解決方案] 視窗。
選取瀏覽。
在 [套件來源] 中,選取 [nuget.org]。
在 [搜尋] 方塊中輸入 Microsoft.CognitiveServices.Speech。 然後當搜尋結果中出現該套件後,選擇該套件。
在搜尋結果旁的 [套件狀態] 窗格中,選取您的 helloworld 專案。
選取 [安裝]。
在 [預覽變更] 對話方塊中,選取 [確定]。
在 [接受授權] 對話方塊中,檢視授權,然後選取 [我接受]。 套件安裝隨即開始。 當安裝完成時,[輸出] 窗格會顯示類似下列文字的訊息:Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld
。
參考文件 | 套件 (Go) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Go 的 語音 SDK。
適用於 Go 的語音 SDK 支援 x64 架構上的下列散發套件:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
重要
使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統程式庫:
- GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。
libpthreads
- OpenSSL 程式庫 1.x 版 (
libssl1
) 或 3.x 版 (libssl3
),以及憑證 (ca-certificates
)。
- ALSA 應用程式的共用程式庫 (
libasound2
)。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget
執行以下命令:
sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget
安裝 Go 二進位版本 1.13 或更新版本。
安裝適用於 Go 的語音 SDK
使用下列程序下載並安裝 SDK。 這些步驟包括以 .zip 檔案形式 下載必要的連結庫和標頭檔。
選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT
環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。
若要在主目錄中使用目錄 speechsdk,請執行下列命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
如果目錄不存在,請建立目錄:
mkdir -p "$SPEECHSDK_ROOT"
下載並解壓縮包含語音 SDK 二進位檔的 .tar.gz 封存:
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
驗證已壓縮套件之最上層目錄的內容:
ls -l "$SPEECHSDK_ROOT"
目錄清單應包含合作夥伴通知和授權檔案。 此清單也應該包含其中保存標頭 (.h) 檔的 include 目錄,以及其中保存 arm32、arm64、x64 和 x86 程式庫的 lib 目錄。
路徑 |
描述 |
license.md |
授權 |
ThirdPartyNotices.md |
合作夥伴通知 |
REDIST.txt |
轉散發注意事項 |
include |
C++ 的必要標頭檔 |
lib/arm32 |
要連結您應用程式所需的 ARM32 原生程式庫 |
lib/arm64 |
要連結您應用程式所需的 ARM64 原生程式庫 |
lib/x64 |
要連結您的應用程式所需的 x64 原生程式庫 |
lib/x86 |
要連結您的應用程式所需的 x86 原生程式庫 |
下列步驟可讓 Go 環境尋找語音 SDK。
由於繫結仰賴 cgo
,因此您必須設定環境變數,讓 Go 可以找到 SDK。
export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
重要
將 <architecture>
取代為您的 CPU 的處理器架構:x64
、arm32
或 arm64
。
若要執行應用程式和 SDK,您必須告訴作業系統要在哪裡尋找程式庫。
export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
重要
將 <architecture>
取代為您的 CPU 的處理器架構:x64
、arm32
或 arm64
。
參考文件 | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Java 的 語音 SDK。
選擇您的目標環境:
適用於 Java 的語音 SDK 與 Windows、Linux 和 macOS 相容。
適用於 Java 的語音 SDK 支援 x64、ARM32 和 ARM64 架構上的下列散發套件:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統程式庫:
- GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。
libpthreads
- OpenSSL 程式庫 1.x 版 (
libssl1
) 或 3.x 版 (libssl3
),以及憑證 (ca-certificates
)。
- ALSA 應用程式的共用程式庫 (
libasound2
)。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget
執行以下命令:
sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget
語音 SDK 與具有 32/64 位 ARM 處理器和 Intel x86/x64 相容處理器的 Android 裝置相容。
安裝 Java 開發套件,例如 Azul Zulu OpenJDK。 Microsoft Build of OpenJDK 或您慣用的 JDK 也應該可以運作。
安裝適用於 Java 的語音 SDK
某些指示會使用特定的 SDK 版本,例如 1.24.2
。 若要檢查最新版本,請搜尋我們的 GitHub 存放庫。
選擇您的目標環境:
本指南說明如何在 Java 執行階段上安裝適用於 Java 的語音 SDK。
受支援的作業系統
適用於 Java 語音 SDK 套件適用於下列作業系統:
請遵循下列步驟,使用 Apache Maven 安裝適用於 Java 的語音 SDK:
安裝 Apache Maven。
開啟您想要新專案的命令提示字元,並建立新的 pom.xml 檔案。
將下列 XML 內容複製到 pom.xml:
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
<artifactId>quickstart-eclipse</artifactId>
<version>1.0.0-SNAPSHOT</version>
<build>
<sourceDirectory>src</sourceDirectory>
<plugins>
<plugin>
<artifactId>maven-compiler-plugin</artifactId>
<version>3.7.0</version>
<configuration>
<source>1.8</source>
<target>1.8</target>
</configuration>
</plugin>
</plugins>
</build>
<dependencies>
<dependency>
<groupId>com.microsoft.cognitiveservices.speech</groupId>
<artifactId>client-sdk</artifactId>
<version>1.42.0</version>
</dependency>
</dependencies>
</project>
執行下列 Maven 命令來安裝語音 SDK 和相依性。
mvn clean dependency:copy-dependencies
建立 Eclipse 專案並安裝語音 SDK
安裝 Eclipse Java IDE。 此 IDE 需要已安裝 Java。
啟動 Eclipse。
在 Eclipse Launcher 中,於 [工作區] 方塊中輸入新工作區目錄的名稱。 然後選取 [啟動]。
不久之後,Eclipse IDE 的主要視窗隨即出現。 如果出現 [歡迎使用] 畫面,請加以關閉。
從 Eclipse 功能表中,選取 [檔案]>[新增>專案]。
[新增專案] 對話方塊隨即出現。 選取 [Java 專案],然後選取 [下一步]。
[新增 Java 專案] 精靈隨即啟動。 在 [專案名稱] 欄位中,輸入 [快速入門]。 選擇 [JavaSE-1.8] 做為執行環境。 選取 [完成]。
如果出現 [是否要開啟相關的透視圖?] 視窗,請選取 [開啟透視圖]。
在 [套件總管] 中,以滑鼠右鍵按一下 [快速入門] 專案。 從捷徑功能表選取 [設定]>[轉換為 Maven 專案]。
[建立新的 POM] 視窗隨即出現。 在 [群組識別碼] 欄位中,輸入 com.microsoft.cognitiveservices.speech.samples。 在 [成品識別碼] 欄位中,輸入 [快速入門]。 然後選取 [完成]。
開啟 pom.xml 檔案並加以編輯:
- 在檔案末端的結尾標記
</project>
之前新增 dependencies
元素,並使用語音 SDK 作為相依性:
<dependencies>
<dependency>
<groupId>com.microsoft.cognitiveservices.speech</groupId>
<artifactId>client-sdk</artifactId>
<version>1.42.0</version>
</dependency>
</dependencies>
- 儲存變更。
Gradle 設定
Gradle 組態需要明確參考 .jar 相依性延伸模組:
// build.gradle
dependencies {
implementation group: 'com.microsoft.cognitiveservices.speech', name: 'client-sdk', version: "1.42.0", ext: "jar"
}
本指南說明如何在 Android 上安裝適用於 Java 的語音 SDK。
適用於 Android 的語音 SDK 會封裝成 Android 封存 AAR 檔案,其中包含必要的程式庫及所需的 Android 權限。
使用 Android Studio 安裝語音 SDK
在 Android Studio 中建立新專案,並將適用於 Java 的語音 SDK 新增為程式庫相依性。 安裝是以語音 SDK Maven 套件和 Android Studio Chipmunk 2021.2.1 為基礎。
建立空的專案
開啟 Android Studio,然後選取 [新增專案]。
在出現的 [新增專案] 視窗中,選取 [手機和平板電腦]>[空白活動],然後選取 [下一步]。
在 [名稱] 文字方塊中輸入 SpeechQuickstart。
在 [套件名稱] 文字方塊中輸入 samples.speech.cognitiveservices.microsoft.com。
在 [儲存位置] 選取方塊中選取專案目錄。
在 [語言] 選取方塊中選取 [Java]。
在 [最低 API 層級] 選取方塊中,選取 [API 23:Android 6.0 (Marshmallow)]。
選取 [完成]。
Android Studio 需要一些時間來準備您的新專案。 第一次使用 Android Studio 時,可能需要幾分鐘的時間才能設定喜好設定、接受授權,以及完成精靈。
安裝適用於 Android 上的 Java 的語音 SDK
將語音 SDK 新增為專案中的相依性。
選取 [檔案] > [專案結構] > [相依性] > [應用程式]。
選取加號 (+),在 [宣告的相依性] 底下新增相依性。 然後從下拉功能表中選取 [程式庫相依性]。
在出現的 [ 新增連結庫相依性 ] 視窗中,輸入適用於Java的語音 SDK 名稱和版本: com.microsoft.cognitiveservices.speech:client-sdk:1.42.0。 然後選取 [搜尋]。
請確定選取的群組識別碼為 com.microsoft.cognitiveservices.speech,然後選取 [確定]。
選取 [確定] 以關閉 [專案結構] 視窗,並將您的變更套用至專案。
參考文件 | 套件 (npm) | GitHub 上的其他範例 | 程式庫原始程式碼
在本快速入門中,您會安裝適用於 JavaScript 的 語音 SDK。
適用於 JavaScript 的語音 SDK 可做為 npm 套件使用。 請參閱 microsoft-cognitiveservices-speech-sdk 及其隨附的 GitHub 存放庫 cognitive-services-speech-sdk-js。
瞭解 Node.js與 用戶端網頁瀏覽器之間的架構影響。 例如,伺服器端應用程式無法使用 文件物件模型 (DOM)。 用戶端應用程式無法使用 Node.js 檔案系統。
安裝適用於 JavaScript 的語音 SDK
根據目標環境而定,使用下列其中一個指南:
本指南說明如何安裝適用於 JavaScript 的語音 SDK,以與 Node.js 搭配使用。
安裝 Node.js。
建立新目錄、執行 npm init
,然後逐步完成其提示。
若要安裝適用於 JavaScript 的語音 SDK,請執行下列 npm install
命令:
npm install microsoft-cognitiveservices-speech-sdk
如需詳細資訊,請參閱 Node.js 樣本。
本指南說明如何安裝適用於 JavaScript 的語音 SDK,以與網頁搭配使用。
解壓縮至資料夾
建立新的空白資料夾。 如果您想要在 Web 伺服器上裝載樣本,請確定 Web 伺服器可以存取該資料夾。
下載 .zip 套件形式的語音 SDK,並將它解壓縮到新建立的資料夾。 這些檔案已解壓縮:
- microsoft.cognitiveservices.speech.sdk.bundle.js:人類可讀取的語音 SDK 版本。
- microsoft.cognitiveservices.speech.sdk.bundle.js.map:用來偵錯 SDK 程式碼的對應檔。
- microsoft.cognitiveservices.speech.sdk.bundle.d.ts:搭配 TypeScript 使用的物件定義。
- microsoft.cognitiveservices.speech.sdk.bundle-min.js:語音 SDK 的簡化版本。
- speech-processor.js:可在某些瀏覽器上改善效能的程式碼。
在資料夾中建立名為 index.html 的新檔案,並使用文字編輯器開啟此檔案。
HTML 指令碼標籤
從適用於 JavaScript 的語音 SDK 下載並擷取 microsoft.cognitiveservices.speech.sdk.bundle.js 檔案。 將其放在 HTML 檔案可以存取的資料夾。
<script src="microsoft.cognitiveservices.speech.sdk.bundle.js"></script>;
提示
如果您是以網頁瀏覽器為目標,並使用 <script>
標籤,則不需要 sdk
前置詞。 sdk
前置詞是用來命名 require
模組的別名。
或者,您可以直接在 HTML <head>
元素中包含 <script>
標籤,依賴 JSDelivr。
<script src="https://cdn.jsdelivr.net/npm/microsoft-cognitiveservices-speech-sdk@latest/distrib/browser/microsoft.cognitiveservices.speech.sdk.bundle-min.js">
</script>
如需詳細資訊,請參閱瀏覽器型樣本。
使用語音 SDK
如需 import
的詳細資訊,請參閱在 JavaScript 網站上匯出和匯入。
或者,您可以使用需要陳述式:
const sdk = require("microsoft-cognitiveservices-speech-sdk");
參考文件 | 套件 (下載) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Objective-C 的 語音 SDK。
安裝適用於 Objective-C 的語音 SDK
適用於 Objective-C 的語音 SDK 原生為 Mac x64 和 ARM 系統的 CocoaPod 套件。
Mac 的系統需求:
macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。
前往 .xcodeproj 專案檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile的 Pod 檔案。
將 Podfile 的內容取代為以下內容。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平台或 Pod 版本。
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
end
執行 pod install
來安裝語音 SDK。
或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac。
適用於 Objective-C 語音 SDK 會原生地以 CocoaPod 套件的形式來提供。
iOS 的系統需求:
- macOS 10.14 版或更新版本
- Target iOS 9.3 或更新版本
macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。
前往 .xcodeproj 專案檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile的 Pod 檔案。
將 Podfile 的內容取代為以下內容。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平台或 Pod 版本。
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.42.0'
end
執行 pod install
來安裝語音 SDK。
或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.iOS 應用程式架構來組建原生 iOS 應用程式。 如需詳細資訊,請參閱 Xamarin.iOS。
參考文件 | 套件 (下載) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Swift 的 語音 SDK。
安裝適用於 Swift 的語音 SDK
適用於 Swift 的語音 SDK 原生為 Mac x64 和 ARM 系統的 CocoaPod 套件。
Mac 的系統需求:
macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。
前往 .xcodeproj 專案檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile的 Pod 檔案。
將 Podfile 的內容取代為以下內容。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平台或 Pod 版本。
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
end
執行 pod install
來安裝語音 SDK。
或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac。
適用於 Swift 語音 SDK 會原生地以 CocoaPod 套件的形式來提供。
iOS 的系統需求:
- macOS 10.14 版或更新版本
- Target iOS 9.3 或更新版本
macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。
前往 .xcodeproj 專案檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile的 Pod 檔案。
將 Podfile 的內容取代為以下內容。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平台或 Pod 版本。
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.42.0'
end
執行 pod install
來安裝語音 SDK。
或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.iOS 應用程式架構來組建原生 iOS 應用程式。 如需詳細資訊,請參閱 Xamarin.iOS。
參考文件 | 套件 (PyPi) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Python 的 語音 SDK。
適用於 Python 的語音 SDK 與 Windows、Linux 和 macOS 相容。
適用於 Python 的語音 SDK 支援 x64 和 ARM64 架構上的下列散發套件:
- Ubuntu 20.04/22.04/24.04
- Debian 11/12
- Amazon Linux 2023
- Azure Linux 3.0
重要
使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統程式庫:
- GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。
libpthreads
- OpenSSL 程式庫 1.x 版 (
libssl1
) 或 3.x 版 (libssl3
),以及憑證 (ca-certificates
)。
- ALSA 應用程式的共用程式庫 (
libasound2
)。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget
執行以下命令:
sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget
執行以下命令:
sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget
安裝 Python 從 3.8 或更新的版本。
若要檢查您的安裝,請開啟終端機,然後執行命令 python --version
。 如果 Python 已正確安裝,您會收到類似 Python 3.8.10
的回應。
如果您使用 macOS 或 Linux,則可能需要改為執行 命令 python3 --version
。
若要使用 python
而非 python3
,請執行 alias python='python3'
以設定別名。 語音 SDK 快速入門範例會指定 python
使用方式。
安裝適用於 Python 的語音 SDK
在安裝適用於 Python 的語音 SDK 之前,請務必滿足平台需求。
從 PyPI 安裝
若要安裝適用於 Python 的語音 SDK,請在主控台視窗中執行此命令:
pip install azure-cognitiveservices-speech
升級至最新的語音 SDK
若要升級至最新的語音 SDK,請在主控台視窗中執行此命令:
pip install --upgrade azure-cognitiveservices-speech
您可以檢查 azure.cognitiveservices.speech.__version__
變數來確認目前所安裝的適用於 Python 語音 SDK 版本。 例如,在主控台視窗中執行此命令:
pip list
使用 Visual Studio Code 安裝語音 SDK
安裝適用於 Python 的語音 SDK:
下載並安裝 Visual Studio Code。
執行 Visual Studio Code,然後安裝 Python 延伸模組:
- 選取 [檔案] > [喜好設定] > [延伸模組]。
- 搜尋 Python、尋找適用於 Visual Studio Code 的 python 延伸模組 (由 Microsoft 發行),然後選取 [安裝]。
選取 [終端機]>[新增終端機],以在 Visual Studio Code 內開啟終端機。
在終端提示字元中,執行以下命令以安裝適用於 Python 的語音 SDK 套件。
python -m pip install azure-cognitiveservices-speech
如需 Visual Studio Code 和 Python 的詳細資訊,請參閱 在 VS Code 中開始使用 Python 中的 Visual Studio Code。
使用語音 SDK
新增下列匯入陳述式,以在 Python 專案中使用語音 SDK:
import azure.cognitiveservices.speech as speechsdk
相關內容