Zestaw SPEECH SDK dla języka C# obsługuje tylko następujące dystrybucje w architekturach x64, ARM32 i ARM64:
Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0
Ważne
Użyj najnowszej wersji LTS dystrybucji systemu Linux. Jeśli na przykład używasz systemu Ubuntu 20.04 LTS, użyj najnowszej wersji systemu Ubuntu 20.04.X.
Zestaw SPEECH SDK zależy od następujących bibliotek systemowych systemu Linux:
Biblioteki udostępnione biblioteki GNU C, w tym biblioteki programowania wątków POSIX, libpthreads.
Biblioteka OpenSSL, wersja 1.x (libssl1) lub 3.x (libssl3) i certyfikaty (ca-certificates).
Biblioteka udostępniona dla aplikacji ALSA (libasound2).
Wymagany jest system macOS w wersji 10.14 lub nowszej.
Instalowanie zestawu SPEECH SDK dla języka C#
Zestaw SPEECH SDK dla języka C# jest dostępny jako pakiet NuGet i implementuje platformę .NET Standard 2.0. Aby uzyskać więcej informacji, zobacz Microsoft.CognitiveServices.Speech.
Zestaw SPEECH SDK dla języka C# można zainstalować z poziomu interfejsu wiersza polecenia platformy .NET przy użyciu następującego dotnet add polecenia:
Tworzenie projektu programu Visual Studio i instalowanie zestawu Speech SDK
Musisz zainstalować pakiet NuGet zestawu SDK usługi Mowa, aby można było odwoływać się do niego w kodzie. W tym celu może być konieczne utworzenie projektu helloworld . Jeśli masz już projekt z dostępnym obciążeniem tworzenia aplikacji klasycznych platformy .NET, możesz użyć tego projektu i przejść do tematu Używanie Menedżer pakietów NuGet w celu zainstalowania zestawu SPEECH SDK.
Tworzenie projektu helloworld
Otwórz program Visual Studio.
W obszarze Wprowadzenie wybierz pozycję Utwórz nowy projekt.
W obszarze Utwórz nowy projekt wybierz pozycję Aplikacja konsolowa (.NET Framework), a następnie wybierz przycisk Dalej.
W obszarze Konfigurowanie nowego projektu w polu Nazwa projektu wprowadź ciąg helloworld, wybierz lub utwórz ścieżkę katalogu w polu Lokalizacja, a następnie wybierz pozycję Utwórz.
Na pasku menu programu Visual Studio wybierz pozycję Narzędzia Pobierz narzędzia>i funkcje. Ten krok otwiera Instalator programu Visual Studio i wyświetla okno dialogowe Modyfikowanie.
Sprawdź, czy obciążenie programowanie aplikacji klasycznych platformy .NET jest dostępne. Jeśli obciążenie nie jest zainstalowane, wybierz je, a następnie wybierz pozycję Modyfikuj , aby rozpocząć instalację. Pobranie i zainstalowanie może potrwać kilka minut.
Jeśli programowanie aplikacji klasycznych platformy .NET jest już zaznaczone, wybierz pozycję Zamknij , aby zamknąć okno dialogowe.
Zamknij Instalator programu Visual Studio.
Instalowanie zestawu Speech SDK przy użyciu Menedżer pakietów NuGet
W Eksplorator rozwiązań kliknij prawym przyciskiem myszy projekt helloworld, a następnie wybierz polecenie Zarządzaj pakietami NuGet, aby wyświetlić Menedżer pakietów NuGet.
W prawym górnym rogu znajdź pole rozwijane Źródło pakietu i upewnij się, że nuget.org jest zaznaczona.
W lewym górnym rogu wybierz pozycję Przeglądaj.
W polu wyszukiwania wpisz Microsoft.CognitiveServices.Speech i wybierz Enter.
W wynikach wyszukiwania wybierz pakiet Microsoft.CognitiveServices.Speech , a następnie wybierz pozycję Zainstaluj , aby zainstalować najnowszą stabilną wersję.
Zaakceptuj wszystkie umowy i licencje, aby rozpocząć instalację.
Po zainstalowaniu pakietu w oknie konsoli Menedżer pakietów zostanie wyświetlone potwierdzenie.
Wybieranie architektury docelowej
Aby skompilować i uruchomić aplikację konsolową, utwórz konfigurację platformy zgodną z architekturą komputera.
Z menu wybierz pozycję Build Configuration Manager (Kompiluj>program Configuration Manager). Zostanie wyświetlone okno dialogowe Configuration Manager.
W polu listy rozwijanej Aktywna platforma rozwiązania wybierz pozycję Nowy. Zostanie wyświetlone okno dialogowe Nowa platforma rozwiązania.
W polu listy rozwijanej Typ lub wybierz nową platformę :
Jeśli korzystasz z 64-bitowego systemu Windows, wybierz pozycję x64.
Jeśli korzystasz z 32-bitowego systemu Windows, wybierz pozycję x86.
Wybierz przycisk OK , a następnie zamknij.
W tym przewodniku pokazano, jak zainstalować zestaw SPEECH SDK dla aplikacji konsolowej platformy .NET Core. .NET Core jest międzyplatformową platformą .NET typu open source, która wdraża specyfikację .NET Standard.
Tworzenie projektu programu Visual Studio i instalowanie zestawu Speech SDK
Uruchom program Visual Studio 2017.
Upewnij się, że jest dostępne obciążenie programistyczne dla wielu platform .NET. Wybierz pozycję Narzędzia>Pobierz narzędzia i funkcje na pasku menu programu Visual Studio, aby otworzyć Instalator programu Visual Studio. Jeśli ten pakiet roboczy jest już włączony, zamknij okno dialogowe.
W przeciwnym razie wybierz pozycję Programowanie międzyplatformowe platformy .NET Core i wybierz pozycję Modyfikuj. Instalowanie nowej funkcji chwilę potrwa.
Utwórz nową aplikację konsolową .NET Core w języku Visual C# w oknie dialogowym Nowy projekt . W okienku po lewej stronie rozwiń węzeł Zainstalowane visual>C#>.NET Core. Następnie wybierz pozycję Aplikacja konsolowa (.NET Core). Jako nazwę projektu podaj helloworld.
Instalowanie zestawu Speech SDK pakietu NuGet i odwoływanie się do niego. W Eksploratorze rozwiązań kliknij rozwiązanie prawym przyciskiem myszy, a następnie wybierz pozycję Zarządzaj pakietami NuGet dla rozwiązania.
Wybierz pozycję Przeglądaj, a następnie w prawym górnym rogu w polu Źródło pakietu wybierz pozycję nuget.org.
Wyszukaj pakiet Microsoft.CognitiveServices.Speech i zainstaluj go w projekcie helloworld.
Zaakceptuj wyświetloną licencję, aby rozpocząć instalowanie pakietu NuGet.
Po zainstalowaniu pakietu w konsoli Menedżer pakietów zostanie wyświetlone potwierdzenie.
W tym przewodniku pokazano, jak zainstalować zestaw Speech SDK dla aparatu Unity.
W przypadku programowania za pomocą aparatu Unity zestaw SPEECH SDK obsługuje program Windows Desktop (x86 i x64) lub platforma uniwersalna systemu Windows (x86, x64, ARM/ARM64), Android (x86, ARM32/64), iOS (symulator x64 i ARM64) i Mac (x64).
W systemie Android urządzenie z systemem Android oparte na usłudze ARM (interfejs API 23: Android 6.0 Marshmallow lub nowszy) jest włączone do programowania przy użyciu działającego mikrofonu.
W systemie iOS urządzenie z systemem iOS (ARM64) włączone do programowania przy użyciu działającego mikrofonu.
W systemie macOS urządzenie Mac (x64) i najnowsza wersja LTS aparatu Unity 2019 lub nowszego w celu zapewnienia zintegrowanej obsługi dostępu do mikrofonu w ustawieniach aparatu Unity Player.
Instalowanie zestawu SPEECH SDK dla aparatu Unity
Aby zainstalować zestaw SPEECH SDK dla aparatu Unity, wykonaj następujące kroki:
Pobierz i otwórz zestaw SPEECH SDK dla aparatu Unity. Zestaw SDK jest spakowany jako pakiet zasobów aparatu Unity (unitypackage) i powinien być już skojarzony z aparatem Unity. Po otwarciu pakietu zasobów zostanie wyświetlone okno dialogowe Importowanie pakietu aparatu Unity. Aby ten krok działał, może być konieczne utworzenie i otwarcie pustego projektu.
Upewnij się, że wybrano wszystkie pliki, a następnie wybierz pozycję Importuj. Po kilku chwilach pakiet zasobów aparatu Unity zostanie zaimportowany do projektu.
Aby uzyskać więcej informacji na temat importowania pakietów zasobów do aparatu Unity, zobacz dokumentację aparatu Unity.
W tym przewodniku pokazano, jak utworzyć projekt platformy platforma uniwersalna systemu Windows (UWP) i zainstalować zestaw Speech SDK dla języka C#. Platforma uniwersalna systemu Windows pozwala tworzyć aplikacje, które działają na dowolnym urządzeniu z systemem Windows 10, m.in. na komputerach PC, konsolach Xbox, urządzeniach Surface Hub itp.
Tworzenie projektu programu Visual Studio i instalowanie zestawu Speech SDK
Aby utworzyć projekt programu Visual Studio na potrzeby tworzenia aplikacji platformy UWP, należy wykonać następujące kroki:
Konfigurowanie opcji programowania programu Visual Studio.
Utwórz projekt i wybierz architekturę docelową.
Konfigurowanie przechwytywania dźwięku.
Zainstaluj zestaw SPEECH SDK.
Konfigurowanie opcji programowania w programie Visual Studio
Upewnij się, że konfiguracja jest poprawna w programie Visual Studio na potrzeby tworzenia aplikacji platformy UWP:
Otwórz program Visual Studio, aby wyświetlić okno uruchamiania.
Wybierz pozycję Kontynuuj bez kodu , aby przejść do środowiska IDE programu Visual Studio.
Na pasku menu programu Visual Studio wybierz pozycję Narzędzia Pobierz narzędzia>i funkcje, aby otworzyć Instalator programu Visual Studio i wyświetlić okno dialogowe Modyfikowanie.
Na karcie Obciążenia znajdź obciążenie deweloperskie platforma uniwersalna systemu Windows. Jeśli to obciążenie jest już zaznaczone, zamknij okno dialogowe Modyfikowanie i zamknij Instalator programu Visual Studio. Pomiń pozostałą część tej procedury.
Wybierz pozycję platforma uniwersalna systemu Windows programowanie, a następnie wybierz pozycję Modyfikuj.
W oknie dialogowym Przed rozpoczęciem wybierz pozycję Kontynuuj , aby zainstalować obciążenie programistyczne platformy UWP. Instalacja nowej funkcji może trochę potrwać.
Zamknij Instalator programu Visual Studio.
Tworzenie projektu
Następnie utwórz projekt i wybierz architekturę docelową:
Na pasku menu programu Visual Studio wybierz pozycję Plik>nowy>projekt, aby wyświetlić okno Tworzenie nowego projektu.
Znajdź i wybierz pozycję Pusta aplikacja (uniwersalny system Windows).. Upewnij się, że wybrano wersję języka C# tego typu projektu, w przeciwieństwie do języka Visual Basic.
Wybierz Dalej.
W oknie dialogowym Konfigurowanie nowego projektu w polu Nazwa projektu wprowadź helloworld.
W obszarze Lokalizacja przejdź do i wybierz lub utwórz folder, w którym chcesz zapisać projekt.
Wybierz pozycję Utwórz.
W oknie Nowy projekt platforma uniwersalna systemu Windows w polu Minimalna wersja (druga lista rozwijana) wybierz pozycję Windows 10 Fall Creators Update (10.0; Kompilacja 16299). To wymaganie jest minimalnym wymaganiem dla zestawu SDK usługi Mowa.
W polu Wersja docelowa (pierwsza lista rozwijana) wybierz wartość identyczną z lub nowszą niż wartość w polu Minimalna wersja.
Wybierz przycisk OK. Wróć do środowiska IDE programu Visual Studio z nowym projektem utworzonym i widocznym w okienku Eksplorator rozwiązań.
Wybierz architekturę platformy docelowej. Na pasku narzędzi programu Visual Studio znajdź pole listy rozwijanej Platformy rozwiązań. Jeśli go nie widzisz, wybierz pozycję Wyświetl>paski narzędzi w warstwie Standardowa, aby wyświetlić pasek narzędzi zawierający platformy> rozwiązań.
Jeśli korzystasz z 64-bitowego systemu Windows, wybierz pozycję x64 w polu listy rozwijanej. 64-bitowy system Windows może również uruchamiać aplikacje 32-bitowe, więc wolisz wybrać x86 .
Uwaga
Zestaw SPEECH SDK obsługuje wszystkie procesory zgodne z technologią Intel, ale tylko wersje x64 procesorów ARM.
Konfigurowanie przechwytywania dźwięku
Zezwalaj projektowi na przechwytywanie danych wejściowych audio:
W Eksplorator rozwiązań wybierz pozycję Package.appxmanifest, aby otworzyć manifest aplikacji pakietu.
Wybierz kartę Możliwości, a następnie wybierz pozycję Możliwości mikrofonu.
Na pasku menu wybierz pozycję Plik>Zapisz pakiet.appxmanifest, aby zapisać zmiany.
Instalowanie zestawu SPEECH SDK dla platformy UWP
Na koniec zainstaluj pakiet NuGet zestawu SPEECH SDK i odwołaj się do zestawu SDK usługi Mowa w projekcie:
W Eksplorator rozwiązań kliknij rozwiązanie prawym przyciskiem myszy i wybierz pozycję Zarządzaj pakietami NuGet dla rozwiązania, aby przejść do okna NuGet — Rozwiązanie.
Wybierz przycisk Przeglądaj. W obszarze Źródło pakietu wybierz pozycję nuget.org.
W polu Wyszukiwania wprowadź wartość Microsoft.CognitiveServices.Speech. Wybierz ten pakiet po pojawieniu się go w wynikach wyszukiwania.
W okienku stanu pakietu obok wyników wyszukiwania wybierz projekt helloworld .
Wybierz Zainstaluj.
W oknie dialogowym Podgląd zmian wybierz pozycję Zastosuj.
W oknie dialogowym Akceptacja licencji wyświetl licencję, a następnie wybierz pozycję Akceptuję. Rozpoczyna się instalacja pakietu.
Po zakończeniu instalacji w okienku Dane wyjściowe zostanie wyświetlony komunikat podobny do następującego tekstu: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
W tym przewodniku pokazano, jak utworzyć projekt formularzy platformy Xamarin i zainstalować zestaw SPEECH SDK. Xamarin to platforma typu open source do tworzenia nowoczesnych i wydajnych aplikacji dla systemów iOS, Android i Windows przy użyciu platformy .NET.
W przypadku programowania na platformie Xamarin zestaw Speech SDK obsługuje następujące funkcje:
Windows Desktop x86 i x64
platforma uniwersalna systemu Windows x86, x64, ARM/ARM64
Tworzenie projektu programu Visual Studio i instalowanie zestawu Speech SDK
Aby utworzyć projekt programu Visual Studio na potrzeby tworzenia aplikacji mobilnych dla wielu platform za pomocą platformy .NET i platformy Xamarin, musisz:
Konfigurowanie opcji programowania programu Visual Studio.
Utwórz projekt i wybierz architekturę docelową.
Zainstaluj zestaw SPEECH SDK.
Konfigurowanie opcji programowania w programie Visual Studio
Upewnij się, że program Visual Studio został poprawnie skonfigurowany na potrzeby tworzenia aplikacji mobilnych dla wielu platform za pomocą platformy .NET:
Otwórz program Visual Studio 2019. Następnie wybierz pozycję Kontynuuj bez kodu.
W menu programu Visual Studio wybierz pozycję Narzędzia Pobierz narzędzia>i funkcje, aby otworzyć Instalator programu Visual Studio i wyświetlić okno dialogowe Modyfikowanie.
Na karcie Obciążenia znajdź pakiet roboczy Programowanie aplikacji mobilnych przy użyciu platformy .NET. Jeśli to obciążenie jest już zaznaczone, zamknij okno dialogowe Modyfikowanie i zamknij Instalator programu Visual Studio. Pomiń pozostałą część tej procedury.
Wybierz pozycję Programowanie aplikacji mobilnych za pomocą platformy .NET, a następnie wybierz pozycję Modyfikuj.
W oknie dialogowym Przed rozpoczęciem wybierz pozycję Kontynuuj , aby zainstalować obciążenie na potrzeby programowania aplikacji mobilnych za pomocą platformy .NET. Instalacja nowej funkcji może trochę potrwać.
Zamknij Instalator programu Visual Studio.
Tworzenie projektu
Następnie utwórz projekt i wybierz architekturę docelową:
Na pasku menu programu Visual Studio wybierz pozycję Plik>nowy>projekt, aby wyświetlić okno Tworzenie nowego projektu.
Znajdź i wybierz pozycję Aplikacja mobilna (Xamarin.Forms).
Wybierz Dalej.
W oknie dialogowym Konfigurowanie nowego projektu w polu Nazwa projektu wprowadź helloworld.
W obszarze Lokalizacja przejdź do i wybierz lub utwórz folder, w którym chcesz zapisać projekt.
Wybierz pozycję Utwórz.
W oknie Nowa aplikacja międzyplatformowa wybierz szablon Pusty, a następnie wybierz pozycję Android, iOS i Windows (UWP). Wybierz pozycję Utwórz.
Wybierz przycisk OK. Wróć do środowiska IDE programu Visual Studio z nowym projektem utworzonym i widocznym w okienku Eksplorator rozwiązań.
Wybierz architekturę platformy docelowej i projekt startowy. Na pasku narzędzi programu Visual Studio znajdź pole listy rozwijanej Platformy rozwiązań. Jeśli go nie widzisz, wybierz pozycję Wyświetl>paski narzędzi w warstwie Standardowa, aby wyświetlić pasek narzędzi zawierający platformy> rozwiązań.
Jeśli korzystasz z 64-bitowego systemu Windows, wybierz pozycję x64 w polu listy rozwijanej. Możesz wybrać x86 , jeśli chcesz, ponieważ 64-bitowy system Windows może również uruchamiać aplikacje 32-bitowe.
W polu rozwijanym Start-up Projects (Projekty startowe) wybierz pozycję helloworld. Platforma UWP (uniwersalny system Windows).
Instalowanie zestawu SPEECH SDK dla platformy Xamarin
Zainstaluj pakiet NuGet zestawu SPEECH SDK i odwołaj się do zestawu SDK usługi Mowa w projekcie:
W Eksplorator rozwiązań kliknij rozwiązanie prawym przyciskiem myszy. Wybierz pozycję Zarządzaj pakietami NuGet dla rozwiązania , aby przejść do okna NuGet — rozwiązanie .
Wybierz przycisk Przeglądaj.
W obszarze Źródło pakietu wybierz pozycję nuget.org.
W polu Wyszukiwania wprowadź wartość Microsoft.CognitiveServices.Speech. Następnie wybierz ten pakiet po pojawieniu się go w wynikach wyszukiwania.
Uwaga
Biblioteka systemu iOS w pakiecie Microsoft.CognitiveServices.Speech NuGet nie ma włączonego kodu bitowego. Jeśli potrzebujesz biblioteki kodu bitowego włączonej dla aplikacji, użyj polecenia Microsoft.CognitiveServices.Speech.Xamarin.iOS NuGet dla projektu systemu iOS specjalnie.
W okienku stanu pakietu obok wyników wyszukiwania wybierz wszystkie projekty.
Wybierz Zainstaluj.
W oknie dialogowym Podgląd zmian wybierz przycisk OK.
W oknie dialogowym Akceptacja licencji wyświetl licencję, a następnie wybierz pozycję Akceptuję. Zainstaluj odwołanie do pakietu zestawu SPEECH SDK do wszystkich projektów.
Po pomyślnym zakończeniu instalacji może zostać wyświetlone następujące ostrzeżenie dotyczące aplikacji helloworld.iOS. To ostrzeżenie jest znanym problemem i nie powinno mieć wpływu na funkcjonalność aplikacji.
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
Zestaw SPEECH SDK jest teraz zainstalowany. Teraz możesz usunąć lub ponownie użyć projektu helloworld utworzonego w poprzednich krokach.
Zestaw Speech SDK dla języka C++ obsługuje tylko następujące dystrybucje w architekturach x64, ARM32 i ARM64:
Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0
Ważne
Użyj najnowszej wersji LTS dystrybucji systemu Linux. Jeśli na przykład używasz systemu Ubuntu 20.04 LTS, użyj najnowszej wersji systemu Ubuntu 20.04.X.
Zestaw SPEECH SDK zależy od następujących bibliotek systemowych systemu Linux:
Biblioteki udostępnione biblioteki GNU C, w tym biblioteki programowania wątków POSIX, libpthreads.
Biblioteka OpenSSL, wersja 1.x (libssl1) lub 3.x (libssl3) i certyfikaty (ca-certificates).
Biblioteka udostępniona dla aplikacji ALSA (libasound2).
Zestaw SPEECH SDK dla języka C++ można zainstalować z poziomu interfejsu wiersza polecenia platformy .NET przy użyciu następującego dotnet add polecenia:
Wybierz katalog dla plików zestawu SPEECH SDK. Ustaw zmienną SPEECHSDK_ROOT środowiskową, aby wskazywała ten katalog. Ta zmienna ułatwia odwoływanie się do katalogu w przyszłych poleceniach.
Aby użyć pliku speechsdk katalogu w katalogu głównym, uruchom następujące polecenie:
Zweryfikuj zawartość katalogu najwyższego poziomu wyodrębnionego pakietu:
ls -l "$SPEECHSDK_ROOT"
Lista katalogów powinna zawierać powiadomienia o partnerach i pliki licencji. Lista powinna również zawierać katalog dołączania zawierający pliki nagłówka (h) i katalog lib , który zawiera biblioteki arm32, arm64, x64 i x86.
Ścieżka
opis
license.md
Licencja
ThirdPartyNotices.md
Uwagi partnerów
REDIST.txt
Powiadomienie o redystrybucji
include
Wymagane pliki nagłówków dla języka C++
lib/arm32
Biblioteka natywna dla usługi ARM32 wymagana do połączenia aplikacji
lib/arm64
Biblioteka natywna dla usługi ARM64 wymagana do połączenia aplikacji
lib/x64
Biblioteka natywna dla platformy x64 wymagana do połączenia aplikacji
lib/x86
Biblioteka natywna dla platformy x86 wymagana do połączenia aplikacji
W tym przewodniku pokazano, jak zainstalować zestaw SPEECH SDK dla języka C++ w systemie macOS 10.14 lub nowszym. Kroki obejmują pobieranie wymaganych bibliotek i plików nagłówków jako pliku .zip .
Wybierz katalog dla plików zestawu SPEECH SDK. Ustaw zmienną SPEECHSDK_ROOT środowiskową, aby wskazywała ten katalog. Ta zmienna ułatwia odwoływanie się do katalogu w przyszłych poleceniach.
Aby użyć pliku speechsdk katalogu w katalogu głównym, uruchom następujące polecenie:
Tworzenie projektu w programie Visual Studio i instalowanie zestawu Speech SDK
Aby utworzyć projekt programu Visual Studio dla programowania aplikacji klasycznych w języku C++, należy wykonać następujące kroki:
Konfigurowanie opcji programowania programu Visual Studio.
Utwórz projekt.
Wybierz architekturę docelową.
Zainstaluj zestaw SPEECH SDK.
Konfigurowanie opcji programowania w programie Visual Studio
Aby rozpocząć, upewnij się, że konfiguracja jest poprawna w programie Visual Studio dla programowania aplikacji klasycznych w języku C++:
Otwórz program Visual Studio 2019, aby wyświetlić okno uruchamiania.
Wybierz pozycję Kontynuuj bez kodu , aby przejść do środowiska IDE programu Visual Studio.
Na pasku menu programu Visual Studio wybierz pozycję Narzędzia Pobierz narzędzia>i funkcje, aby otworzyć Instalator programu Visual Studio i wyświetlić okno dialogowe Modyfikowanie.
Na karcie Obciążenia w obszarze Windows znajdź pakiet roboczy Programowanie aplikacji klasycznych w języku C++. Jeśli to obciążenie nie zostało jeszcze wybrane, wybierz je.
Na karcie Poszczególne składniki znajdź menedżera pakietów NuGet. Jeśli nie została jeszcze wybrana, wybierz ją.
Wybierz pozycję Zamknij lub Zmodyfikuj. Nazwa przycisku różni się w zależności od tego, czy wybrano jakiekolwiek funkcje instalacji.
Jeśli wybierzesz pozycję Modyfikuj, rozpocznie się instalacja. Proces może chwilę potrwać.
Zamknij Instalator programu Visual Studio.
Tworzenie projektu
Następnie utwórz projekt i wybierz architekturę docelową:
W menu programu Visual Studio wybierz pozycję Plik>nowy>projekt, aby wyświetlić okno Tworzenie nowego projektu.
Znajdź i wybierz pozycję Aplikacja konsolowa. Upewnij się, że wybrano wersję języka C++ tego typu projektu, w przeciwieństwie do języka C# lub Visual Basic.
Wybierz Dalej.
W oknie dialogowym Konfigurowanie nowego projektu w polu Nazwa projektu wprowadź helloworld.
W obszarze Lokalizacja przejdź do i wybierz lub utwórz folder, w którym chcesz zapisać projekt, a następnie wybierz pozycję Utwórz.
Wybierz architekturę platformy docelowej. Na pasku narzędzi programu Visual Studio znajdź pole listy rozwijanej Platformy rozwiązań. Jeśli go nie widzisz, wybierz pozycję Wyświetl>paski narzędzi w warstwie Standardowa, aby wyświetlić pasek narzędzi zawierający platformy> rozwiązań.
Jeśli korzystasz z 64-bitowego systemu Windows, wybierz pozycję x64 w polu listy rozwijanej. 64-bitowy system Windows może również uruchamiać aplikacje 32-bitowe, więc wolisz wybrać x86 .
Instalowanie zestawu SPEECH SDK przy użyciu programu Visual Studio
Na koniec zainstaluj pakiet NuGet zestawu SPEECH SDK i odwołaj się do zestawu SDK usługi Mowa w projekcie:
W Eksplorator rozwiązań kliknij rozwiązanie prawym przyciskiem myszy, a następnie wybierz pozycję Zarządzaj pakietami NuGet dla rozwiązania, aby przejść do okna NuGet — rozwiązanie.
Wybierz przycisk Przeglądaj.
W obszarze Źródło pakietu wybierz pozycję nuget.org.
W polu Wyszukiwania wprowadź wartość Microsoft.CognitiveServices.Speech. Wybierz ten pakiet po pojawieniu się go w wynikach wyszukiwania.
W okienku stanu pakietu obok wyników wyszukiwania wybierz projekt helloworld .
Wybierz Zainstaluj.
W oknie dialogowym Podgląd zmian wybierz przycisk OK.
W oknie dialogowym Akceptacja licencji wyświetl licencję, a następnie wybierz pozycję Akceptuję. Rozpoczyna się instalacja pakietu. Po zakończeniu instalacji w okienku Dane wyjściowe zostanie wyświetlony komunikat podobny do następującego tekstu: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.
W tym przewodniku Szybki start zainstalujesz zestaw SPEECH SDK dla języka Go.
Wymagania dotyczące platformy
Zestaw SPEECH SDK dla języka Go obsługuje następujące dystrybucje w architekturze x64:
Ubuntu 20.04/22.04/24.04
Debian 11/12
Ważne
Użyj najnowszej wersji LTS dystrybucji systemu Linux. Jeśli na przykład używasz systemu Ubuntu 20.04 LTS, użyj najnowszej wersji systemu Ubuntu 20.04.X.
Zestaw SPEECH SDK zależy od następujących bibliotek systemowych systemu Linux:
Biblioteki udostępnione biblioteki GNU C, w tym biblioteki programowania wątków POSIX, libpthreads.
Biblioteka OpenSSL, wersja 1.x (libssl1) lub 3.x (libssl3) i certyfikaty (ca-certificates).
Biblioteka udostępniona dla aplikacji ALSA (libasound2).
Wybierz katalog dla plików zestawu SPEECH SDK. Ustaw zmienną SPEECHSDK_ROOT środowiskową, aby wskazywała ten katalog. Ta zmienna ułatwia odwoływanie się do katalogu w przyszłych poleceniach.
Aby użyć pliku speechsdk katalogu w katalogu głównym, uruchom następujące polecenie:
Zweryfikuj zawartość katalogu najwyższego poziomu wyodrębnionego pakietu:
ls -l "$SPEECHSDK_ROOT"
Lista katalogów powinna zawierać powiadomienia o partnerach i pliki licencji. Lista powinna również zawierać katalog dołączania zawierający pliki nagłówka (h) i katalog lib , który zawiera biblioteki arm32, arm64, x64 i x86.
Ścieżka
opis
license.md
Licencja
ThirdPartyNotices.md
Uwagi partnerów
REDIST.txt
Powiadomienie o redystrybucji
include
Wymagane pliki nagłówków dla języka C++
lib/arm32
Biblioteka natywna dla usługi ARM32 wymagana do połączenia aplikacji
lib/arm64
Biblioteka natywna dla usługi ARM64 wymagana do połączenia aplikacji
lib/x64
Biblioteka natywna dla platformy x64 wymagana do połączenia aplikacji
lib/x86
Biblioteka natywna dla platformy x86 wymagana do połączenia aplikacji
Konfigurowanie środowiska Języka Go
Poniższe kroki umożliwiają znalezienie zestawu SDK usługi Mowa w środowisku Go.
Ponieważ powiązania opierają się na cgometodzie , należy ustawić zmienne środowiskowe, aby język Go mógł znaleźć zestaw SDK.
Zestaw SPEECH SDK dla języka Java nie obsługuje systemu Windows w usłudze ARM64.
Zestaw SPEECH SDK dla języka Java obsługuje następujące dystrybucje w architekturach x64, ARM32 i ARM64:
Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0
Ważne
Użyj najnowszej wersji LTS dystrybucji systemu Linux. Jeśli na przykład używasz systemu Ubuntu 20.04 LTS, użyj najnowszej wersji systemu Ubuntu 20.04.X.
Zestaw SPEECH SDK zależy od następujących bibliotek systemowych systemu Linux:
Biblioteki udostępnione biblioteki GNU C, w tym biblioteki programowania wątków POSIX, libpthreads.
Biblioteka OpenSSL, wersja 1.x (libssl1) lub 3.x (libssl3) i certyfikaty (ca-certificates).
Biblioteka udostępniona dla aplikacji ALSA (libasound2).
Uruchom następujące polecenie narzędzia Maven, aby zainstalować zestaw SPEECH SDK i zależności.
mvn clean dependency:copy-dependencies
Tworzenie projektu środowiska Eclipse i instalowanie zestawu Speech SDK
Zainstaluj środowisko ECLIPSE Java IDE. To środowisko IDE wymaga, aby środowisko Java było już zainstalowane.
Uruchom środowisko Eclipse.
W obszarze Eclipse Launcher w polu Obszar roboczy wprowadź nazwę nowego katalogu obszaru roboczego. Następnie wybierz pozycję Launch (Uruchom).
Za chwilę zostanie wyświetlone główne okno środowiska IDE programu Eclipse. Zamknij ekran powitalny, jeśli jest obecny.
W menu Eclipse wybierz pozycję Plik>nowy>projekt.
Zostanie wyświetlone okno dialogowe Nowy projekt. Wybierz pozycję Projekt Java, a następnie wybierz pozycję Dalej.
Zostanie uruchomiony kreator Nowy projekt Java. W polu Nazwa projektu wprowadź szybki start. Wybierz pozycję JavaSE-1.8 jako środowisko wykonywania. Wybierz Zakończ.
Jeśli zostanie wyświetlone okno Open Associated Perspective? (Otworzyć skojarzoną perspektywę?), wybierz pozycję Open Perspective (Otwórz perspektywę).
W Eksploratorze pakietów kliknij prawym przyciskiem myszy projekt Szybki start . Wybierz pozycję Konfiguruj>konwersję na projekt Maven z menu kontekstowego.
Zostanie wyświetlone okno Create new POM (Tworzenie nowego modelu POM). W polu Identyfikator grupy wprowadź com.microsoft.cognitiveservices.speech.samples. W polu Artifact Id (Identyfikator artefaktu) wprowadź szybki start. Następnie wybierz pozycję Zakończ.
Otwórz plik pom.xml i edytuj go:
dependencies Dodaj element na końcu pliku przed tagiem </project>zamykającym z zestawem SDK usługi Mowa jako zależność:
W tym przewodniku pokazano, jak zainstalować zestaw SPEECH SDK dla języka Java w systemie Android.
Zestaw SPEECH SDK dla systemu Android jest spakowany jako plik archiwum systemu Android (AAR), który zawiera niezbędne biblioteki i wymagane uprawnienia systemu Android.
Instalowanie zestawu SPEECH SDK przy użyciu programu Android Studio
Utwórz nowy projekt w programie Android Studio i dodaj zestaw Speech SDK dla języka Java jako zależność biblioteki. Konfiguracja jest oparta na pakiecie Maven zestawu Speech SDK i mikroukładu programu Android Studio 2021.2.1.
Tworzenie pustego projektu
Otwórz program Android Studio i wybierz pozycję Nowy projekt.
W wyświetlonym oknie Nowy projekt wybierz pozycję Telefon i Tablet>Puste działanie, a następnie wybierz przycisk Dalej.
Wprowadź ciąg SpeechQuickstart w polu tekstowym Nazwa .
Wprowadź samples.speech.cognitiveservices.microsoft.com w polu tekstowym Nazwa pakietu.
Wybierz katalog projektu w polu Wyboru Zapisz lokalizację .
Wybierz pozycję Java w polu Wybór języka .
Wybierz pozycję API 23: Android 6.0 (Marshmallow) w polu wyboru Minimalny poziom interfejsu API.
Wybierz Zakończ.
Przygotowanie nowego projektu w programie Android Studio zajmuje trochę czasu. Po raz pierwszy przy użyciu programu Android Studio może upłynąć kilka minut, aby ustawić preferencje, zaakceptować licencje i ukończyć pracę kreatora.
Instalowanie zestawu SPEECH SDK dla języka Java w systemie Android
Dodaj zestaw SPEECH SDK jako zależność w projekcie.
Wybierz pozycję Aplikacja Zależności>struktury>projektu plików.>
Wybierz symbol plus (+), aby dodać zależność w obszarze Zadeklarowane zależności. Następnie wybierz pozycję Zależność biblioteki z menu rozwijanego.
W wyświetlonym oknie Dodawanie zależności biblioteki wprowadź nazwę i wersję zestawu SPEECH SDK dla języka Java: com.microsoft.cognitiveservices.speech:client-sdk:1.42.0. Następnie wybierz Szukaj.
Upewnij się, że wybrany identyfikator grupy to com.microsoft.cognitiveservices.speech, a następnie wybierz przycisk OK.
Wybierz przycisk OK , aby zamknąć okno Struktura projektu i zastosować zmiany do projektu.
Poznaj implikacje dotyczące architektury między przeglądarkami internetowymi Node.js i klienckimi. Na przykład model obiektów dokumentu (DOM) nie jest dostępny dla aplikacji po stronie serwera. System plików Node.js nie jest dostępny dla aplikacji po stronie klienta.
Instalowanie zestawu SPEECH SDK dla języka JavaScript
W zależności od środowiska docelowego użyj jednego z następujących przewodników:
Aby uzyskać więcej informacji, zobacz przykłady Node.js.
W tym przewodniku pokazano, jak zainstalować zestaw SPEECH SDK dla języka JavaScript do użycia ze stroną internetową.
Rozpakowywanie do folderu
Utwórz nowy, pusty folder. Jeśli chcesz hostować przykład na serwerze internetowym, upewnij się, że serwer internetowy może uzyskać dostęp do folderu.
Pobierz zestaw SDK usługi Mowa jako pakiet zip i rozpakuj go do nowo utworzonego folderu. Te pliki są rozpakowane:
microsoft.cognitiveservices.speech.sdk.bundle.js: czytelna dla człowieka wersja zestawu SPEECH SDK.
microsoft.cognitiveservices.speech.sdk.bundle.js.map: plik mapy do użycia do debugowania kodu zestawu SDK.
microsoft.cognitiveservices.speech.sdk.bundle.d.ts: definicje obiektów do użycia z typescript.
microsoft.cognitiveservices.speech.sdk.bundle-min.js: minimalna wersja zestawu SPEECH SDK.
speech-processor.js: kod zwiększający wydajność niektórych przeglądarek.
Utwórz nowy plik o nazwie index.html w folderze i otwórz ten plik za pomocą edytora tekstów.
Tag skryptu HTML
Pobierz i wyodrębnij plik microsoft.cognitiveservices.speech.sdk.bundle.js z zestawu SPEECH SDK dla języka JavaScript. Umieść go w folderze, do którego ma dostęp plik HTML.
Jeśli używasz przeglądarki internetowej i używasz tagu <script> , sdk prefiks nie jest wymagany. Prefiks sdk jest aliasem używanym do nazywania modułu require .
Alternatywnie można bezpośrednio dołączyć <script> tag do elementu HTML <head> , opierając się na jsDelivr.
Przejdź do katalogu Xcode, w którym znajduje się plik projektu xcodeproj .
Uruchom polecenie pod init , aby utworzyć plik zasobnika o nazwie Podfile.
Zastąp zawartość pliku Podfile następującą zawartością. target Zaktualizuj nazwę z AppName na nazwę aplikacji. Zaktualizuj platformę lub wersję zasobnika zgodnie z potrzebami.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
end
Uruchom polecenie pod install , aby zainstalować zestaw SPEECH SDK.
Alternatywnie pobierz plik binarny CocoaPod i wyodrębnij jego zawartość. W projekcie Xcode dodaj odwołanie do wyodrębnionego folderu MicrosoftCognitiveServicesSpeech.xcframework i jego zawartości.
Uwaga
Deweloperzy platformy .NET mogą tworzyć natywne aplikacje systemu macOS przy użyciu platformy aplikacji Xamarin.Mac. Aby uzyskać więcej informacji, zobacz Xamarin.Mac.
Zestaw SPEECH SDK dla języka Objective-C jest dostępny natywnie jako pakiet CocoaPod.
Przejdź do katalogu Xcode, w którym znajduje się plik projektu xcodeproj .
Uruchom polecenie pod init , aby utworzyć plik zasobnika o nazwie Podfile.
Zastąp zawartość pliku Podfile następującą zawartością. target Zaktualizuj nazwę z AppName na nazwę aplikacji. Zaktualizuj platformę lub wersję zasobnika zgodnie z potrzebami.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.42.0'
end
Uruchom polecenie pod install , aby zainstalować zestaw SPEECH SDK.
Alternatywnie pobierz plik binarny CocoaPod i wyodrębnij jego zawartość. W projekcie Xcode dodaj odwołanie do wyodrębnionego folderu MicrosoftCognitiveServicesSpeech.xcframework i jego zawartości.
Uwaga
Deweloperzy platformy .NET mogą tworzyć natywne aplikacje systemu iOS przy użyciu platformy aplikacji Xamarin.iOS. Aby uzyskać więcej informacji, zobacz Xamarin.iOS.
Przejdź do katalogu Xcode, w którym znajduje się plik projektu xcodeproj .
Uruchom polecenie pod init , aby utworzyć plik zasobnika o nazwie Podfile.
Zastąp zawartość pliku Podfile następującą zawartością. target Zaktualizuj nazwę z AppName na nazwę aplikacji. Zaktualizuj platformę lub wersję zasobnika zgodnie z potrzebami.
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.42.0'
end
Uruchom polecenie pod install , aby zainstalować zestaw SPEECH SDK.
Alternatywnie pobierz plik binarny CocoaPod i wyodrębnij jego zawartość. W projekcie Xcode dodaj odwołanie do wyodrębnionego folderu MicrosoftCognitiveServicesSpeech.xcframework i jego zawartości.
Uwaga
Deweloperzy platformy .NET mogą tworzyć natywne aplikacje systemu macOS przy użyciu platformy aplikacji Xamarin.Mac. Aby uzyskać więcej informacji, zobacz Xamarin.Mac.
Zestaw SPEECH SDK dla języka Swift jest dostępny natywnie jako pakiet CocoaPod.
Przejdź do katalogu Xcode, w którym znajduje się plik projektu xcodeproj .
Uruchom polecenie pod init , aby utworzyć plik zasobnika o nazwie Podfile.
Zastąp zawartość pliku Podfile następującym kodem. target Zaktualizuj nazwę z AppName na nazwę aplikacji. Zaktualizuj platformę lub wersję zasobnika zgodnie z potrzebami.
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.42.0'
end
Uruchom polecenie pod install , aby zainstalować zestaw SPEECH SDK.
Alternatywnie pobierz plik binarny CocoaPod i wyodrębnij jego zawartość. W projekcie Xcode dodaj odwołanie do wyodrębnionego folderu MicrosoftCognitiveServicesSpeech.xcframework i jego zawartości.
Uwaga
Deweloperzy platformy .NET mogą tworzyć natywne aplikacje systemu iOS przy użyciu platformy aplikacji Xamarin.iOS. Aby uzyskać więcej informacji, zobacz Xamarin.iOS.
Upewnij się, że pakiety tej samej architektury docelowej są zainstalowane. Jeśli na przykład zainstalujesz pakiet redystrybucyjny x64, zainstaluj pakiet x64 języka Python.
Zestaw SPEECH SDK dla języka Python obsługuje następujące dystrybucje w architekturach x64 i ARM64:
Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0
Ważne
Użyj najnowszej wersji LTS dystrybucji systemu Linux. Jeśli na przykład używasz systemu Ubuntu 20.04 LTS, użyj najnowszej wersji systemu Ubuntu 20.04.X.
Zestaw SPEECH SDK zależy od następujących bibliotek systemowych systemu Linux:
Biblioteki udostępnione biblioteki GNU C, w tym biblioteki programowania wątków POSIX, libpthreads.
Biblioteka OpenSSL, wersja 1.x (libssl1) lub 3.x (libssl3) i certyfikaty (ca-certificates).
Biblioteka udostępniona dla aplikacji ALSA (libasound2).
Wymagany jest system macOS w wersji 10.14 lub nowszej.
Zainstaluj wersję języka Python z wersji 3.8 lub nowszej.
Aby sprawdzić instalację, otwórz terminal i uruchom polecenie python --version. Jeśli język Python został poprawnie zainstalowany, otrzymasz odpowiedź na Python 3.8.10przykład .
Jeśli używasz systemu macOS lub Linux, może być konieczne uruchomienie polecenia python3 --version .
Aby włączyć używanie polecenia python zamiast python3polecenia , uruchom polecenie alias python='python3' , aby skonfigurować alias. Przykłady z przewodnika Szybki start dla zestawu SDK usługi Mowa określają python użycie.
Instalowanie zestawu SPEECH SDK dla języka Python
Przed zainstalowaniem zestawu SPEECH SDK dla języka Python upewnij się, że spełniasz wymagania dotyczące platformy.
Możesz sprawdzić, który zestaw SPEECH SDK dla wersji języka Python jest obecnie zainstalowany, sprawdzając zmienną azure.cognitiveservices.speech.__version__ . Na przykład uruchom to polecenie w oknie konsoli:
pip list
Instalowanie zestawu SPEECH SDK przy użyciu programu Visual Studio Code
Aby zainstalować zestaw SPEECH SDK dla języka Python:
Uruchom program Visual Studio Code i zainstaluj rozszerzenie języka Python:
Wybierz pozycję Rozszerzenia preferencji>plików>.
Wyszukaj język Python, znajdź rozszerzenie języka Python dla programu Visual Studio Code opublikowanego przez firmę Microsoft, a następnie wybierz pozycję Zainstaluj.
Wybierz pozycję Terminal>Nowy terminal, aby otworzyć terminal w programie Visual Studio Code.
W wierszu polecenia terminalu uruchom następujące polecenie, aby zainstalować pakiet zestawu Speech SDK dla języka Python.