Udostępnij za pośrednictwem


Szybki start: instalowanie zestawu SPEECH SDK

Dokumentacja referencyjna Package (NuGet) |

W tej instrukcji szybkiego startu zainstalujesz zestaw Speech SDK dla języka C#.

Wymagania dotyczące platformy

Zestaw SPEECH SDK dla języka C# jest zgodny z systemami Windows, Linux i macOS.

W systemie Windows należy użyć architektury docelowej 64-bitowej. Wymagany jest system Windows 10 lub nowszy.

Zainstaluj Pakiet redystrybucyjny Microsoft Visual C++ dla Visual Studio 2015, 2017, 2019 i 2022 dla swojej platformy. Zainstalowanie tego pakietu po raz pierwszy może wymagać ponownego uruchomienia.

Instalowanie zestawu SPEECH SDK dla języka C#

Zestaw SPEECH SDK dla języka C# jest dostępny jako pakiet NuGet i implementuje platformę .NET Standard 2.0. Aby uzyskać więcej informacji, zobacz Microsoft.CognitiveServices.Speech.

Zestaw SPEECH SDK dla języka C# można zainstalować z poziomu interfejsu wiersza polecenia platformy .NET przy użyciu następującego dotnet add polecenia:

dotnet add package Microsoft.CognitiveServices.Speech

Dokumentacja referencyjna Package (NuGet) |

W tej instrukcji szybkiego startu zainstalujesz pakiet Speech SDK w C++.

Wymagania dotyczące platformy

Zestaw SPEECH SDK dla języka C++ jest zgodny z systemami Windows, Linux i macOS.

W systemie Windows należy użyć architektury docelowej 64-bitowej. Wymagany jest system Windows 10 lub nowszy.

Zainstaluj pakiet redystrybucyjny Microsoft Visual C++ dla Visual Studio 2015, 2017, 2019 i 2022 dla swojego systemu. Zainstalowanie tego pakietu po raz pierwszy może wymagać ponownego uruchomienia.

Instalowanie zestawu SPEECH SDK dla języka C++

Zestaw SPEECH SDK dla języka C++ jest dostępny jako pakiet NuGet. Aby uzyskać więcej informacji, zobacz Microsoft.CognitiveServices.Speech.

Zestaw SPEECH SDK dla języka C++ można zainstalować z poziomu interfejsu wiersza polecenia platformy .NET przy użyciu następującego dotnet add polecenia:

dotnet add package Microsoft.CognitiveServices.Speech

Aby uzyskać więcej opcji, możesz skorzystać z tych przewodników.

W tym przewodniku pokazano, jak zainstalować zestaw SPEECH SDK dla systemu Linux.

Aby pobrać i zainstalować zestaw SDK, wykonaj poniższą procedurę. Kroki obejmują pobieranie jako pliku .tar wymaganych bibliotek i plików nagłówków.

  1. Wybierz katalog dla plików zestawu SPEECH SDK. Ustaw zmienną SPEECHSDK_ROOT środowiskową, aby wskazywała ten katalog. Ta zmienna ułatwia odwoływanie się do katalogu w przyszłych poleceniach.

    Aby użyć katalogu speechsdk w katalogu domowym, uruchom następujące polecenie:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Utwórz katalog, jeśli nie istnieje:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Pobierz i wyodrębnij archiwum .tar.gz zawierające pliki binarne zestawu SDK usługi Mowa:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Zweryfikuj zawartość katalogu najwyższego poziomu wyodrębnionego pakietu:

    ls -l "$SPEECHSDK_ROOT"
    

    Lista katalogów powinna zawierać powiadomienia o partnerach i pliki licencji. Lista powinna również zawierać katalog include zawierający pliki nagłówka (.h) i katalog lib, który zawiera biblioteki arm32, arm64, x64 i x86.

    Ścieżka opis
    license.md Licencja
    ThirdPartyNotices.md Uwagi partnerów
    REDIST.txt Powiadomienie o redystrybucji
    include Wymagane pliki nagłówków dla języka C++
    lib/arm32 Biblioteka natywna dla ARM32 wymagana do zlinkowania aplikacji
    lib/arm64 Natywna biblioteka dla ARM64 wymagana do powiązania aplikacji.
    lib/x64 Biblioteka natywna dla platformy x64 wymagana do połączenia aplikacji
    lib/x86 Biblioteka natywna dla platformy x86 wymagana do połączenia aplikacji

Dokumentacja referencyjna Package (Go) |

W tym szybkim przewodniku zainstalujesz zestaw Speech SDK dla języka Go.

Wymagania dotyczące platformy

Zestaw SPEECH SDK dla języka Go obsługuje następujące dystrybucje w architekturze x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Ważne

Użyj najnowszej wersji LTS dystrybucji systemu Linux. Jeśli na przykład używasz systemu Ubuntu 20.04 LTS, użyj najnowszej wersji systemu Ubuntu 20.04.X.

Zestaw SPEECH SDK zależy od następujących bibliotek systemowych systemu Linux:

  • Udostępniane biblioteki GNU C, w tym biblioteka programowania wątków POSIX, libpthreads.
  • Biblioteka OpenSSL, wersja 1.x (libssl1) lub 3.x (libssl3) i certyfikaty (ca-certificates).
  • Biblioteka udostępniona dla aplikacji ALSA (libasound2).

Uruchom te polecenia:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Zainstaluj plik binarny Go w wersji 1.13 lub nowszej.

Instalowanie zestawu SPEECH SDK dla języka Go

Aby pobrać i zainstalować zestaw SDK, wykonaj poniższą procedurę. Kroki obejmują pobieranie wymaganych bibliotek i plików nagłówkówjako plik .tar.

  1. Wybierz katalog dla plików zestawu SPEECH SDK. Ustaw zmienną SPEECHSDK_ROOT środowiskową, aby wskazywała ten katalog. Ta zmienna ułatwia odwoływanie się do katalogu w przyszłych poleceniach.

    Aby użyć katalogu speechsdk w swoim katalogu domowym, uruchom następujące polecenie:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Utwórz katalog, jeśli nie istnieje:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Pobierz i wyodrębnij archiwum .tar.gz zawierające pliki binarne zestawu SDK usługi Mowa:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Zweryfikuj zawartość katalogu najwyższego poziomu wyodrębnionego pakietu:

    ls -l "$SPEECHSDK_ROOT"
    

    Lista katalogów powinna zawierać powiadomienia o partnerach i pliki licencji. Lista powinna również zawierać katalog include zawierający pliki nagłówkowe (.h) i katalog lib, który zawiera biblioteki dla arm32, arm64, x64 i x86.

    Ścieżka opis
    license.md Licencja
    ThirdPartyNotices.md Uwagi partnerów
    REDIST.txt Powiadomienie o redystrybucji
    include Wymagane pliki nagłówków dla języka C++
    lib/arm32 Natywna biblioteka dla ARM32 wymagana do zlinkowania aplikacji
    lib/arm64 Biblioteka natywna dla architektury ARM64 wymagana do związania aplikacji
    lib/x64 Biblioteka natywna dla platformy x64 wymagana do połączenia aplikacji
    lib/x86 Biblioteka natywna dla platformy x86 wymagana do połączenia aplikacji

Konfigurowanie środowiska Języka Go

Poniższe kroki umożliwiają znalezienie zestawu SDK usługi Mowa w środowisku Go.

  1. Ponieważ powiązania opierają się na cgo, należy ustawić zmienne środowiskowe, aby Go mógł znaleźć zestaw SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Ważne

    Zastąp <architecture> element architekturą procesora cpu: x64, arm32lub arm64.

  2. Aby uruchamiać aplikacje i zestaw SDK, musisz poinformować system operacyjny, gdzie można znaleźć biblioteki.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Ważne

    Zastąp <architecture> element architekturą procesora cpu: x64, arm32lub arm64.

| Dokumentacja referencyjna Dodatkowe przykłady w usłudze GitHub

W tym szybkim przewodniku zainstalujesz zestaw SDK do rozpoznawania mowy dla języka Java.

Wymagania dotyczące platformy

Wybierz środowisko docelowe:

Zestaw SPEECH SDK dla języka Java jest zgodny z systemami Windows, Linux i macOS.

W systemie Windows należy użyć architektury docelowej 64-bitowej. Wymagany jest system Windows 10 lub nowszy.

Zainstaluj pakiet redystrybucyjny Microsoft Visual C++ dla Visual Studio 2015, 2017, 2019 i 2022 odpowiedni dla Twojej platformy. Zainstalowanie tego pakietu po raz pierwszy może wymagać ponownego uruchomienia.

Pakiet SDK mowy dla języka Java nie obsługuje systemu Windows na ARM64.

Zainstaluj zestaw Java Development Kit, taki jak Azul Zulu OpenJDK. Pakiet Microsoft Build OpenJDK lub preferowane JDK powinny również działać.

Instalowanie zestawu SPEECH SDK dla języka Java

Niektóre instrukcje używają określonej wersji zestawu SDK, takiej jak 1.43.0. Aby sprawdzić najnowszą wersję, wyszukaj nasze repozytorium GitHub.

Wybierz środowisko docelowe:

W tym przewodniku pokazano, jak zainstalować zestaw Speech SDK dla języka Java w środowisku uruchomieniowym języka Java.

Obsługiwane systemy operacyjne

Pakiet Speech SDK dla języka Java jest dostępny dla następujących systemów operacyjnych:

Wykonaj następujące kroki, aby zainstalować zestaw SPEECH SDK dla języka Java przy użyciu narzędzia Apache Maven:

  1. Zainstaluj narzędzie Apache Maven.

  2. Otwórz wiersz polecenia, w którym chcesz utworzyć nowy projekt, i utwórz nowy plik pom.xml .

  3. Skopiuj następującą zawartość XML do pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Uruchom następujące polecenie narzędzia Maven, aby zainstalować zestaw SPEECH SDK i zależności.

    mvn clean dependency:copy-dependencies
    

Dokumentacja referencyjna | Package (npm) | Dodatkowe przykłady w kodzie źródłowym biblioteki GitHub |

W tym szybkiego startu zainstalujesz Speech SDK dla języka JavaScript.

Zestaw SPEECH SDK dla języka JavaScript jest dostępny jako pakiet npm. Zobacz microsoft-cognitiveservices-speech-sdk i jego towarzyszące repozytorium GitHub cognitive-services-speech-sdk-js.

Wymagania dotyczące platformy

Poznaj implikacje dotyczące architektury między przeglądarkami internetowymi Node.js i klienckimi. Na przykład model obiektów dokumentu (DOM) nie jest dostępny dla aplikacji po stronie serwera. System plików Node.js nie jest dostępny dla aplikacji po stronie klienta.

Instalowanie zestawu SPEECH SDK dla języka JavaScript

W zależności od środowiska docelowego użyj jednego z następujących przewodników:

W tym przewodniku pokazano, jak zainstalować zestaw SPEECH SDK dla języka JavaScript do użycia z Node.js.

  1. Zainstalowanie środowiska Node.js.

  2. Utwórz nowy katalog, uruchom npm init i postępuj zgodnie z instrukcjami.

  3. Aby zainstalować zestaw Speech SDK dla języka JavaScript, uruchom następujące npm install polecenie:

    npm install microsoft-cognitiveservices-speech-sdk
    

Aby uzyskać więcej informacji, zobacz przykłady Node.js.

Korzystanie z zestawu SDK Mowy

  • Dodaj następującą instrukcję importowania, aby użyć zestawu SPEECH SDK w projekcie JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Aby uzyskać więcej informacji na temat import, zobacz Eksportowanie i importowanie na stronie internetowej JavaScript.

Alternatywnie można użyć instrukcji require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Dokumentacja referencyjna | Package (pobierz) | Dodatkowe przykłady na GitHubie

W tym szybkim przewodniku zainstalujesz zestaw Speech SDK dla języka Objective-C.

Napiwek

Aby uzyskać więcej informacji na temat korzystania z zestawu Speech SDK dla języka Swift, zobacz Importowanie języka Objective-C do języka Swift.

Instalowanie zestawu SPEECH SDK dla języka Objective-C

SDK Speech dla języka Objective-C jest natywnie dostępny jako pakiet CocoaPod dla systemów Mac x64 i ARM.

Wymagania systemowe dla komputerów Mac:

  • System macOS w wersji 10.14 lub nowszej

Pakiet CocoaPod systemu macOS jest dostępny do pobrania i użycia z zintegrowanym środowiskiem projektowym (IDE) programu Xcode 9.4.1 lub nowszym.

  1. Przejdź do katalogu Xcode, w którym znajduje się plik projektu xcodeproj .

  2. Uruchom polecenie pod init, aby utworzyć plik pod o nazwie Podfile.

  3. Zastąp zawartość pliku Podfile następującą zawartością. Zaktualizuj nazwę target z AppName na nazwę swojej aplikacji. Zaktualizuj platformę lub wersję podu zgodnie z potrzebami.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Uruchom polecenie pod install , aby zainstalować zestaw SPEECH SDK.

Alternatywnie pobierz plik binarny CocoaPod i wyodrębnij jego zawartość. W projekcie Xcode dodaj odwołanie do wyodrębnionego folderu MicrosoftCognitiveServicesSpeech.xcframework i jego zawartości.

Dokumentacja referencyjna | Pakiet (pobierz) | Dodatkowe przykłady na GitHubie

W tym szybkim starcie zainstalujesz Speech SDK dla języka Swift.

Napiwek

Aby uzyskać więcej informacji na temat korzystania z zestawu Speech SDK dla języka Swift, zobacz Importowanie języka Objective-C do języka Swift.

Instalowanie zestawu SPEECH SDK dla języka Swift

Zestaw Speech SDK dla Swift jest dostępny natywnie jako pakiet CocoaPod dla komputerów Mac x64 i systemów opartych na ARM.

Wymagania systemowe dla komputerów Mac:

  • System macOS w wersji 10.14 lub nowszej

Pakiet CocoaPod systemu macOS jest dostępny do pobrania i użycia z zintegrowanym środowiskiem projektowym (IDE) programu Xcode 9.4.1 lub nowszym.

  1. Przejdź do katalogu Xcode, w którym znajduje się plik projektu xcodeproj .

  2. Uruchom pod init, aby utworzyć plik Pod o nazwie Podfile.

  3. Zastąp zawartość pliku Podfile następującą zawartością. Zaktualizuj nazwę target z AppName na nazwę twojej aplikacji. Zaktualizuj platformę lub wersję poda zgodnie z potrzebami.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Uruchom polecenie pod install , aby zainstalować zestaw SPEECH SDK.

Alternatywnie pobierz plik binarny CocoaPod i wyodrębnij jego zawartość. W projekcie Xcode dodaj odwołanie do wyodrębnionego folderu MicrosoftCognitiveServicesSpeech.xcframework i jego zawartości.

Dokumentacja referencyjna | Package (PyPi) | Dodatkowe przykłady w witrynie GitHub

W tym przewodniku Szybki start zainstalujesz zestaw SPEECH SDK dla języka Python.

Wymagania dotyczące platformy

Zestaw SPEECH SDK dla języka Python jest zgodny z systemami Windows, Linux i macOS.

W systemie Windows należy użyć architektury docelowej 64-bitowej. Wymagany jest system Windows 10 lub nowszy.

Zainstaluj Pakiet redystrybucyjny Visual C++ dla Visual Studio 2015, 2017, 2019 i 2022 dla swojej platformy. Zainstalowanie tego pakietu po raz pierwszy może wymagać ponownego uruchomienia.

Ważne

Upewnij się, że pakiety tej samej architektury docelowej są zainstalowane. Jeśli na przykład zainstalujesz pakiet redystrybucyjny x64, zainstaluj pakiet x64 języka Python.

Zainstaluj wersję języka Python z wersji 3.8 lub nowszej.

  • Aby sprawdzić instalację, otwórz terminal i uruchom polecenie python --version. Jeśli język Python został poprawnie zainstalowany, otrzymasz odpowiedź taką jak Python 3.8.10.

  • Jeśli używasz systemu macOS lub Linux, może być konieczne uruchomienie polecenia python3 --version .

    Aby umożliwić używanie python zamiast python3, uruchom alias python='python3', aby skonfigurować alias. Przykłady Szybkiego startu dla zestawu SDK usługi Mowa określają użytkowanie python.

Instalowanie zestawu SPEECH SDK dla języka Python

Przed zainstalowaniem zestawu SPEECH SDK dla języka Python upewnij się, że spełniasz wymagania dotyczące platformy.

Instalacja z PyPI

Aby zainstalować zestaw Speech SDK dla języka Python, uruchom to polecenie w oknie konsoli:

pip install azure-cognitiveservices-speech

Uaktualnij do najnowszego zestawu Speech SDK

Aby uaktualnić zestaw SPEECH SDK do najnowszej wersji, uruchom to polecenie w oknie konsoli:

pip install --upgrade azure-cognitiveservices-speech

Możesz sprawdzić, który zestaw SPEECH SDK dla wersji języka Python jest obecnie zainstalowany, sprawdzając zmienną azure.cognitiveservices.speech.__version__ . Na przykład uruchom to polecenie w oknie konsoli:

pip list

Korzystanie z zestawu SDK Mowa

Dodaj następującą instrukcję importowania, aby użyć zestawu SPEECH SDK w projekcie języka Python:

import azure.cognitiveservices.speech as speechsdk

Przykłady kodu

Szczegółowe przykłady są dostępne w repozytorium Azure-Samples/cognitive-services-speech-sdk w witrynie GitHub. Istnieją przykłady dla języka C# (w tym platformy UWP i Unity), C++, Java, JavaScript (w tym przeglądarka i Node.js), Objective-C, Python i Swift. Przykłady kodu dla języka Go są dostępne w repozytorium Microsoft/cognitive-services-speech-sdk-go w witrynie GitHub.