Поделиться через


Краткое руководство: Установка комплекта разработки программного обеспечения (SDK) для службы "Речь"

Справочная документация | Пакет (NuGet) | Дополнительные примеры на GitHub

В этом кратком ознакомительном руководстве вы установите Speech SDK для C#.

Требования платформы

Speech SDK для C# совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите Microsoft распространяемый компонент Visual C++ для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

Установка пакета SDK службы "Речь" для C#

Пакет Speech SDK для C# доступен как пакет NuGet и поддерживает .NET Standard 2.0. Дополнительные сведения см. в статье Microsoft.CognitiveServices.Speech.

Пакет SDK для распознавания речи на C# можно установить в .NET CLI с помощью следующей dotnet add команды:

dotnet add package Microsoft.CognitiveServices.Speech

Справочная документация | Пакет NuGet | Дополнительные примеры на GitHub

В этом быстром запуске вы установите Speech SDK для C++.

Требования платформы

SDK для работы с речью на C++ совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите пакет Microsoft Visual C++ Redistributable для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

Установите Speech SDK для C++

Пакет Speech SDK для C++ доступен в виде пакета NuGet. Дополнительные сведения см. в статье Microsoft.CognitiveServices.Speech.

Пакет SDK для работы с речью в C++ можно установить из .NET CLI с помощью следующей команды dotnet add:

dotnet add package Microsoft.CognitiveServices.Speech

Вы можете воспользоваться этими руководствами для получения дополнительных параметров.

Это руководство объясняет, как установить Speech SDK для Linux.

Чтобы загрузить и установить пакет SDK, выполните следующие действия. Эти шаги включают скачивание необходимых библиотек и файлов заголовков в виде файла .tar.

  1. Выберите каталог для файлов SDK голосовых технологий. SPEECHSDK_ROOT Задайте переменную среды, чтобы указать этот каталог. Эта переменная упрощает подключение к каталогу в будущих командах.

    Чтобы использовать каталог speechsdk в вашем домашнем каталоге, выполните следующую команду:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Создайте каталог, если он не существует:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Скачайте и извлеките архив .tar.gz, содержащий двоичные файлы пакета SDK для распознавания речи.

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Проверьте содержимое каталога верхнего уровня извлеченного пакета.

    ls -l "$SPEECHSDK_ROOT"
    

    Список каталогов должен содержать уведомления партнера и файлы лицензий. В списке также должен содержаться каталог include, содержащий файлы заголовков (.h) и каталог lib, содержащий библиотеки для arm32, arm64, x64 и x86.

    Путь Описание
    license.md Лицензия
    ThirdPartyNotices.md Уведомления о партнерах
    REDIST.txt Уведомление о повторном распространении
    include Необходимые файлы заголовков для C++
    lib/arm32 Собственная библиотека для ARM32, необходимая для привязки приложения
    lib/arm64 Собственная библиотека для ARM64, необходимая для привязки приложения
    lib/x64 Собственная библиотека для 64-разрядной ОС, необходимая для привязки приложения
    lib/x86 Собственная библиотека для 32-разрядной ОС, необходимая для привязки приложения

Справочная документация | Пакет (Go) | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите SDK для работы с речью для Go.

Требования платформы

SDK для речи на Go поддерживает следующие дистрибутивы на архитектуре x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Внимание

Используйте последний выпуск LTS дистрибутива Linux. Например, если вы работаете с Ubuntu 20.04 LTS, используйте последний выпуск Ubuntu 20.04.X.

Пакет Речевой SDK зависит от следующих системных библиотек Linux:

  • Общие библиотеки библиотеки GNU C, включая библиотеку программирования потоков POSIX. libpthreads
  • Библиотека OpenSSL версии 1.x () или 3.x (libssl1libssl3) и сертификаты (ca-certificates).
  • Общая библиотека для приложений ALSA (libasound2).

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Установите двоичный файл Go версии 1.13 или более поздней.

Установка SDK пакета для работы с речью в Go

Чтобы загрузить и установить пакет SDK, выполните следующие действия. Эти шаги включают скачивание необходимых библиотек и файлов заголовков в виде файла .tar.

  1. Выберите каталог для файлов пакета SDK службы "Речь". SPEECHSDK_ROOT Задайте переменную среды, чтобы указать этот каталог. Эта переменная упрощает подключение к каталогу в будущих командах.

    Чтобы использовать каталог speechsdk в вашем домашнем каталоге, выполните следующую команду:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Создайте каталог, если он не существует:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Скачайте и извлеките архив .tar.gz, содержащий двоичные файлы Speech SDK.

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Проверьте содержимое каталога верхнего уровня извлеченного пакета.

    ls -l "$SPEECHSDK_ROOT"
    

    Список каталогов должен содержать уведомления партнера и файлы лицензий. В списке также должен содержаться каталог include, содержащий файлы заголовков (.h), и каталог lib, содержащий библиотеки для arm32, arm64, x64 и x86.

    Путь Описание
    license.md Лицензия
    ThirdPartyNotices.md Уведомления о партнерах
    REDIST.txt Уведомление о повторном распространении
    include Необходимые файлы заголовков для C++
    lib/arm32 Собственная библиотека для ARM32, необходимая для привязки приложения
    lib/arm64 Собственная библиотека для ARM64, необходимая для привязки приложения
    lib/x64 Собственная библиотека для 64-разрядной ОС, необходимая для привязки приложения
    lib/x86 Собственная библиотека для 32-разрядной ОС, необходимая для привязки приложения

Настройка среды Go

Чтобы настроить среду Go для поиска Speech SDK, выполните следующие действия.

  1. Так как привязки зависят от cgo, вам нужно задать переменные среды, чтобы помочь Go найти пакет SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Внимание

    Замените <architecture> на архитектуру процессора вашего ЦП: x64, arm32 или arm64.

  2. Для запуска приложений и пакета SDK нужно сообщить операционной системе, где найти библиотеки.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Внимание

    Замените <architecture> на архитектуру процессора вашего ЦП: x64, arm32 или arm64.

Справочная документация | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите Speech SDK для Java.

Требования платформы

Выберите целевую среду:

Пакет SDK службы "Речь" для Java совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите Пакет перераспределения Microsoft Visual C++ для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

SDK для распознавания речи для Java не поддерживает Windows на ARM64.

Установите пакет средств разработки Java, например Azul Zulu OpenJDK. Также может работать Microsoft Build of OpenJDK или предпочтительный JDK.

Установите пакет SDK для обработки речи для Java

Некоторые инструкции используют определенную версию пакета SDK, например 1.43.0. Чтобы проверить последнюю версию, выполните поиск в нашем репозитории GitHub.

Выберите целевую среду:

В этом руководстве объясняется, как установить Speech SDK для Java на Java Runtime.

Поддерживаемые операционные системы

Пакет SDK для распознавания речи для Java поддерживается на следующих операционных системах:

Установите SDK для Java 'Speech' с помощью Apache Maven, выполнив следующие шаги:

  1. Установите Apache Maven.

  2. Откройте командную строку, в которой хотите создать проект, и создайте файл pom.xml .

  3. Скопируйте следующее XML-содержимое в pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Выполните следующую команду Maven, чтобы установить SDK для речи и все зависимости.

    mvn clean dependency:copy-dependencies
    

Справочная документация | Пакет (npm) | Дополнительные примеры на GitHub | Исходный код библиотеки

В этом руководстве для быстрого начала вы установите Speech SDK для JavaScript.

Пакет SDK службы "Речь" для JavaScript доступен в виде модуля npm. См. статью о microsoft-cognitiveservices-speech-sdk и его сопутствующем репозитории GitHub cognitive-services-speech-sdk-js.

Требования платформы

Изучите архитектурные последствия между Node.js и клиентскими веб-браузерами. Например, объектная модель документа (DOM) недоступна для серверных приложений. Node.js файловая система недоступна клиентским приложениям.

Установка пакета SDK "Речь" для JavaScript

В зависимости от целевой среды используйте одно из следующих руководств:

Здесь также описано, как установить пакет SDK службы "Речь" для JavaScript для использования с Node.js.

  1. Установка Node.js.

  2. Создайте каталог, выполните npm init и следуйте пошаговым инструкциям.

  3. Чтобы установить SDK речевых служб для JavaScript, выполните следующую команду npm install.

    npm install microsoft-cognitiveservices-speech-sdk
    

Дополнительные сведения см. на странице Примеры Node.js.

Используйте Speech SDK

  • Добавьте следующий оператор импорта для использования "Speech SDK" в вашем проекте JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Дополнительные сведения о import см. в разделе Экспорт и импорт на веб-сайте JavaScript.

Кроме того, вы можете использовать оператор require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Справочный пакет документации | (скачивание) | Дополнительные примеры на GitHub

В этом кратком руководстве по началу работы вы установите SDK для распознавания речи для Objective-C.

Совет

Дополнительные сведения об использовании пакета SDK для речи Swift см. в статье Импорт Objective-C в Swift.

Установка Speech SDK для Objective-C

Пакет SDK службы "Речь" для Objective-C доступен изначально в виде пакета CocoaPod для систем на базе Mac x64 и ARM.

Требования к системе для Mac:

  • macOS 10.14 или более поздней версии

Пакет macOS CocoaPod доступен для скачивания и использования с интегрированной средой разработки Xcode 9.4.1 или более поздней версии.

  1. Перейдите в каталог Xcode, где находится файл проекта Xcodeproj .

  2. Выполните команду pod init , чтобы создать файл pod с именем Podfile.

  3. Замените содержимое Podfile следующим содержимым. Обновите target с AppName на имя вашего приложения. При необходимости обновите версию платформы или pod.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Выполните pod install, чтобы установить Speech SDK.

Кроме того, скачайте бинарный файл CocoaPod и извлеките его содержимое. В проекте Xcode добавьте ссылку на извлеченную папку MicrosoftCognitiveServicesSpeech.xcframework и ее содержимое.

Справочный пакет документации | (скачивание) | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите Speech SDK для Swift.

Совет

Дополнительную информацию об использовании Speech SDK для Swift, см. в разделе импорта Objective-C в Swift.

Установка SDK для распознавания речи для Swift

SDK для Speech для Swift доступен нативно как пакет CocoaPod для систем Mac x64 и ARM.

Требования к системе для Mac:

  • macOS 10.14 или более поздней версии

Пакет macOS CocoaPod доступен для скачивания и использования с интегрированной средой разработки Xcode 9.4.1 или более поздней версии.

  1. Перейдите в каталог Xcode, где находится файл проекта Xcodeproj .

  2. Выполните команду pod init , чтобы создать файл pod с именем Podfile.

  3. Замените содержимое Podfile следующим содержимым. Обновите имя target с AppName на имя вашего приложения. Обновите версию платформы или pod, если это необходимо.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. Запустите pod install, чтобы установить Speech SDK.

Кроме того, скачайте двоичный файл CocoaPod и извлеките его содержимое. В проекте Xcode добавьте ссылку на извлеченную папку MicrosoftCognitiveServicesSpeech.xcframework и ее содержимое.

Справочные примеры пакета документации | (PyPi) | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите Speech SDK для Python.

Требования платформы

SDK для Python совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите пакет Microsoft Visual C++ Redistributable для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

Внимание

Убедитесь, что установлены пакеты той же целевой архитектуры. Например, если установить распространяемый пакет x64, установите пакет x64 Python.

Установите версию Python с версии 3.8 или более поздней версии.

  • Чтобы проверить установку, откройте терминал и выполните команду python --version. Если Python установлен правильно, вы получите такой ответ Python 3.8.10.

  • Если вы используете macOS или Linux, вам может потребоваться выполнить команду python3 --version .

    Чтобы включить использование python вместо python3, выполните команду alias python='python3' для настройки псевдонима. Примеры быстрого начала для Speech SDK указывают применение python.

Установка пакета SDK для распознавания речи для Python

Перед установкой пакета SDK службы распознавания речи для Python убедитесь, что выполнены требования к платформе.

Установка из PyPI

Чтобы установить пакет SDK для речи для Python, выполните эту команду в окне консоли.

pip install azure-cognitiveservices-speech

Обновление до новейшего речевого пакета SDK

Чтобы обновить пакет SDK для службы "Речь" до последней версии, выполните следующую команду в окне консоли:

pip install --upgrade azure-cognitiveservices-speech

Вы можете узнать, какая версия пакета SDK службы "Речь" для Python сейчас установлена, проверив переменную azure.cognitiveservices.speech.__version__. Например, выполните следующую команду в окне консоли:

pip list

Используйте SDK для речи

Добавьте следующую инструкцию импорта, чтобы использовать пакет SDK "Speech" в вашем проекте на Python:

import azure.cognitiveservices.speech as speechsdk

Примеры кода

Подробные примеры доступны в репозитории Azure-Samples/cognitive-services-speech-sdk на сайте GitHub. Примеры для C# (включая UWP и Unity), C++, Java, JavaScript (включая браузер и Node.js), Objective-C, Python и Swift. Примеры кода для Go доступны в репозитории Microsoft/cognitive-services-speech-sdk-go на сайте GitHub.