Установите SDK для распознавания речи - Azure AI services

Справочная документация | Пакет (NuGet) | Дополнительные примеры на GitHub

В этом кратком ознакомительном руководстве вы установите Speech SDK для C#.

Требования платформы

Speech SDK для C# совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите Microsoft распространяемый компонент Visual C++ для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

Пакет SDK службы "Речь" для C# поддерживает только следующие дистрибутивы архитектур x64, ARM32 и ARM64:

Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0

Внимание

Используйте последний выпуск LTS дистрибутива Linux. Например, если вы работаете с Ubuntu 20.04 LTS, используйте последний выпуск Ubuntu 20.04.X.

Пакет SDK для речи зависит от следующих системных библиотек Linux:

Общие библиотеки библиотеки GNU C, включая библиотеку программирования потоков POSIX. libpthreads
Библиотека OpenSSL версии 1.x () или 3.x (libssl1libssl3) и сертификаты (ca-certificates).
Общая библиотека для приложений ALSA (libasound2).

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget

Выполните следующие команды.

sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget

Установка пакета SDK службы "Речь" для C#

Пакет Speech SDK для C# доступен как пакет NuGet и поддерживает .NET Standard 2.0. Дополнительные сведения см. в статье Microsoft.CognitiveServices.Speech.

Терминал
PowerShell

Пакет SDK для распознавания речи на C# можно установить в .NET CLI с помощью следующей dotnet add команды:

dotnet add package Microsoft.CognitiveServices.Speech

Пакет SDK службы "Речь" для C# можно установить с помощью следующей Install-Package команды:

Install-Package Microsoft.CognitiveServices.Speech

Справочная документация | Пакет NuGet | Дополнительные примеры на GitHub

В этом быстром запуске вы установите Speech SDK для C++.

Требования платформы

SDK для работы с речью на C++ совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите пакет Microsoft Visual C++ Redistributable для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

Пакет SDK службы "Речь" для C++ поддерживает только следующие дистрибутивы архитектур x64, ARM32 и ARM64:

Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0

Внимание

Используйте последний выпуск LTS дистрибутива Linux. Например, если вы работаете с Ubuntu 20.04 LTS, используйте последний выпуск Ubuntu 20.04.X.

SDK Speech зависит от следующих системных библиотек Linux:

Общие библиотеки библиотеки GNU C, включая библиотеку программирования потоков POSIX. libpthreads
Библиотека OpenSSL версии 1.x () или 3.x (libssl1libssl3) и сертификаты (ca-certificates).
Общая библиотека для приложений ALSA (libasound2).

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget

Выполните следующие команды.

sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget

Установите Speech SDK для C++

Пакет Speech SDK для C++ доступен в виде пакета NuGet. Дополнительные сведения см. в статье Microsoft.CognitiveServices.Speech.

Терминал
PowerShell

Пакет SDK для работы с речью в C++ можно установить из .NET CLI с помощью следующей команды dotnet add:

dotnet add package Microsoft.CognitiveServices.Speech

Пакет SDK службы "Речь" для C++ можно установить с помощью следующей Install-Package команды:

Install-Package Microsoft.CognitiveServices.Speech

Вы можете воспользоваться этими руководствами для получения дополнительных параметров.

Это руководство объясняет, как установить Speech SDK для Linux.

Чтобы загрузить и установить пакет SDK, выполните следующие действия. Эти шаги включают скачивание необходимых библиотек и файлов заголовков в виде файла .tar.

Выберите каталог для файлов SDK голосовых технологий. SPEECHSDK_ROOT Задайте переменную среды, чтобы указать этот каталог. Эта переменная упрощает подключение к каталогу в будущих командах.

Чтобы использовать каталог speechsdk в вашем домашнем каталоге, выполните следующую команду:
```
export SPEECHSDK_ROOT="$HOME/speechsdk"
```
Создайте каталог, если он не существует:
```
mkdir -p "$SPEECHSDK_ROOT"
```
Скачайте и извлеките архив .tar.gz, содержащий двоичные файлы пакета SDK для распознавания речи.
```
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
```

Проверьте содержимое каталога верхнего уровня извлеченного пакета.

ls -l "$SPEECHSDK_ROOT"

Список каталогов должен содержать уведомления партнера и файлы лицензий. В списке также должен содержаться каталог include, содержащий файлы заголовков (.h) и каталог lib, содержащий библиотеки для arm32, arm64, x64 и x86.

Путь	Описание
license.md	Лицензия
ThirdPartyNotices.md	Уведомления о партнерах
REDIST.txt	Уведомление о повторном распространении
include	Необходимые файлы заголовков для C++
lib/arm32	Собственная библиотека для ARM32, необходимая для привязки приложения
lib/arm64	Собственная библиотека для ARM64, необходимая для привязки приложения
lib/x64	Собственная библиотека для 64-разрядной ОС, необходимая для привязки приложения
lib/x86	Собственная библиотека для 32-разрядной ОС, необходимая для привязки приложения

В этом руководстве объясняется, как установить пакет SDK для службы "Речь" для C++ в macOS 10.14 и более поздней версии. Эти шаги включают скачивание необходимых библиотек и файлов заголовков в виде файла .zip.

Выберите каталог для файлов пакета SDK "Речь". SPEECHSDK_ROOT Задайте переменную среды, чтобы указать этот каталог. Эта переменная упрощает подключение к каталогу в будущих командах.

Чтобы использовать каталог speechsdk в домашнем каталоге, выполните следующую команду:
```
export SPEECHSDK_ROOT="$HOME/speechsdk"
```
Создайте каталог, если он не существует:
```
mkdir -p "$SPEECHSDK_ROOT"
```
Скачайте архив .zip и извлеките его, содержащий XCFramework для SDK службы "Речь".
```
wget -O SpeechSDK-macOS.zip https://aka.ms/csspeech/macosbinary
unzip SpeechSDK-macOS.zip -d "$SPEECHSDK_ROOT"
```
Проверьте содержимое каталога верхнего уровня извлеченного пакета.
```
ls -l "$SPEECHSDK_ROOT"
```
Список каталогов должен содержать уведомление партнера, файлы лицензий и каталог MicrosoftCognitiveServicesSpeech.xcframework .

Здесь также описано, как установить пакет SDK службы "Речь" для C++ в операционных системах Windows для настольных компьютеров.

Для работы с этим руководством по настройке требуется следующее:

Microsoft Распространяемый компонент Visual C++ для Visual Studio для платформы Windows. При первой установке может потребоваться перезагрузка.
Visual Studio.

Создайте проект в Visual Studio и установите SDK для распознавания речи

Чтобы создать проект Visual Studio для разработки классических приложений C++, вам потребуется выполнить следующие действия.

Настройка параметров разработки Visual Studio.
Создание проекта.
Выбор целевой архитектуры.
Установите SDK для распознавания речи.

Настройка параметров разработки Visual Studio

Для начала убедитесь, что вы правильно настроили Visual Studio для разработки рабочего стола C++:

Откройте Visual Studio 2019 для отображения окна "Запуск".
Выберите Продолжить без кода для перехода в интегрированную среду разработки Visual Studio.
В строке меню Visual Studio выберите Инструменты>Получить инструменты и функции, чтобы открыть Visual Studio Installer и просмотреть диалоговое окно Изменение.
На вкладке Рабочие нагрузки в Windows найдите рабочую нагрузку Разработка классических приложений на C++. Если эта рабочая нагрузка еще не выбрана, выберите ее.
На вкладке "Отдельные компоненты" найдите диспетчер пакетов NuGet. Если он еще не выбран, выберите его.
Выберите "Закрыть" или "Изменить". Имя кнопки зависит от того, были ли выбраны компоненты для установки.

Если вы выбрали Изменить, начнется установка, что может занять некоторое время.
Закройте Visual Studio Installer.

Создание проекта

Далее создайте проект и выберите целевую архитектуру:

В меню Visual Studio выберите "Файл>нового проекта>, чтобы отобразить окно создания проекта.
Найдите и выберите Консольное приложение. Убедитесь, что выбрана версия C++ этого типа проекта (не C# или Visual Basic).
Выберите Далее.
В диалоговом окне "Настройка нового проекта" в имени проекта введите helloworld.
В расположении перейдите к папке и выберите или создайте папку, в которой вы хотите сохранить проект, а затем нажмите кнопку "Создать".
Выберите архитектуру целевой платформы. На панели инструментов Visual Studio найдите раскрывающийся список платформ решений. Если вы не видите его, выберите Просмотр>Панели инструментов>Стандартная, чтобы отобразить панель инструментов с элементом Платформы решения.

Если вы используете 64-разрядную версию Windows, выберите x64 в раскрывающемся списке. В 64-битной версии Windows также можно запускать 32-битные приложения, поэтому при желании можно выбрать вариант x86.

Установите пакет SDK для работы с речью с помощью Visual Studio

Наконец, установите пакет NuGet Speech SDK и укажите на него ссылку в своем проекте:

В Обозревателе решений щелкните решение правой кнопкой мыши и выберите пункт Управление пакетами NuGet для решения, чтобы перейти в окно NuGet — решение.
Выберите Обзор.
В списке Источник пакета выберите nuget.org.
В поле поиска введите Microsoft.CognitiveServices.Speech. Выберите этот пакет, когда он появится в результатах поиска.
В области "Состояние пакета" рядом с результатами поиска выберите проект helloworld.
Выберите Установить.
В диалоговом окне Просмотр изменений нажмите ОК.
В диалоговом окне Принятие условий лицензионного соглашения просмотрите лицензию, а затем выберите Я принимаю. Начнется установка пакета. и после завершения установки в области Вывод отобразится сообщение следующего вида: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld.

Справочная документация | Пакет (Go) | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите SDK для работы с речью для Go.

Требования платформы

SDK для речи на Go поддерживает следующие дистрибутивы на архитектуре x64:

Ubuntu 20.04/22.04/24.04
Debian 11/12

Внимание

Используйте последний выпуск LTS дистрибутива Linux. Например, если вы работаете с Ubuntu 20.04 LTS, используйте последний выпуск Ubuntu 20.04.X.

Пакет Речевой SDK зависит от следующих системных библиотек Linux:

Общие библиотеки библиотеки GNU C, включая библиотеку программирования потоков POSIX. libpthreads
Библиотека OpenSSL версии 1.x () или 3.x (libssl1libssl3) и сертификаты (ca-certificates).
Общая библиотека для приложений ALSA (libasound2).

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget

Выполните следующие команды.

sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget

Установите двоичный файл Go версии 1.13 или более поздней.

Установка SDK пакета для работы с речью в Go

Чтобы загрузить и установить пакет SDK, выполните следующие действия. Эти шаги включают скачивание необходимых библиотек и файлов заголовков в виде файла .tar.

Выберите каталог для файлов пакета SDK службы "Речь". SPEECHSDK_ROOT Задайте переменную среды, чтобы указать этот каталог. Эта переменная упрощает подключение к каталогу в будущих командах.

Чтобы использовать каталог speechsdk в вашем домашнем каталоге, выполните следующую команду:
```
export SPEECHSDK_ROOT="$HOME/speechsdk"
```
Создайте каталог, если он не существует:
```
mkdir -p "$SPEECHSDK_ROOT"
```

Скачайте и извлеките архив .tar.gz, содержащий двоичные файлы Speech SDK.

wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"

Проверьте содержимое каталога верхнего уровня извлеченного пакета.

ls -l "$SPEECHSDK_ROOT"

Список каталогов должен содержать уведомления партнера и файлы лицензий. В списке также должен содержаться каталог include, содержащий файлы заголовков (.h), и каталог lib, содержащий библиотеки для arm32, arm64, x64 и x86.

Путь	Описание
license.md	Лицензия
ThirdPartyNotices.md	Уведомления о партнерах
REDIST.txt	Уведомление о повторном распространении
include	Необходимые файлы заголовков для C++
lib/arm32	Собственная библиотека для ARM32, необходимая для привязки приложения
lib/arm64	Собственная библиотека для ARM64, необходимая для привязки приложения
lib/x64	Собственная библиотека для 64-разрядной ОС, необходимая для привязки приложения
lib/x86	Собственная библиотека для 32-разрядной ОС, необходимая для привязки приложения

Настройка среды Go

Чтобы настроить среду Go для поиска Speech SDK, выполните следующие действия.

Так как привязки зависят от cgo, вам нужно задать переменные среды, чтобы помочь Go найти пакет SDK.
```
export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
```
Внимание

Замените <architecture> на архитектуру процессора вашего ЦП: x64, arm32 или arm64.
Для запуска приложений и пакета SDK нужно сообщить операционной системе, где найти библиотеки.
```
export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
```
Внимание

Замените <architecture> на архитектуру процессора вашего ЦП: x64, arm32 или arm64.

Справочная документация | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите Speech SDK для Java.

Требования платформы

Выберите целевую среду:

Среда выполнения Java
Android

Пакет SDK службы "Речь" для Java совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите Пакет перераспределения Microsoft Visual C++ для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

SDK для распознавания речи для Java не поддерживает Windows на ARM64.

Пакет SDK службы "Речь" для Java поддерживает следующие дистрибутивы архитектур x64, ARM32 и ARM64:

Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0

Внимание

Используйте последний выпуск LTS дистрибутива Linux. Например, если вы работаете с Ubuntu 20.04 LTS, используйте последний выпуск Ubuntu 20.04.X.

Пакет SDK для синтеза речи зависит от следующих системных библиотек Linux:

Общие библиотеки библиотеки GNU C, включая библиотеку программирования потоков POSIX. libpthreads
Библиотека OpenSSL версии 1.x () или 3.x (libssl1libssl3) и сертификаты (ca-certificates).
Общая библиотека для приложений ALSA (libasound2).

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget

Выполните следующие команды.

sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget

Установите пакет средств разработки Java, например Azul Zulu OpenJDK. Также может работать Microsoft Build of OpenJDK или предпочтительный JDK.

Установите пакет SDK для обработки речи для Java

Некоторые инструкции используют определенную версию пакета SDK, например 1.43.0. Чтобы проверить последнюю версию, выполните поиск в нашем репозитории GitHub.

Выберите целевую среду:

Среда выполнения Java
Android

В этом руководстве объясняется, как установить Speech SDK для Java на Java Runtime.

Поддерживаемые операционные системы

Пакет SDK для распознавания речи для Java поддерживается на следующих операционных системах:

Windows — только 64-разрядная.
Mac — macOS X версии 10.14 или более поздней.
Linux: см. поддерживаемые дистрибутивы Linux и целевые архитектуры.

Установите SDK для Java 'Speech' с помощью Apache Maven, выполнив следующие шаги:

Установите Apache Maven.
Откройте командную строку, в которой хотите создать проект, и создайте файл pom.xml .

Скопируйте следующее XML-содержимое в pom.xml:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
    <artifactId>quickstart-eclipse</artifactId>
    <version>1.0.0-SNAPSHOT</version>
    <build>
        <sourceDirectory>src</sourceDirectory>
        <plugins>
        <plugin>
            <artifactId>maven-compiler-plugin</artifactId>
            <version>3.7.0</version>
            <configuration>
            <source>1.8</source>
            <target>1.8</target>
            </configuration>
        </plugin>
        </plugins>
    </build>
    <dependencies>
        <dependency>
        <groupId>com.microsoft.cognitiveservices.speech</groupId>
        <artifactId>client-sdk</artifactId>
        <version>1.43.0</version>
        </dependency>
    </dependencies>
</project>

Выполните следующую команду Maven, чтобы установить SDK для речи и все зависимости.
```
mvn clean dependency:copy-dependencies
```

Создайте проект в Eclipse и установите Speech SDK.

Установите интегрированную среду разработки Java Eclipse. Для этой интегрированной среды разработки требуется установить Java.
Запустите Eclipse.
В средстве запуска Eclipse в поле Рабочая область введите имя нового каталога рабочей области. Затем выберите Запустить.
После этого отобразится главное окно интегрированной среды разработки Eclipse. Если отобразится экран приветствия, закройте его.
В меню Eclipse выберите «Файл»>«Новый»>«Проект».
Откроется диалоговое окно Создание проекта . Выберите Проект Java и щелкните Далее.
Мастер создания нового проекта Java запускается. В поле Имя проекта введите quickstart. В качестве среды выполнения выберите JavaSE-1.8. Выберите Готово.
Если появится окно Open Associated Perspective? (Открыть связанную перспективу?), выберите Open Perspective (Открыть перспективу).
В обозревателе пакетов щелкните правой кнопкой мыши проект quickstart. Выберите "Настроить">"Преобразовать в проект Maven" в контекстном меню.
Откроется окно Create new POM (Создать новый POM). В поле Идентификатор группы введите com.microsoft.cognitiveservices.speech.samples, а в поле Идентификатор артефакта укажите quickstart. Выберите Готово.
Откройте файл pom.xml и измените его:
1. Добавьте элемент dependencies в конце файла перед закрывающим тегом </project>, с Speech SDK в качестве зависимости.
```
<dependencies>
  <dependency>
    <groupId>com.microsoft.cognitiveservices.speech</groupId>
    <artifactId>client-sdk</artifactId>
    <version>1.43.0</version>
  </dependency>
</dependencies>
```
1. Сохраните изменения.

Конфигурации Gradle

Для конфигураций Gradle требуется явная ссылка на расширение зависимостей .jar :

// build.gradle

dependencies {
    implementation group: 'com.microsoft.cognitiveservices.speech', name: 'client-sdk', version: "1.43.0", ext: "jar"
}

Справочная документация | Пакет (npm) | Дополнительные примеры на GitHub | Исходный код библиотеки

В этом руководстве для быстрого начала вы установите Speech SDK для JavaScript.

Пакет SDK службы "Речь" для JavaScript доступен в виде модуля npm. См. статью о microsoft-cognitiveservices-speech-sdk и его сопутствующем репозитории GitHub cognitive-services-speech-sdk-js.

Требования платформы

Изучите архитектурные последствия между Node.js и клиентскими веб-браузерами. Например, объектная модель документа (DOM) недоступна для серверных приложений. Node.js файловая система недоступна клиентским приложениям.

Установка пакета SDK "Речь" для JavaScript

В зависимости от целевой среды используйте одно из следующих руководств:

Node.js
На основе браузера

Здесь также описано, как установить пакет SDK службы "Речь" для JavaScript для использования с Node.js.

Установка Node.js.
Создайте каталог, выполните npm init и следуйте пошаговым инструкциям.
Чтобы установить SDK речевых служб для JavaScript, выполните следующую команду npm install.
```
npm install microsoft-cognitiveservices-speech-sdk
```

Дополнительные сведения см. на странице Примеры Node.js.

Здесь также описано, как установить пакет SDK службы "Речь" для JavaScript для использования с веб-страницей.

Распаковать в папку

Создайте пустую папку. Если вы хотите разместить пример на веб-сервере, убедитесь, что у этого веб-сервера есть доступ к созданной папке.
Скачайте пакет SDK для службы "Речь" как ZIP-файл и распакуйте его в созданную папку. Эти файлы распакованы:
- microsoft.cognitiveservices.speech.sdk.bundle.js — человеко-читаемая версия Speech SDK.
- microsoft.cognitiveservices.speech.sdk.bundle.js.map: файл карты, используемый для отладки кода пакета SDK.
- microsoft.cognitiveservices.speech.sdk.bundle.d.ts — определения объектов для использования с TypeScript;
- microsoft.cognitiveservices.speech.sdk.bundle-min.js — уменьшенная версия Speech SDK.
- speech-processor.js — код для повышения производительности в некоторых браузерах.
Создайте в папке файл с именем index.html и откройте его в текстовом редакторе.

Тег HTML-скрипта

Скачайте файл microsoft.cognitiveservices.speech.sdk.bundle.js и извлеките его из пакета SDK для JavaScript. Поместите этот файл в папку, доступную для HTML-файла.

<script src="microsoft.cognitiveservices.speech.sdk.bundle.js"></script>;

Совет

Если вы нацелены на веб-браузер и используете тег <script>, префикс sdk не требуется. Префикс sdk является псевдонимом для присвоения имени модулю require.

Кроме того, можно включить тег <script> напрямую в элемент HTML <head>, опираясь на JSDelivr.

<script src="https://cdn.jsdelivr.net/npm/microsoft-cognitiveservices-speech-sdk@latest/distrib/browser/microsoft.cognitiveservices.speech.sdk.bundle-min.js">
</script>

Дополнительные сведения см. в примерах на основе браузера.

Используйте Speech SDK

Добавьте следующий оператор импорта для использования "Speech SDK" в вашем проекте JavaScript:
```
import * as sdk from "microsoft-cognitiveservices-speech-sdk";
```

Дополнительные сведения о import см. в разделе Экспорт и импорт на веб-сайте JavaScript.

Кроме того, вы можете использовать оператор require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Справочный пакет документации | (скачивание) | Дополнительные примеры на GitHub

В этом кратком руководстве по началу работы вы установите SDK для распознавания речи для Objective-C.

Совет

Дополнительные сведения об использовании пакета SDK для речи Swift см. в статье Импорт Objective-C в Swift.

Пакет SDK службы "Речь" для Objective-C доступен изначально в виде пакета CocoaPod для систем на базе Mac x64 и ARM.

Требования к системе для Mac:

macOS 10.14 или более поздней версии

Пакет macOS CocoaPod доступен для скачивания и использования с интегрированной средой разработки Xcode 9.4.1 или более поздней версии.

Перейдите в каталог Xcode, где находится файл проекта Xcodeproj .
Выполните команду pod init , чтобы создать файл pod с именем Podfile.
Замените содержимое Podfile следующим содержимым. Обновите target с AppName на имя вашего приложения. При необходимости обновите версию платформы или pod.
```
platform :osx, 10.14
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
end
```
Выполните pod install, чтобы установить Speech SDK.

Кроме того, скачайте бинарный файл CocoaPod и извлеките его содержимое. В проекте Xcode добавьте ссылку на извлеченную папку MicrosoftCognitiveServicesSpeech.xcframework и ее содержимое.

Пакет Speech SDK для Objective-C доступен в виде родного пакета CocoaPod.

Требования к системе для iOS:

macOS 10.14 или более поздней версии
Ориентируйтесь на iOS 9.3 или более поздние версии

Пакет macOS CocoaPod доступен для скачивания и использования с интегрированной средой разработки Xcode 9.4.1 или более поздней версии.

Перейдите в каталог Xcode, где находится файл проекта Xcodeproj .
Выполните команду pod init , чтобы создать файл pod с именем Podfile.
Замените содержимое Podfile следующим содержимым. Измените target имя с AppName на имя вашего приложения. При необходимости обновите версию платформы или pod.
```
platform :ios, '9.3'
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.43.0'
end
```
Запустите pod install, чтобы установить SDK речи.

В качестве альтернативы, скачайте бинарный файл CocoaPod и извлеките его содержимое. В проекте Xcode добавьте ссылку на извлеченную папку MicrosoftCognitiveServicesSpeech.xcframework и ее содержимое.

Справочный пакет документации | (скачивание) | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите Speech SDK для Swift.

Совет

Дополнительную информацию об использовании Speech SDK для Swift, см. в разделе импорта Objective-C в Swift.

Установка SDK для распознавания речи для Swift

Mac
iOS

SDK для Speech для Swift доступен нативно как пакет CocoaPod для систем Mac x64 и ARM.

Требования к системе для Mac:

macOS 10.14 или более поздней версии

Пакет macOS CocoaPod доступен для скачивания и использования с интегрированной средой разработки Xcode 9.4.1 или более поздней версии.

Перейдите в каталог Xcode, где находится файл проекта Xcodeproj .
Выполните команду pod init , чтобы создать файл pod с именем Podfile.
Замените содержимое Podfile следующим содержимым. Обновите имя target с AppName на имя вашего приложения. Обновите версию платформы или pod, если это необходимо.
```
platform :osx, 10.14
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
end
```
Запустите pod install, чтобы установить Speech SDK.

Кроме того, скачайте двоичный файл CocoaPod и извлеките его содержимое. В проекте Xcode добавьте ссылку на извлеченную папку MicrosoftCognitiveServicesSpeech.xcframework и ее содержимое.

Пакет SDK для работы с речью на Swift доступен как локальный пакет CocoaPod.

Требования к системе для iOS:

macOS 10.14 или более поздней версии
Требуемая версия iOS 9.3 или более поздняя

Пакет macOS CocoaPod доступен для скачивания и использования с интегрированной средой разработки Xcode 9.4.1 или более поздней версии.

Перейдите в каталог Xcode, где находится файл проекта Xcodeproj .
Выполните команду pod init , чтобы создать файл pod с именем Podfile.
Замените содержимое Podfile следующим образом. Обновите target с AppName на имя вашего приложения. При необходимости обновите версию платформы или pod.
```
platform :ios, '9.3'
use_frameworks!

target 'AppName' do
  pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.43.0'
end
```
Выполните pod install, чтобы установить Speech SDK.

Кроме того, скачайте бинарный файл CocoaPod и извлеките его содержимое. В проекте Xcode добавьте ссылку на извлеченную папку MicrosoftCognitiveServicesSpeech.xcframework и ее содержимое.

Справочные примеры пакета документации | (PyPi) | Дополнительные примеры на GitHub

В этом кратком руководстве вы установите Speech SDK для Python.

Требования платформы

SDK для Python совместим с Windows, Linux и macOS.

В Windows необходимо использовать 64-разрядную целевую архитектуру. Требуется Windows 10 или более поздней версии.

Установите пакет Microsoft Visual C++ Redistributable для Visual Studio 2015, 2017, 2019 и 2022 для своей платформы. При первой установке этого пакета может потребоваться перезагрузка.

Внимание

Убедитесь, что установлены пакеты той же целевой архитектуры. Например, если установить распространяемый пакет x64, установите пакет x64 Python.

Пакет SDK службы "Речь" для Python поддерживает следующие дистрибутивы архитектур x64 и ARM64:

Ubuntu 20.04/22.04/24.04
Debian 11/12
Amazon Linux 2023
Azure Linux 3.0

Внимание

Используйте последний выпуск LTS дистрибутива Linux. Например, если вы работаете с Ubuntu 20.04 LTS, используйте последний выпуск Ubuntu 20.04.X.

SDK для распознавания речи зависит от следующих библиотек Linux:

Общие библиотеки библиотеки GNU C, включая библиотеку программирования потоков POSIX. libpthreads
Библиотека OpenSSL версии 1.x () или 3.x (libssl1libssl3) и сертификаты (ca-certificates).
Общая библиотека для приложений ALSA (libasound2).

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Выполните следующие команды.

sudo yum update
sudo yum install alsa-lib ca-certificates openssl wget

Выполните следующие команды.

sudo tdnf update
sudo tdnf install alsa-lib ca-certificates openssl wget

Установите версию Python с версии 3.8 или более поздней версии.

Чтобы проверить установку, откройте терминал и выполните команду python --version. Если Python установлен правильно, вы получите такой ответ Python 3.8.10.
Если вы используете macOS или Linux, вам может потребоваться выполнить команду python3 --version .

Чтобы включить использование python вместо python3, выполните команду alias python='python3' для настройки псевдонима. Примеры быстрого начала для Speech SDK указывают применение python.

Установка пакета SDK для распознавания речи для Python

Перед установкой пакета SDK службы распознавания речи для Python убедитесь, что выполнены требования к платформе.

PyPI
VS Code

Установка из PyPI

Чтобы установить пакет SDK для речи для Python, выполните эту команду в окне консоли.

pip install azure-cognitiveservices-speech

Обновление до новейшего речевого пакета SDK

Чтобы обновить пакет SDK для службы "Речь" до последней версии, выполните следующую команду в окне консоли:

pip install --upgrade azure-cognitiveservices-speech

Вы можете узнать, какая версия пакета SDK службы "Речь" для Python сейчас установлена, проверив переменную azure.cognitiveservices.speech.__version__. Например, выполните следующую команду в окне консоли:

pip list

Установка Speech SDK с помощью Visual Studio Code

Для установки Speech SDK для Python:

Скачайте и установите Visual Studio Code.
Запустите Visual Studio Code и установите расширение Python:
1. Выберите Файл >Параметры >Расширения.
2. Выполните поиск Python, найдите Расширение Python для Visual Studio Code, опубликованное корпорацией Майкрософт, и нажмите кнопку Установить.
Выберите Терминал >Новый терминал, чтобы открыть терминал в Visual Studio Code.
В терминале выполните следующую команду, чтобы установить пакет SDK для работы с речью в Python.
```
python -m pip install azure-cognitiveservices-speech
```

Дополнительные сведения о Visual Studio Code и Python см. в Visual Studio Code и Начало работы с Python в VS Code.

Используйте SDK для речи

Добавьте следующую инструкцию импорта, чтобы использовать пакет SDK "Speech" в вашем проекте на Python:

import azure.cognitiveservices.speech as speechsdk

Поделиться через

Требования платформы

Установка пакета SDK службы "Речь" для C#

Требования платформы

Установите Speech SDK для C++

Создайте проект в Visual Studio и установите SDK для распознавания речи

Настройка параметров разработки Visual Studio

Создание проекта

Установите пакет SDK для работы с речью с помощью Visual Studio

Требования платформы

Установка SDK пакета для работы с речью в Go

Настройка среды Go

Требования платформы

Установите пакет SDK для обработки речи для Java

Поддерживаемые операционные системы

Создайте проект в Eclipse и установите Speech SDK.

Конфигурации Gradle

Установите SDK "Речь" с помощью Android Studio

Создайте пустой проект.

Установка пакета SDK для речи на Java для Android

Требования платформы

Установка пакета SDK "Речь" для JavaScript

Распаковать в папку

Тег HTML-скрипта

Используйте Speech SDK

Установка Speech SDK для Objective-C

Установка SDK для распознавания речи для Swift

Требования платформы

Установка пакета SDK для распознавания речи для Python

Установка из PyPI

Обновление до новейшего речевого пакета SDK

Установка Speech SDK с помощью Visual Studio Code

Используйте SDK для речи

Поделиться через

Краткое руководство: Установка комплекта разработки программного обеспечения (SDK) для службы "Речь"

Требования платформы

Установка пакета SDK службы "Речь" для C#

Требования платформы

Установите Speech SDK для C++

Требования платформы

Установка SDK пакета для работы с речью в Go

Настройка среды Go

Требования платформы

Установите пакет SDK для обработки речи для Java

Поддерживаемые операционные системы

Требования платформы

Установка пакета SDK "Речь" для JavaScript

Используйте Speech SDK

Установка Speech SDK для Objective-C

Установка SDK для распознавания речи для Swift

Требования платформы

Установка пакета SDK для распознавания речи для Python

Установка из PyPI

Обновление до новейшего речевого пакета SDK

Используйте SDK для речи

Примеры кода

Связанный контент

Обратная связь

Дополнительные ресурсы