Создание речи распознавания с одним снимком в текстовом приложении

5 мин

В предыдущем упражнении вы узнали, как создать учетную запись служб искусственного интеллекта Azure с помощью Azure CLI. Теперь, когда у вас есть учетная запись служб искусственного интеллекта Azure, с которой необходимо работать, вы можете начать работу с речью в текстовом приложении.

Вашей первой задачей является создание приложения, которое ваша компания может использовать для транскрибирования кратких замечаний от ваших медицинских клиентов. Службы ИИ Azure предоставляют два различных типа распознавания речи, которые можно использовать для разработки:

Однокамерное распознавание
- Однозастрелочное распознавание прослушивает перерыв в звуке, а затем останавливает распознавание и обрабатывает только не более 15 секунд звука.
- Этот тип распознавания будет работать хорошо для кратких заметит, что медицинские клиенты вашей компании предоставляют, но он не будет работать в течение более длительных диктовок.
- Распознавание с одним снимком проще реализовать в приложении, но у вас меньше контроля.
Непрерывное распознавание
- Непрерывное распознавание будет продолжать прослушивать до тех пор, пока не будет остановлено распознавание.
- Этот тип распознавания хорошо подходит как для краткой записки, так и для более длинных диктовок.
- Для непрерывного распознавания требуется больше кода для реализации в приложении, но у вас есть больше элементов управления.

В следующем упражнении вы будете использовать однократное распознавание для создания приложения, которое можно использовать для транскрибирования кратких замечаний от медицинских клиентов вашей компании. Далее в этом модуле вы будете использовать непрерывное распознавание для создания приложения, которое можно использовать для транскрибирования кратких замечаний и более длинных диктовок.

Создание приложения с помощью однократного распознавания для транскрибирования звуковых файлов

Чтобы создать приложение, которое преобразует речь в текст с помощью распознавания единого снимка службы "Речь Azure", приложение будет выполнять все следующие задачи:

Microsoft.CognitiveServices.Speech Включите пакет.
Создайте класс с помощью ключа API из учетной SpeechConfig записи служб ИИ Azure.
AudioConfig Создайте класс с помощью ФАЙЛА WAVE в качестве источника.
SpeechRecognizer Создайте класс с помощью SpeechConfig и AudioConfig классов.
RecognizeOnceAsync() Вызовите метод SpeechRecognizer класса, чтобы преобразовать речь в текст.
StreamWriter Создайте класс для записи преобразованного текста в файл.

В следующем упражнении мы подробно рассмотрим все эти шаги.

Создание речи распознавания с одним снимком в текстовом приложении

Создание приложения с помощью однократного распознавания для транскрибирования звуковых файлов

Обратная связь