Введение
Предположим, вы разработчик, который работает для медицинской транскрибирования компании. Клиенты вашей компании являются командой врачей, которые записывают свои заметки в виде аудиофайлов на портативных цифровых записей голосовых записей. Они делятся своими файлами с вашей компанией через общий облачный диск, и их заметки являются сочетанием кратких заметок и более длинных диктовок.
Ваша компания должна поддерживать большой персонал транскрибов, и эти два типа аудиофайлов представляют интересные проблемы для вашей компании:
Для транскриберов вашей компании требуется много времени для обработки объема кратких замечений от клиентов, поэтому трудно вернуть транскрибирование в течение определенного времени в соглашении об уровне обслуживания вашей компании (SLA).
Более длинные диктовки часто не могут быть транскрибированы в одном сеансе, и транскрибы вашей компании трудно помнить, где они остались в течение предыдущего сеанса.
Вы слышали, что службы искусственного интеллекта Microsoft Azure предоставляют разработчикам API-интерфейсы для создания приложений, которые используют возможности распознавания речи Azure к текстовым функциям, и ваш менеджер попросил вас изучить, как использовать речь к текстовым функциям, чтобы создать приложение, которое можно использовать для смещения некоторых задач транскрибирования, тем самым упростив некоторые из ваших операционных затрат и проблем соглашения на уровне обслуживания.
В этом модуле вы узнаете, как использовать службы искусственного интеллекта Azure для создания речи в текстовое приложение, которое преобразует образец ФАЙЛА WAVE в текст.