Введение
Возможности распознавания речи искусственного интеллекта позволяют нам управлять домашними и автоматическими системами с помощью голосовых инструкций, получать ответы от компьютеров для речевых вопросов, создавать подписи из звука и многое другое.
Чтобы включить такое взаимодействие, система ИИ должна поддерживать по крайней мере две возможности:
- Распознавание речи — возможность обнаруживать и интерпретировать речевые входные данные
- Синтез речи — возможность генерировать речевые выходные данные
Распознавание речи и синтез речи в Azure обеспечивает речь, текст в речь и возможности перевода речи. Вы можете использовать предварительно созданные и пользовательские модели службы "Речь" для различных задач, от транскрибирования звука к тексту с высокой точностью, идентификации динамиков в беседах, создания пользовательских голосов и т. д. Далее вы узнаете, как работают возможности распознавания речи СИ.