Введение

Завершено

Возможности распознавания речи искусственного интеллекта позволяют нам управлять домашними и автоматическими системами с помощью голосовых инструкций, получать ответы от компьютеров для речевых вопросов, создавать подписи из звука и многое другое.

Чтобы включить такое взаимодействие, система ИИ должна поддерживать по крайней мере две возможности:

  • Распознавание речи — возможность обнаруживать и интерпретировать речевые входные данные
  • Синтез речи — возможность генерировать речевые выходные данные

Распознавание речи и синтез речи в Azure обеспечивает речь, текст в речь и возможности перевода речи. Вы можете использовать предварительно созданные и пользовательские модели службы "Речь" для различных задач, от транскрибирования звука к тексту с высокой точностью, идентификации динамиков в беседах, создания пользовательских голосов и т. д. Далее вы узнаете, как работают возможности распознавания речи СИ.