Поделиться через


Что такое голосовой помощник?

Используя голосовых помощников со службой "Речь", разработчики могут создать естественные и привычные для человека разговорные функции для своих приложений и возможностей. Служба голосового помощника обеспечивает быстрое, надежное взаимодействие между устройством и реализацией помощника.

Выбор решения помощника

Первым этапом создания голосового помощника является принятие решения о том, что вы от него хотите. Служба "Речь" предоставляет несколько дополнительных решений для создания взаимодействий с помощником. Возможно, вы хотите, чтобы ваше приложение поддерживало открытый разговор с фразами, такими как "Мне нужно пойти в Сиэтл" или "Какой вид пиццы можно заказать?"

Эталонная архитектура для создания голосового помощника с помощью пакета SDK службы "Речь"

Концептуальная схема потока службы оркестрации голосового помощника.

Основные возможности

Если вы выбираете пользовательское ключевое слово или другое решение для создания взаимодействия помощника, вы можете использовать широкий набор функций настройки, чтобы настроить помощника на ваш бренд, продукт и личность.

Категория Компоненты
Пользовательские ключевые слова Пользователи могут начать диалог с помощниками с помощью пользовательского ключевого слова, например "Эй Contoso". Приложение делает это с помощью настраиваемого механизма ключевых слов в пакете SDK службы "Речь", который можно настроить, перейдя в Начало работы с пользовательскими ключевыми словами. Голосовые помощники могут использовать проверку ключевых слов на стороне службы для повышения точности активации ключевых слов (в отличие от использования только устройства).
Речь к тексту Голосовые помощники преобразуют звук в распознанный текст в режиме реального времени с помощью речи в текст из службы "Речь". Этот текст расшифровывается как для реализованного решения помощника, так и для клиентского приложения.
Текст в речь Текстовые ответы от помощника синтезируются с помощью текста в речь из службы "Речь". Затем этот синтез становится доступным для клиентского приложения в виде аудиопотока. Корпорация Майкрософт предлагает возможность создавать собственный собственный, высококачественный нейронный текст для речи (Нейронный TTS), который дает голос вашему бренду.

Пример кода и учебники

Пример кода для создания голосового помощника доступен на сайте GitHub в Azure-Samples/Cognitive-Services-Voice-Assistant.

Пользовательская настройка

Речевые помощники, созданные с помощью речевой службы, могут использовать полный спектр вариантов настройки.

Примечание.

Параметры настройки зависят от языка или языкового стандарта. Дополнительные сведения см. в разделе Поддерживаемые языки.