Поделиться через


Термины и определения, используемые в распознавании устной речи

В этой статье содержатся сведения о некоторых определениях и терминах, которые могут вам встретиться при использовании распознавания устной речи.

Объект

Сущности — это слова в речевых фрагментах, описывающие сведения, которые используются для выполнения или обнаружения намерений. Если сущность является сложной и вы хотите, чтобы ваша модель определяла ее отдельные части, модель можно разбить на вложенные сущности. Например, модель можно использовать для прогнозирования адреса, а также таких вложенных сущностей, как улица, город, регион и почтовый индекс.

Оценка F1

Показатель F1 зависит от точности и полноты. Она необходима при поиске баланса между точностью и полнотой.

Намерение

Намерение представляет задачу или действие, которое хочет выполнить пользователь. Это цель, выраженная во введенных пользователем данных, например бронирование авиабилета или оплата счета.

Сущность списка

Сущность списка представляет собой фиксированный замкнутый набор связанных слов вместе с синонимами. Сущности списков — это точные совпадения, в отличие сущностей машинного обучения.

Сущность прогнозируется, если слово в сущности списка входит в список. Например, если есть сущность списка с "размер" и в списке есть слова "малый", "средний", "большой", то сущность размера будет прогнозироваться для всех речевых фрагментов, где используются слова "малый", "средний" и "большой" независимо от контекста.

Модель

Модель — это объект, обученный для выполнения определенной задачи, в нашем случае — распознавания устной речи. Для обучения модели используются данные с метками, чтобы их затем можно было использовать для распознавания речевых фрагментов.

  • Оценка модели — это процесс, который выполняется сразу после обучения для определения уровня производительности модели.
  • Развертывание — это процесс назначения модели развертыванию, чтобы сделать ее доступной для использования с помощью API прогнозирования.

Переобучение

Переполнение происходит, когда модель исправляется в конкретных примерах и не может хорошо обобщать.

Точность

Измеряет, насколько точна модель. Представляет собой соотношение между правильно определенными положительными (истинноположительными) результатами и всеми определенными положительными результатами. Метрика точности показывает, сколько из спрогнозированных классов правильно помечено метками.

Project

Проект — это рабочая область для создания настраиваемых моделей машинного обучения на основе данных. Получить доступ к вашему проекту можете только вы, а также другие пользователи, у которых есть доступ к используемому ресурсу Azure.

Отзыв

Измеряет способность модели прогнозировать фактические положительные классы. Это отношение между спрогнозированными истинноположительными результатами и фактически помеченными значениями. Метрика полноты показывает, сколько из прогнозируемых классов определено верно.

Регулярное выражение

Сущность регулярного выражения представляет регулярное выражение. Сущности регулярного выражения — это точные совпадения.

Схема

Схема определяется как сочетание намерений в проекте. Проектирование схемы является неотъемлемой частью успеха проекта. При создании схемы необходимо подумать о том, какие намерения и сущности должны быть включены в проект.

Данные обучения

Обучающие данные — это набор информации, необходимой для обучения модели.

Фраза

Речевой фрагмент — это входные данные пользователя, которые представляют собой короткий текст фразы в диалоге. Это фраза естественного языка, например "книга 2 билета в Сиэтл в следующий вторник". Примеры речевых фрагментов добавляются для обучения модели, и модель во время выполнения делает прогнозы на основе новых фрагментов.

Следующие шаги