Основные понятия и определения глоссария Интеллектуальной службы распознавания речи (LUIS)
Внимание
LUIS будет прекращена 1 октября 2025 г. и с 1 апреля 2023 г. вы не сможете создать новые ресурсы LUIS. Мы рекомендуем перенести приложения LUIS в понимание общения, чтобы воспользоваться продолжением поддержки продуктов и многоязычными возможностями.
В глоссарии Интеллектуальной службы распознавания речи (LUIS) объясняются термины, с которыми вы можете столкнуться при работе со службой LUIS.
Активная версия
Активная версия — это версия приложения, которая обновляется при внесении изменений в модель с помощью портала LUIS. На портале LUIS, если вы хотите внести изменения в версию, которая не является активной, необходимо сначала установить эту версию как активную.
Активное обучение
Активное обучение — это методика машинного обучения, в которой модель машинного обучения используется для поиска информативных новых примеров с целью их маркировки. В LUIS активное обучение означает добавление речевых фрагментов из трафика конечной точки, для которых текущие прогнозы неясны, для улучшения модели. Выберите "Просмотреть речевые фрагменты конечной точки", чтобы просмотреть речевые фрагменты для метки.
См. также:
- Концептуальные сведения
- Пособие по проверке речевых фрагментов конечной точки
- Улучшение приложения LUIS путем проверки речевых фрагментов конечной точки
Приложение
В LUIS приложение или приложение — это коллекция моделей, созданных на основе одного набора данных, которая работает вместе для прогнозирования намерений и сущностей для определенного сценария. У каждого приложения собственная конечная точка прогнозирования.
Если вы создаете бот для отдела кадров, у вас может быть набор намерений, таких как "Назначить отгул", "Узнать о льготах" или "Обновить персональные данные", а также сущностей для каждого из этих намерений, и они будут сгруппированы в одно приложение.
Разработка
Разработка — это возможность создания, развертывания приложения LUIS и управления им с помощью портала LUIS или API-интерфейсов разработки.
Ключ разработки
Для создания разработки используется ключ разработки. Не используется для запросов конечной точки рабочего уровня. Дополнительные сведения приведены в статье Ограничения ресурсов.
Ресурс разработки
Ресурсом разработки LUIS называется управляемый элемент, доступный в Azure. Ресурс обеспечивает доступ к связанным функциям разработки, обучения и публикации службы Azure. Ресурс включает проверку подлинности, авторизацию и сведения о безопасности, необходимые для доступа к связанной службе Azure.
Ресурс для разработки имеет тип Azure LUIS-Authoring
.
Пакетное тестирование
Пакетное тестирование — это возможность проверить модели текущего приложения LUIS с помощью единообразного и известного тестового набора пользовательских речевых фрагментов. Пакетный тест определяется в отформатированном JSON-файле.
См. также:
- Основные понятия
- Практическое руководство по пакетному тестированию
- Руководство: создание и запуск пакетного теста
F-мера
В пакетном тестировании это измерение точности теста.
Ложноотрицательный результат
В пакетном тестировании точка данных представляет высказывания, в которых приложение неверно спрогнозировало отсутствие целевого намерения или сущности.
Ложноположительный результат
В пакетном тестировании точка данных представляет высказывания, в которых приложение неверно спрогнозировало наличие целевого намерения или сущности.
Точность
В пакетном тестировании точность (также называемая положительным значением прогнозирования) представляет собой долю соответствующих высказываний в извлеченных высказываниях.
Примером пакетного теста для животных является предсказанное количество овец, разделенное на общее число животных (овец и других животных).
Отзыв
В пакетном тестировании отзыв (также известный как чувствительность) представляет собой возможность LUIS, которая состоит в подготовке к использованию.
Примером пакетного теста для животных является предсказанное количество овец, разделенное на общее число доступных овец.
Истинно отрицательный результат
Истинный отрицательный результат возникает, когда приложение правильно прогнозирует несовпадение. При пакетном тестировании истинное отрицательное происходит, когда приложение прогнозирует намерение или сущность для примера, не помеченного этим намерением или сущностью.
Истинно положительный результат
Истинный положительный результат возникает, когда приложение правильно прогнозирует соответствие. В пакетном тестировании истинный положительный результат возникает, когда приложение прогнозирует намерение или сущность для примера, помеченного этим намерением или сущностью.
Классификатор
Классификатор — это модель машинного обучения, которая прогнозирует, к какой категории или классу относятся входные данные.
Примером классификатора является намерение.
Collaborator
Участник совместной работы — то же самое, что и просто участник. Участник совместной работы получает доступ, когда владелец добавляет адрес электронной почты участника в приложение, не охваченное системой управления доступом на основе ролей Azure (Azure RBAC). Если вы еще используете схему участников, вам необходимо выполнить миграцию учетной записи LUIS и использовать ресурсы для разработки LUIS для управления соавторами с помощью Azure RBAC.
Участник
Участник не является владельцем приложения, но имеет те же разрешения для добавления, редактирования и удаления намерений, сущностей, речевых фрагментов. Участник предоставляет права на управление доступом на основе ролей Azure (Azure RBAC) приложению LUIS.
См. также:
- Практическое руководство по добавлению участников
Дескриптор
Дескриптор — это термин, который ранее использовался для признакамашинного обучения.
Домен
В контексте LUIS предметная область — это область знаний. Предметная область относится к определенному сценарию. Разные предметные области используют определенный язык и терминологию, имеющие значение в их контексте. Например, если вы создаете приложение для воспроизведения музыки, в вашем приложении будет термины, характерные для музыки, такие как песня, трек, альбом, стихи, исполнитель. Примеры предметных областей см. в разделе готовых предметных областей.
Конечная точка
Конечная точка разработки
URL-адрес конечной точки разработки LUIS — это место для создания, обучения и публикации приложения. В URL-адресе конечной точки указаны регион опубликованного приложения, а также его идентификатор.
Дополнительные сведения о разработке приложения программным способом можно найти в справочнике для разработчика
Конечная точка прогнозирования
На URL-адрес конечной точки прогнозирования LUIS отправляются запросы LUIS после разработки и публикации приложения LUIS. В URL-адресе конечной точки указаны регион опубликованного приложения, а также его идентификатор. Конечную точку можно найти на странице ресурсов Azure приложения. Кроме того, URL-адрес конечной точки можно получить из API получения сведений о приложении.
Для доступа к конечной точке прогнозирования нужен ключ прогнозирования LUIS.
Объект
Сущности — это слова в речевых фрагментах, описывающие сведения, которые используются для выполнения или обнаружения намерений. Если сущность является сложной и вы хотите, чтобы ваша модель определяла ее отдельные части, модель можно разбить на вложенные сущности. Например, модель можно использовать для прогнозирования адреса, а также таких вложенных сущностей, как улица, город, регион и почтовый индекс. Сущности также могут использоваться в качестве признаков для моделей. Ответ от приложения LUIS включает как прогнозируемые намерения, так и все сущности.
Средство извлечения сущностей
Средство извлечения сущностей — это тип модели машинного обучения, которую LUIS использует для прогнозирования сущностей.
Схема сущности
Схема сущности — это структура, которую вы определяете для сущностей машинного обучения вместе с вложенными сущностями. Конечная точка прогнозирования возвращает все извлеченные сущности, а также вложенные сущности, определенные в схеме.
Вложенная сущность
Вложенная сущность — это дочерняя сущность сущности машинного обучения.
Сущность, не относящаяся к машинному обучению
Сущность, которая использует сопоставление текста для извлечения данных:
- Сущность списка
- Сущность регулярного выражения
Сущность списка
Сущность списка представляет собой фиксированный замкнутый набор связанных слов вместе с синонимами. Сущности списков — это точные совпадения, в отличие сущностей машинного обучения.
Сущность прогнозируется, если слово в сущности списка входит в список. Например, если у вас есть сущность списка "размер", и в списке есть слова "малый, средний, большой", то сущность размера будет прогнозироваться для всех речевых фрагментов, где используются слова "малый", "средний" или "большой" независимо от контекста.
Регулярное выражение
Сущность регулярного выражения представляет регулярное выражение. Сущности регулярных выражений — это точные совпадения, в отличие от сущностей машинного обучения.
Предварительно созданная сущность
См. запись предварительно созданной модели для предварительно созданной сущности.
Функции
В машинном обучении признак — это характеристика, которая помогает модели распознать определенную концепцию. Это указание, которое LUIS может использовать, но оно не является жестким правилом.
Другой термин для этого понятия — признак машинного обучения.
Эти указания используются с метками, чтобы узнать, как прогнозировать новые данные. В приложении LUIS в качестве признаков поддерживаются как списки фраз, так и другие модели.
Обязательный компонент
Обязательный признак — это способ ограничить выходные данные модели LUIS. Если признак для сущности помечен как обязательный, этот признак должна присутствовать в примере для прогнозируемой сущности независимо от того, что именно прогнозирует модель машинного обучения.
Рассмотрим пример, где есть предварительно сформированный числовой признак, помеченный как обязательный в сущности "Количество" для бота заказа по меню. Когда бот встречает фразу I want a bajillion large pizzas?
, слово bajillion не будет спрогнозировано как количество независимо от контекста, в котором оно появляется. Bajillion не является допустимым числом и не будет предсказан предварительно созданной сущностью.
Намерение
Намерение представляет задачу или действие, которое хочет выполнить пользователь. Это цель, выраженная во введенных пользователем данных, например бронирование авиабилета или оплата счета. В LUIS высказывание в целом классифицируется как намерение, но части речевых фрагментов извлекаются как сущности.
Примеры маркировки
Размера или маркировка — это процесс связывания положительного или отрицательного примера с моделью.
Маркировка для намерений
В LUIS намерения в приложении являются взаимоисключающими. Это означает, что при добавлении речевого фрагмента к намерению он считается положительным примером для этого намерения и отрицательным для всех остальных намерений. Отрицательные примеры не следует путать с намерением None, которое представляет речевые фрагменты, которые находятся за пределами области приложения.
Маркировка сущностей
В LUIS слово или фраза маркируется в примере речевого фрагмента намерения с сущностью в качестве положительного примера. Маркировка обозначает намерения, которые следует прогнозировать для этого речевого фрагмента. Маркированные речевые фрагменты используются для обучения намерения.
Приложение LUIS
См. определение приложения.
Модель
Модель (машинного обучения) — это функция, которая делает прогноз на основе входных данных. В LUIS мы называем классификаторы намерений и средства извлечения сущностей общим термином "модели", а набор моделей, которые обучены, опубликованы и принимают запросы, — термином "приложение".
Нормализованное значение
В сущности списка добавляются значения. Каждое из этих значений может содержать список из одного или нескольких синонимов. В ответе возвращается только нормализованное значение.
Переобучение
Переполнение происходит, когда модель исправляется в конкретных примерах и не может хорошо обобщать.
Ответственный
У каждого приложения есть один владелец. Это человек, создавший приложение. Владелец управляет разрешениями для приложения на портале Azure.
Список фраз
Список фраз — это определенный признак машинного обучения, в который входит группа значений (слов или фраз), принадлежащих одному классу и обрабатываемых аналогичным образом (например, названия городов или продуктов).
Предварительно созданная модель
Предварительно созданная модель является намерением, сущностью или сочетанием этих элементов вместе с промаркированными примерами. Такие стандартные предварительно созданные модели можно добавлять в приложение, чтобы уменьшить объем работ по созданию моделей для приложения.
Предварительно созданная предметная область
Предварительно созданная предметная область — это приложение LUIS, настроенное для определенной предметной области, такой как домашняя автоматика (HomeAutomation) или бронирование мест в ресторане (RestaurantReservation). Для каждой предметной области настраиваются намерения, высказывания и сущности.
Предварительно созданная сущность
Предварительно созданная сущность — это сущность, предоставляемая LUIS для общих типов сведений, таких как число, URL-адрес, адрес электронной почты. Они создаются на основе общедоступных данных. Вы можете добавить предварительно созданную сущность как автономную сущность или как функцию для сущности.
Предварительно созданное намерение
Предопределенное намерение — это намерение LUIS для стандартных типов информации, и оно сопровождается собственными размеченными примерами речевых фрагментов.
Прогноз
Прогнозирование — это запрос REST на запись в службу прогнозирования LUIS в Azure, который принимает новые данные (пользовательские речевые фрагменты) и применяет к ним обученное и опубликованное приложение, чтобы определить, какие намерения и сущности в нем есть.
Ключ прогнозирования
Ключ прогнозирования — это ключ, связанный со службой LUIS и создаваемый в Azure. Он разрешает использование конечной точки прогнозирования.
Этот ключ не является ключом разработки. Если у вас есть ключ конечной точки прогнозирования, используйте именно его для запросов к конечной точке вместо ключа разработки. Текущий ключ прогнозирования можно увидеть в URL-адресе конечной точки в нижней части страницы ресурсов Azure на веб-сайте LUIS. Это объект типа "имя — значение" в виде подписки и ключа.
Ресурс прогнозирования
Ресурсом прогнозирования LUIS называется управляемый элемент, доступный в Azure. Ресурс обеспечивает доступ к соответствующим прогнозам в службе Azure. Ресурс включает прогнозы.
Ресурс прогнозирования имеет тип Azure LUIS
.
Оценка прогнозирования
Оценка представляет собой число от 0 до 1, которое является мерой уверенности системы в том, что конкретный входной речевой фрагмент соответствует определенному намерению. Оценка ближе к 1 означает, что система очень уверена в его выходных данных и оценка ближе к 0 означает, что система уверена, что входные данные не соответствуют определенному выходу. Значение оценки между этими границами означает, что система совершенно не уверена в своем решении.
Например, рассмотрим модель, которая определяет, содержит ли текст клиента заказ пищи. Она может дать оценку 1 для фразы "я хочу один кофе" (система совершенно уверена в том, что это заказ) или 0 для фразы "моя команда вчера победила" (система совершенно уверена, что это не заказ). На фразу "давайте попьем чаю" она может дать оценку 0,5 (непонятно, заказ ли это).
Программный ключ
Переименован в ключ разработки.
Публикация
Публикация означает предоставление доступа к активной версии LUIS в промежуточной или рабочей конечной точке.
Квота
Квота LUIS — это ограничение уровня подписки Azure. Квота LUIS может быть ограничена как количеством запросов в секунду (состояние HTTP 429), так и общим количеством запросов в месяц (состояния HTTP 403).
Схема
Схема включает ваши намерения и сущности, а также вложенные сущности. Схема планируется изначально, а затем итеративно модифицируется. Схема не включает параметры приложения, признаки или примеры речевых фрагментов.
Анализ тональности
В результате анализа тональности выводятся положительные или отрицательные значения высказываний, предоставленных языковой службой.
Подготовка речи
Подготовка речи улучшает возможность распознавания произнесенных слов и фраз, стандартно используемых в вашем сценарии в службе "Речь". Для приложений, которые поддерживают подготовку речи, все размеченные примеры LUIS используются для повышения точности распознавания путем создания специальной модели речи для конкретного приложения. Например, в боте для игры в шахматы требуется сделать так, чтобы фраза Move knight (Пойти конем) не интерпретировалась как "Пойти ночью". Приложение LUIS должно включать примеры, в которых слово knight отмечено как сущность.
Начальный ключ
Бесплатный ключ для начала работы с LUIS.
Синонимы
В сущностях списков LUIS можно создать нормализованное значение, у которого будет список синонимов. Предположим, создается сущность "размер" с нормализованными значениями "малый", "средний", "большой" и "очень большой". Для каждого значения можно создать следующие синонимы:
Нормализованное значение | Синонимы |
---|---|
Небольшой | маленький, 8 унций |
Средняя | регулярные, 12 унций |
Большой | big, 16 унций |
Очень большой | самый большой, 24 унции |
Модель возвращает нормализованное значение для сущности, когда любой из синонимов отображается во входных данных.
Тест
Тестирование приложения LUIS означает просмотр прогнозов модели.
Смещение часового пояса
Конечная точка содержит параметр timezoneOffset. Это число минут, добавляемое в предварительно созданную сущность datetimeV2 или удаляемое из нее. Например, для высказывания "what time is it now?" возвращаемой сущностью datetimeV2 является текущее время для запроса клиента. Если запрос клиента поступает из бота или другого приложения, которое не совпадает с пользователем бота, необходимо передать смещение между ботом и пользователем.
См. статью Изменение часового пояса предварительно созданной сущности datetimeV2.
Маркер
Токен — это наименьшая единица текста, которую LUIS может распознать. Она различается в зависимости от языка.
Для английского токен — это непрерывный диапазон (без пробелов и знаков препинания) букв и цифр. Пробел не является токеном.
Фраза | Количество токенов | Описание |
---|---|---|
Dog |
1 | Одно слово без знаков препинания или пробелов. |
RMT33W |
1 | Номер локатора записи. У него могут быть цифры и буквы, но у него нет знаков препинания. |
425-555-5555 |
5 | Номер телефона. Каждый знак препинания является одним токеном, поэтому 425-555-5555 содержит 5 токенов:425 - 555 - 5555 |
https://luis.ai |
7 | https : / / luis . ai |
Обучение
Обучение — это процесс обучения LUIS изменениям в активной версии, внесенным с момента последнего обучения.
Данные обучения
Обучающие данные — это набор информации, необходимой для обучения модели. К ней относятся схема, размеченные речевые фрагменты, признаки и параметры приложения.
Ошибки обучения
Ошибки обучения — это прогнозы для обучающих данных, которые не соответствуют их меткам.
Фраза
Речевой фрагмент — это входные данные пользователя, которые представляют собой короткий текст фразы в диалоге. Это фраза естественного языка, например "книга 2 билета в Сиэтл в следующий вторник". Примеры речевых фрагментов добавляются для обучения модели и модели прогнозируются на новых речевых фрагментах во время выполнения.
Версия
Версия LUIS — это определенный экземпляр приложения LUIS, связанный с идентификатором приложения LUIS и опубликованной конечной точкой. У каждого приложения LUIS есть по меньшей мере одна версия.