Компоненты сущностей в пользовательской аналитике текста для работоспособности
В пользовательский анализ текста для здоровья сущности являются соответствующими фрагментами информации, извлеченными из неструктурированного входного текста. Сущность можно извлечь разными способами. Их можно получить с помощью контекста, проверить по списку или обнаружить с помощью предварительно созданной распознанной сущности. Каждая сущность в проекте состоит из одного или нескольких методов, которые определены как компоненты сущности. Если сущность определена более чем одним компонентом, прогнозы сущностей могут перекрываться. Вы можете определить действия прогнозирования сущности при перекрытии ее компонентов с помощью фиксированного набора параметров в настройках сущностей.
Типы компонентов
Компонент сущности определяет способ извлечения сущности. Сущность может содержать один компонент, который определяет единственный метод, который будет использоваться для извлечения сущности или нескольких компонентов для расширения способов определения и извлечения сущности.
Анализ текста для сущностей работоспособности автоматически загружаются в проект как сущности с предварительно созданными компонентами. Вы можете определить компоненты списка для сущностей с предварительно созданными компонентами, но нельзя добавлять обучаемый компонент. Аналогичным образом можно создать новые сущности с помощью компонентов обучения и списка, но их невозможно заполнить дополнительными предварительно созданными компонентами.
Изученный компонент
Для обучения модели машинного обучения компонент использует теги сущностей, помеченные текстом. Модель учится прогнозировать, где находится сущность на основе контекста в тексте. Метки предоставляют примеры того, где сущность, как ожидается, будет присутствовать в тексте, на основе смысла слов вокруг него и как слова, которые были помечены. Этот компонент определяется только при добавлении меток в данные для сущности. Если данные не помечены, у него не будет компонента обучения.
Анализ текста для сущностей работоспособности, которые по умолчанию имеют предварительно созданные компоненты, не могут быть расширены с помощью наученных компонентов, что означает, что они не требуют или принимают дополнительные метки для работы.
Компонент списка
Компонент списка представляет собой фиксированный замкнутый набор связанных слов вместе с синонимами. Компонент выполняет точное совпадение текста со списком значений, которые вы задаете как синонимы. Каждый синоним принадлежит "ключу списка", который можно использовать в качестве нормализованного стандартного значения для синонима, возвращаемого в выходных данных при совпадении с компонентом списка. Ключи списка не используются для сопоставления.
В мультиязычных проектах можно указать разные наборы синонимов для каждого языка. При использовании API прогнозирования можно указать язык во входном запросе, и поиск будет выполняться только для синонимов, связанных с этим языком.
Предварительно созданный компонент
Анализ текста для сущностей работоспособности автоматически загружаются в проект как сущности с предварительно созданными компонентами. Вы можете определить компоненты списка для сущностей с предварительно созданными компонентами, но не удается добавить обучаемый компонент. Аналогичным образом можно создать новые сущности с компонентами обучения и списка, но не удается заполнить их дополнительными предварительно созданными компонентами. Сущности с предварительно созданными компонентами предварительно обучены и могут извлекать сведения, относящиеся к их категориям без меток.
Варианты сущностей
Если для сущности определено несколько компонентов, их прогнозы могут перекрываться. Когда происходит перекрытие, окончательный прогноз каждой сущности определяется одним из следующих вариантов.
Объединять компоненты
Все компоненты соединяются в одну сущность при перекрытии.
Эта функция позволяет объединить все компоненты, если они перекрываются. При объединении компонентов вы получаете все дополнительные сведения, привязанные к списку или предварительно созданному компоненту при их наличии.
Пример
Предположим, у вас есть сущность с именем "Программное обеспечение" с компонентом списка, который содержит запись "Proseware OS". В входных данных у вас есть слово "Я хочу купить Proseware OS 9" с тегом Proseware OS 9, помеченным как Программное обеспечение:
Используя объединение компонентов, сущность возвращает полный контекст в виде "Proseware OS 9" вместе с ключом из компонента списка:
Предположим, у вас есть тот же речевой фрагмент, но изученный компонент предсказал только "OS 9":
При объединении компонентов сущность по-прежнему возвращается в виде "Proseware OS 9" с ключом из компонента списка:
Не объединять компоненты
Каждый перекрывающийся компонент возвращается как отдельный экземпляр сущности. После прогнозирования с использованием этого параметра в действие должен вступать ваш собственный алгоритм обработки.
Пример
Предположим, у вас есть сущность с именем "Программное обеспечение" с компонентом списка, который содержит запись "Proseware Desktop". В ваших помеченных данных у вас есть слово "Я хочу купить Proseware Desktop Pro" с меткой Pro pro, помеченной как Программное обеспечение:
Если компоненты не объединяются, сущность возвращается дважды:
Использование компонентов и параметров
Компоненты позволяют гибко определять сущности несколькими способами. При объединении компонентов необходимо убедиться, что каждый компонент представлен, а количество сущностей, возвращаемых в прогнозах, становится меньше.
Распространенным сценарием применения является расширение стандартного компонента списком значений, которые он изначально не поддерживает. Например, если у вас есть сущность "Имя лекарства", которая имеет Medication.Name
предварительно созданный компонент, добавленный в него, сущность может не прогнозировать все имена лекарств, относящиеся к вашему домену. Вы можете использовать компонент списка для расширения значений сущности "Имя лекарства" и таким образом расширения предварительно созданного с собственными значениями имен лекарств.
Другие случаи, когда вы можете извлечь сущность через контекст, например медицинское устройство. Вы бы наклеили на обучаемый компонент медицинского устройства, чтобы узнать , где медицинское устройство основано на его позиции в предложении. У вас также может быть список медицинских устройств, которые вы уже знаете перед рукой, что вы хотите всегда извлечь. Объединив два компонента в одной сущности, вы реализуете в ней оба варианта использования.
Если вы не объединяете компоненты, можно разрешить каждому компоненту выступать в качестве независимого средства извлечения сущностей. Одним из вариантов использования этой функции является разделение извлеченных из списка сущностей на извлеченные с помощью обученных и стандартных компонентов для дальнейшей обработки по-разному.