Поделиться через


Используйте обогащение неструктурированных клинических заметок (предварительная версия) в решениях для данных здравоохранения

[Данная статья посвящена предварительному выпуску и может быть изменена.]

Заметка

В настоящее время это содержимое обновляется.

Обогащение неструктурированных клинических заметок (предварительная версия) использует службу языка ИИ Azure Text Analytics for Health для извлечения ключевых сущностей ресурсов быстрого взаимодействия в сфере здравоохранения (FHIR) из неструктурированных клинических заметок. Он создает структурированные данные на основе этих клинических заметок. Затем вы можете проанализировать эти структурированные данные, чтобы получить аналитические сведения, прогнозы и показатели качества, направленные на улучшение результатов лечения пациентов.

Дополнительные сведения об этой возможности, а также о том, как ее развернуть и настроить, см. в разделе:

Обогащение неструктурированных клинических заметок (предварительная версия) напрямую зависит от возможности механизмов структурирования данных здравоохранения. Сначала убедитесь, что вы успешно настроили и запустили конвейеры механизмов структурирования данных здравоохранения.

Предварительные условия

Служба приема обработки естественного языка (NLP)

Записная книжка healthcare#_msft_ta4h_silver_ingestion выполняет модуль NLPIngestionService в библиотеке решений для данных здравоохранения для вызова службы Text Analytics for Health. Эта служба извлекает неструктурированные клинические заметки из ресурса FHIR DocumentReference.Content для создания сведенных выходных данных. Дополнительные сведения см. в разделе Проверка конфигурации записной книжки.

Хранение данных в серебряном слое

После анализа API обработки естественного языка (NLP) структурированные и сведенные выходные данные сохраняются в следующих нативных таблицах в хранилище озера данных healthcare#_msft_silver:

  • nlpentity: содержит сведенные сущности, извлеченные из неструктурированных клинических заметок. Каждая строка представляет собой один термин, извлеченный из неструктурированного текста после выполнения анализа текста.
  • nlprelationship: предоставляет связь между извлеченными сущностями.
  • nlpfhir: содержит пакет выходных данных FHIR в виде строки JSON.

Чтобы отследить последнюю обновленную метку времени, NLPIngestionService использует поле parent_meta_lastUpdated во всех трех таблицах серебряного хранилища озера данных. Такое отслеживание гарантирует, что исходный документ DocumentReference, который является родительским ресурсом, сначала будет сохранен для поддержания целостности данных. Этот процесс помогает предотвратить несогласованность данных и потерянные ресурсы.

Важно

В настоящее время Text Analytics for Health возвращает словари, перечисленные в Документация словаря метатезауруса UMLS. Рекомендации по использованию этих словарей см. в разделе Импорт данных из UMLS.

В выпуске предварительной версии мы используем терминологию SNOMED-CT (Систематизированная номенклатура медицины — клиническая терминология), LOINC (Логические идентификаторы, имена и коды наблюдений) и RxNorm, которые включены в OMOP демонстрационный набор данных на основе рекомендаций из Observational Health Data Sciences and Informatics (OHDSI).

Преобразование OMOP

Решения для данных здравоохранения в Microsoft Fabric также предоставляют еще одну возможность для преобразований Сообщества по наблюдению за медицинскими результатами (OMOP). Когда вы реализуете эту возможность, базовое преобразование из серебряного хранилища озера данных в золотое хранилище озера данных OMOP также преобразует структурированные и сведенные выходные данные анализа неструктурированных клинических заметок. Преобразование считывает данные из таблицы nlpentity в серебряном хранилище озера данных и сопоставляет выходные данные с таблицей NOTE_NLP в золотом хранилище озера данных OMOP.

Дополнительные сведения см. в разделе Обзор преобразований OMOP.

Ниже приведена схема структурированных выходных данных NLP с соответствующими столбцами NOTE_NLP, сопоставленными с общей моделью данных OMOP:

Ссылка на сведенный документ Описание Сопоставление Note_NLP Образцы данных
ид Уникальный идентификатор для сущности. Составной ключ из parent_id, offset, и length. note_nlp_id 1380
parent_id Внешний ключ к сведенному тексту documentreferencecontent, из которого был извлечен термин. note_id 625
text Текст сущности, как он отображается в документе. lexical_variant Нет известных аллергий
Смещение Смещение символов извлеченного термина во входном тексте documentreferencecontent. offset 294
data_source_entity_id Идентификатор сущности в заданном исходном каталоге. note_nlp_concept_id и note_nlp_source_concept_id 37396387
nlp_last_executed Дата обработки анализа текста documentreferencecontent. nlp_date_time и nlp_date 2023-05-17Т00:00:00.0000000
модель Имя и версия системы NLP (имя системы NLP Text Analytics for Health и версия). nlp_system MSFT TA4H

Изображение, отображающее схему с демонстрационными данными NLP.

Ограничения служб для Text Analytics for Health

  • Максимальное количество символов в документе ограничено до 125000.
  • Максимальный размер документов, содержащихся во всем запросе, ограничен 1 МБ.
  • Максимальное количество документов в запросе ограничено до:
    • 25 для веб-API.
    • 1000 для контейнера.

Включить журналы

Выполните следующие действия, чтобы включить ведение журнала запросов и ответов для API Text Analytics for Health:

  • Включите параметры диагностики для ресурса языковой службы Azure, следуя инструкциям в разделе Включение журнал ведения диагностики для служб ИИ Azure. Это та же языковая служба, которая была создана на шаге развертывания Настройка языковой службы Azure.

    • Введите имя параметра диагностики.
    • Задайте категорию Журналы запросов и ответов.
    • Для получения сведений о назначении выберите Отправить в рабочую область Log Analytics, а затем выберите нужную рабочую область Log Analytics. Если у вас нет рабочей области, следуйте инструкциям, чтобы создать ее.
    • Сохранить параметры.

    Снимок экрана с параметрами диагностики языковой службы.

  • Перейдите в раздел Конфигурация NLP в записной книжке службы приема NLP. Обновите значение параметра конфигурации enable_text_analytics_logs на True. Дополнительные сведения об этой записной книжке см. в разделе Проверка конфигурации записной книжки.

Просмотр журналов в Azure Log Analytics

Чтобы изучить данные Log Analytics, выполните следующие действия:

  • Перейдите в рабочую область Log Analytics.
  • Найдите и выберите Журналы. На этой странице можно выполнять запросы к журналам.

Пример запроса

Ниже приведен базовый запрос Kusto, который можно использовать для изучения данных журнала. Этот пример запроса извлекает все неудачные запросы от поставщика ресурсов Azure Cognitive Services за последний день, сгруппированные по типу ошибки:

AzureDiagnostics
| where TimeGenerated > ago(1d)
| where Category == "RequestResponse"
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| where tostring(ResultSignature) startswith "4" or tostring(ResultSignature) startswith "5"
| summarize NumberOfFailedRequests = count() by ResultSignature