Используйте обогащение неструктурированных клинических заметок (предварительная версия) в решениях для данных здравоохранения
[Данная статья посвящена предварительному выпуску и может быть изменена.]
Заметка
В настоящее время это содержимое обновляется.
Обогащение неструктурированных клинических заметок (предварительная версия) использует службу языка ИИ Azure Text Analytics for Health для извлечения ключевых сущностей ресурсов быстрого взаимодействия в сфере здравоохранения (FHIR) из неструктурированных клинических заметок. Он создает структурированные данные на основе этих клинических заметок. Затем вы можете проанализировать эти структурированные данные, чтобы получить аналитические сведения, прогнозы и показатели качества, направленные на улучшение результатов лечения пациентов.
Дополнительные сведения об этой возможности, а также о том, как ее развернуть и настроить, см. в разделе:
- Обзор обогащения неструктурированных клинических заметок (предварительная версия)
- Развертывание и настройка обогащения неструктурированных клинических заметок (предварительная версия)
Обогащение неструктурированных клинических заметок (предварительная версия) напрямую зависит от возможности механизмов структурирования данных здравоохранения. Сначала убедитесь, что вы успешно настроили и запустили конвейеры механизмов структурирования данных здравоохранения.
Предварительные условия
- Развертывание решений для данных здравоохранения в Microsoft Fabric
- Установите базовые записные книжки и конвейеры в Развертывание механизмов структурирования данных здравоохранения.
- Настройте языковую службу Azure, как описано в разделе Настройка языковой службы Azure.
- Развертывание и настройка обогащения неструктурированных клинических заметок (предварительная версия)
- Развертывание и конфигурация преобразований OMOP. Этот шаг необязательный.
Служба приема обработки естественного языка (NLP)
Записная книжка healthcare#_msft_ta4h_silver_ingestion выполняет модуль NLPIngestionService в библиотеке решений для данных здравоохранения для вызова службы Text Analytics for Health. Эта служба извлекает неструктурированные клинические заметки из ресурса FHIR DocumentReference.Content для создания сведенных выходных данных. Дополнительные сведения см. в разделе Проверка конфигурации записной книжки.
Хранение данных в серебряном слое
После анализа API обработки естественного языка (NLP) структурированные и сведенные выходные данные сохраняются в следующих нативных таблицах в хранилище озера данных healthcare#_msft_silver:
- nlpentity: содержит сведенные сущности, извлеченные из неструктурированных клинических заметок. Каждая строка представляет собой один термин, извлеченный из неструктурированного текста после выполнения анализа текста.
- nlprelationship: предоставляет связь между извлеченными сущностями.
- nlpfhir: содержит пакет выходных данных FHIR в виде строки JSON.
Чтобы отследить последнюю обновленную метку времени, NLPIngestionService использует поле parent_meta_lastUpdated
во всех трех таблицах серебряного хранилища озера данных. Такое отслеживание гарантирует, что исходный документ DocumentReference, который является родительским ресурсом, сначала будет сохранен для поддержания целостности данных. Этот процесс помогает предотвратить несогласованность данных и потерянные ресурсы.
Важно
В настоящее время Text Analytics for Health возвращает словари, перечисленные в Документация словаря метатезауруса UMLS. Рекомендации по использованию этих словарей см. в разделе Импорт данных из UMLS.
В выпуске предварительной версии мы используем терминологию SNOMED-CT (Систематизированная номенклатура медицины — клиническая терминология), LOINC (Логические идентификаторы, имена и коды наблюдений) и RxNorm, которые включены в OMOP демонстрационный набор данных на основе рекомендаций из Observational Health Data Sciences and Informatics (OHDSI).
Преобразование OMOP
Решения для данных здравоохранения в Microsoft Fabric также предоставляют еще одну возможность для преобразований Сообщества по наблюдению за медицинскими результатами (OMOP). Когда вы реализуете эту возможность, базовое преобразование из серебряного хранилища озера данных в золотое хранилище озера данных OMOP также преобразует структурированные и сведенные выходные данные анализа неструктурированных клинических заметок. Преобразование считывает данные из таблицы nlpentity в серебряном хранилище озера данных и сопоставляет выходные данные с таблицей NOTE_NLP в золотом хранилище озера данных OMOP.
Дополнительные сведения см. в разделе Обзор преобразований OMOP.
Ниже приведена схема структурированных выходных данных NLP с соответствующими столбцами NOTE_NLP, сопоставленными с общей моделью данных OMOP:
Ссылка на сведенный документ | Описание | Сопоставление Note_NLP | Образцы данных |
---|---|---|---|
ид | Уникальный идентификатор для сущности. Составной ключ из parent_id , offset , и length . |
note_nlp_id |
1380 |
parent_id | Внешний ключ к сведенному тексту documentreferencecontent, из которого был извлечен термин. | note_id |
625 |
text | Текст сущности, как он отображается в документе. | lexical_variant |
Нет известных аллергий |
Смещение | Смещение символов извлеченного термина во входном тексте documentreferencecontent. | offset |
294 |
data_source_entity_id | Идентификатор сущности в заданном исходном каталоге. | note_nlp_concept_id и note_nlp_source_concept_id |
37396387 |
nlp_last_executed | Дата обработки анализа текста documentreferencecontent. | nlp_date_time и nlp_date |
2023-05-17Т00:00:00.0000000 |
модель | Имя и версия системы NLP (имя системы NLP Text Analytics for Health и версия). | nlp_system |
MSFT TA4H |
Ограничения служб для Text Analytics for Health
- Максимальное количество символов в документе ограничено до 125000.
- Максимальный размер документов, содержащихся во всем запросе, ограничен 1 МБ.
- Максимальное количество документов в запросе ограничено до:
- 25 для веб-API.
- 1000 для контейнера.
Включить журналы
Выполните следующие действия, чтобы включить ведение журнала запросов и ответов для API Text Analytics for Health:
Включите параметры диагностики для ресурса языковой службы Azure, следуя инструкциям в разделе Включение журнал ведения диагностики для служб ИИ Azure. Это та же языковая служба, которая была создана на шаге развертывания Настройка языковой службы Azure.
- Введите имя параметра диагностики.
- Задайте категорию Журналы запросов и ответов.
- Для получения сведений о назначении выберите Отправить в рабочую область Log Analytics, а затем выберите нужную рабочую область Log Analytics. Если у вас нет рабочей области, следуйте инструкциям, чтобы создать ее.
- Сохранить параметры.
Перейдите в раздел Конфигурация NLP в записной книжке службы приема NLP. Обновите значение параметра конфигурации
enable_text_analytics_logs
наTrue
. Дополнительные сведения об этой записной книжке см. в разделе Проверка конфигурации записной книжки.
Просмотр журналов в Azure Log Analytics
Чтобы изучить данные Log Analytics, выполните следующие действия:
- Перейдите в рабочую область Log Analytics.
- Найдите и выберите Журналы. На этой странице можно выполнять запросы к журналам.
Пример запроса
Ниже приведен базовый запрос Kusto, который можно использовать для изучения данных журнала. Этот пример запроса извлекает все неудачные запросы от поставщика ресурсов Azure Cognitive Services за последний день, сгруппированные по типу ошибки:
AzureDiagnostics
| where TimeGenerated > ago(1d)
| where Category == "RequestResponse"
| where ResourceProvider == "MICROSOFT.COGNITIVESERVICES"
| where tostring(ResultSignature) startswith "4" or tostring(ResultSignature) startswith "5"
| summarize NumberOfFailedRequests = count() by ResultSignature