Развертывание и настройка преобразований OMOP в решениях для данных здравоохранения
Заметка
В настоящее время это содержимое обновляется.
Преобразования OMOP позволяют подготавливать данные для стандартизированной аналитики с помощью открытых стандартов Сообщества по наблюдению за медицинскими результатами (OMOP). Эту возможность можно использовать после развертывания решений для данных здравоохранения и возможности механизмов структурирования данных здравоохранения в рабочей области Fabric.
Преобразования OMOP является дополнительной возможностью в решениях для данных здравоохранения в Microsoft Fabric. Вы можете решить, использовать его или нет, в зависимости от ваших конкретных потребностей или сценариев.
Предварительные условия
- Развертывание решений для данных здравоохранения в Microsoft Fabric.
- Установите базовые записные книжки и конвейеры в Развертывание механизмов структурирования данных здравоохранения.
Развертывание преобразований OMOP
Вы можете развернуть эту возможность с помощью модуля настройки, описанного в разделе Решения для данных здравоохранения: развертывание механизмов структурирования данных здравоохранения. Однако на шаге выбора демонстрационных данных в этом модуле демонстрационные данные для этой возможности не развертываются. Демонстрационные данные преобразований OMOP устанавливается исключительно в среду решений для данных здравоохранения после завершения развертывания возможности.
Если вы не использовали модуль установки для развертывания возможности и хотите вместо этого использовать плитку возможностей, выполните следующие действия:
Перейдите на домашнюю страницу решений для данных здравоохранения в Fabric.
Выберите плитку преобразований OMOP.
На странице возможности выберите Развернуть в рабочей области.
Процесс развертывания может занять несколько минут. Не закрывайте вкладку или браузер во время развертывания. Пока вы ждете, вы можете работать в другой вкладке.
После завершения развертывания на панели сообщений появится уведомление.
Выберите Управление возможностью на панели сообщений, чтобы перейти на страницу Управление возможностями.
Здесь вы можете просматривать, настраивать и управлять артефактами, развернутыми с этой возможностью.
Артефакты
Эта возможность позволяет установить следующие артефакты в среду решений для данных здравоохранения:
Артефакт | Тип |
---|---|
healthcare#_msft_gold_omop | Хранилище и озеро данных |
healthcare#_msft_omop_silver_gold_transformation | Записная книжка |
healthcare#_msft_omop_drug_exposure_era_sample | Записная книжка |
healthcare#_msft_omop_drug_exposure_insights_sample | Записная книжка |
healthcare#_msft_omop_analytics | Конвейер данных |
healthcare#_msft_omop_semantic_model | Семантическая модель |
Vocab-HDS | Образцы данных |
Обзор серебряной записной книжки OMOP
Записная книжка healthcare#_msft_omop_silver_gold_transformation использует OMOP API, входящие в состав библиотеки решений для данных здравоохранения, для преобразования данных. Записная книжка преобразует ресурсы в healthcare#_msft_silver хранилище озера данных в общую модель данных OMOP. Преобразованные данные затем вставляются в хранилище озера данных OMOP.
Записная книжка развертывается с предварительно настроенными значениями, необходимыми для выполнения конвейера данных преобразований OMOP. Некоторые параметры конфигурации наследуются от глобальной конфигурации и могут быть переопределены на уровне записной книжки. По умолчанию вносить какие-либо изменения в файлы конфигурации записной книжки не требуется. При необходимости можно просмотреть или изменить конфигурацию, выбрав соответствующие записные книжки и файлы конфигурации в среде.
Дополнительные сведения о выполнении записной книжки см. в разделе Использование OMOP преобразований.
Просмотрите семантическую модель OMOP
Семантическая модель OMOP, healthcare#_msft_omop_semantic_model, представляет собой специально разработанную семантическую модель, основанную на золотом хранилище озера данных OMOP. Он включает в себя несколько ключевых связей OMOP CDM версии 5.4 между следующими OMOP таблицами:
- Местонахождение
- Лицо
- Наблюдение
- Procedure_Occurrence
- Condition_Occurrence
- Заметка
- Drug_Exposure
- Visit_Ocurrence
- Image_Occurrence
- Измерение
Эти связи из минимального набора, необходимого для создания Power BI отчетов в возможности Обнаружение и создание когорт (предварительная версия) в решениях для данных здравоохранения. Вы можете использовать эту семантическую модель в качестве основы, добавляя дополнительные OMOP таблицы и связи из озера данных OMOP для создания пользовательских отчетов Power BI на основе стандартных данных озера данных OMOP.
Настройка примера записной книжки периоды приема препарата
В примере записной книжки healthcare#_msft_omop_drug_exposure_era_sample показано, как создать записи таблицы drug_era в OMOP с помощью языка PySpark (Python) в записной книжке Azure Synapse Analytics, в основном для исследовательских целей. Создание записей таблицы drug_era соответствует примеру сценария периоды приема препарата OHDSI, который адаптирован для работы с PySpark в Azure Synapse Analytics. Код генератора периоды приема препарата включен в пользовательскую библиотеку Python, которая упакована в файл wheel (WHL) и загружена в пул Apache Spark для легкого доступа.
Перед запуском записной книжки учитывайте следующие необходимые условия:
Убедитесь, что в базе данных OMOP есть допустимые данные в следующих таблицах:
- drug_exposure
- концепция
- concept_ancestor
Эти данные можно создать, используя демонстрационные данные или ваши собственные, запустив конвейер преобразования FHIR в данные OMOP.
Убедитесь, что пакет wheel пользовательской библиотеки подключен к пулу Spark, используемому для запуска этой записной книжки.
Ключевым параметром конфигурации для этой записной книжки является omop_database_name
. Этот параметр определяет имя базы данных OMOP, содержащей данные для формирования таблицы drug_era. Обновляйте это значение только в том случае, если база данных OMOP отличается от значения по умолчанию в файл глобальной конфигурации.
Если таблица OMOP drug_exposure заполняется допустимыми данными, эта записная книжка вызывает модуль DrugEraGenerator, который связывает воедино периоды времени, в течение которых человек подвергался воздействию активного компонента препарата, оставляя промежуток в 30 дней. Модуль DrugEraGenerator удаляет все существующие записи drug_era и генерирует новые записи, основываясь на последних данных OMOP.
Дополнительные сведения о выполнении записной книжки см. в разделе Использование примера записной книжки преобразований OMOP.
Настройка примера записной книжки аналитики приема препарата
В примере записной книжки healthcare#_msft_omop_drug_exposure_insights_sample демонстрируется исследовательский анализ таблицы drug_era с использованием PySpark в записной книжке Azure Synapse Analytics . В результате анализа создается гистограмма, показывающая вторичное воздействие активных компонентов на пациентов, стратифицированное по полу и возрасту в течение определенного года. Таблица drug_era создается с помощью пользовательской библиотеки DrugEraGenerator, которую вызывает предыдущая записная книжка healthcare#_msft_omop_drug_exposure_era_sample. Этот анализ расширяет Запрос приема препарата DEX03: распределение возраста, стратифицированное по препаратам путем включения стратификации по полу и возрасту.
Перед запуском записной книжки учитывайте следующие необходимые условия:
- Если вы хотите изменить конфигурацию записной книжки, убедитесь, что вы создали копию этой записной книжки. Не обновляйте записную книжку напрямую.
- Убедитесь, что таблица drug_era содержит данные, запустив записную книжку периоды приема препарата. При запуске этой записной книжки все существующие записи drug_era заменяются новыми записями на основе последних OMOP данных.
- Используйте эту записную книжку "как есть" для исследовательского анализа и создайте копию для выполнения пользовательского анализа.
Ниже приведены ключевые параметры конфигурации записной книжки. Вы можете изменить эти параметры для альтернативного исследовательского анализа воздействия лекарств на пациента:
primary_drug_concept_id
: первичное воздействие действующего вещества на пациентов.secondary_drug_concept_id
: вторичное воздействие действующего вещества на пациентов.year
: целевой год, в течение которого пациенты активно подвергались воздействию как первичных, так и вторичных лекарств.
Дополнительные сведения о выполнении записной книжки см. в разделе Использование примера записной книжки преобразований OMOP.