Поделиться через


Развертывание и настройка преобразований OMOP в решениях для данных здравоохранения

Заметка

В настоящее время это содержимое обновляется.

Преобразования OMOP позволяют подготавливать данные для стандартизированной аналитики с помощью открытых стандартов Сообщества по наблюдению за медицинскими результатами (OMOP). Эту возможность можно использовать после развертывания решений для данных здравоохранения и возможности механизмов структурирования данных здравоохранения в рабочей области Fabric.

Преобразования OMOP является дополнительной возможностью в решениях для данных здравоохранения в Microsoft Fabric. Вы можете решить, использовать его или нет, в зависимости от ваших конкретных потребностей или сценариев.

Предварительные условия

Развертывание преобразований OMOP

Вы можете развернуть эту возможность с помощью модуля настройки, описанного в разделе Решения для данных здравоохранения: развертывание механизмов структурирования данных здравоохранения. Однако на шаге выбора демонстрационных данных в этом модуле демонстрационные данные для этой возможности не развертываются. Демонстрационные данные преобразований OMOP устанавливается исключительно в среду решений для данных здравоохранения после завершения развертывания возможности.

Если вы не использовали модуль установки для развертывания возможности и хотите вместо этого использовать плитку возможностей, выполните следующие действия:

  1. Перейдите на домашнюю страницу решений для данных здравоохранения в Fabric.

  2. Выберите плитку преобразований OMOP.

    Снимок экрана с плиткой преобразований OMOP.

  3. На странице возможности выберите Развернуть в рабочей области.

    Снимок экрана, показывающий, как развернуть возможность в рабочей области.

  4. Процесс развертывания может занять несколько минут. Не закрывайте вкладку или браузер во время развертывания. Пока вы ждете, вы можете работать в другой вкладке.

    После завершения развертывания на панели сообщений появится уведомление.

  5. Выберите Управление возможностью на панели сообщений, чтобы перейти на страницу Управление возможностями.

    Здесь вы можете просматривать, настраивать и управлять артефактами, развернутыми с этой возможностью.

Артефакты

Эта возможность позволяет установить следующие артефакты в среду решений для данных здравоохранения:

Артефакт Тип
healthcare#_msft_gold_omop Хранилище и озеро данных
healthcare#_msft_omop_silver_gold_transformation Записная книжка
healthcare#_msft_omop_drug_exposure_era_sample Записная книжка
healthcare#_msft_omop_drug_exposure_insights_sample Записная книжка
healthcare#_msft_omop_analytics Конвейер данных
healthcare#_msft_omop_semantic_model Семантическая модель
Vocab-HDS Образцы данных

Обзор серебряной записной книжки OMOP

Записная книжка healthcare#_msft_omop_silver_gold_transformation использует OMOP API, входящие в состав библиотеки решений для данных здравоохранения, для преобразования данных. Записная книжка преобразует ресурсы в healthcare#_msft_silver хранилище озера данных в общую модель данных OMOP. Преобразованные данные затем вставляются в хранилище озера данных OMOP.

Записная книжка развертывается с предварительно настроенными значениями, необходимыми для выполнения конвейера данных преобразований OMOP. Некоторые параметры конфигурации наследуются от глобальной конфигурации и могут быть переопределены на уровне записной книжки. По умолчанию вносить какие-либо изменения в файлы конфигурации записной книжки не требуется. При необходимости можно просмотреть или изменить конфигурацию, выбрав соответствующие записные книжки и файлы конфигурации в среде.

Дополнительные сведения о выполнении записной книжки см. в разделе Использование OMOP преобразований.

Просмотрите семантическую модель OMOP

Семантическая модель OMOP, healthcare#_msft_omop_semantic_model, представляет собой специально разработанную семантическую модель, основанную на золотом хранилище озера данных OMOP. Он включает в себя несколько ключевых связей OMOP CDM версии 5.4 между следующими OMOP таблицами:

  • Местонахождение
  • Лицо
  • Наблюдение
  • Procedure_Occurrence
  • Condition_Occurrence
  • Заметка
  • Drug_Exposure
  • Visit_Ocurrence
  • Image_Occurrence
  • Измерение

Эти связи из минимального набора, необходимого для создания Power BI отчетов в возможности Обнаружение и создание когорт (предварительная версия) в решениях для данных здравоохранения. Вы можете использовать эту семантическую модель в качестве основы, добавляя дополнительные OMOP таблицы и связи из озера данных OMOP для создания пользовательских отчетов Power BI на основе стандартных данных озера данных OMOP.

Настройка примера записной книжки периоды приема препарата

В примере записной книжки healthcare#_msft_omop_drug_exposure_era_sample показано, как создать записи таблицы drug_era в OMOP с помощью языка PySpark (Python) в записной книжке Azure Synapse Analytics, в основном для исследовательских целей. Создание записей таблицы drug_era соответствует примеру сценария периоды приема препарата OHDSI, который адаптирован для работы с PySpark в Azure Synapse Analytics. Код генератора периоды приема препарата включен в пользовательскую библиотеку Python, которая упакована в файл wheel (WHL) и загружена в пул Apache Spark для легкого доступа.

Перед запуском записной книжки учитывайте следующие необходимые условия:

  • Убедитесь, что в базе данных OMOP есть допустимые данные в следующих таблицах:

    • drug_exposure
    • концепция
    • concept_ancestor

    Эти данные можно создать, используя демонстрационные данные или ваши собственные, запустив конвейер преобразования FHIR в данные OMOP.

  • Убедитесь, что пакет wheel пользовательской библиотеки подключен к пулу Spark, используемому для запуска этой записной книжки.

Ключевым параметром конфигурации для этой записной книжки является omop_database_name. Этот параметр определяет имя базы данных OMOP, содержащей данные для формирования таблицы drug_era. Обновляйте это значение только в том случае, если база данных OMOP отличается от значения по умолчанию в файл глобальной конфигурации.

Если таблица OMOP drug_exposure заполняется допустимыми данными, эта записная книжка вызывает модуль DrugEraGenerator, который связывает воедино периоды времени, в течение которых человек подвергался воздействию активного компонента препарата, оставляя промежуток в 30 дней. Модуль DrugEraGenerator удаляет все существующие записи drug_era и генерирует новые записи, основываясь на последних данных OMOP.

Дополнительные сведения о выполнении записной книжки см. в разделе Использование примера записной книжки преобразований OMOP.

Настройка примера записной книжки аналитики приема препарата

В примере записной книжки healthcare#_msft_omop_drug_exposure_insights_sample демонстрируется исследовательский анализ таблицы drug_era с использованием PySpark в записной книжке Azure Synapse Analytics . В результате анализа создается гистограмма, показывающая вторичное воздействие активных компонентов на пациентов, стратифицированное по полу и возрасту в течение определенного года. Таблица drug_era создается с помощью пользовательской библиотеки DrugEraGenerator, которую вызывает предыдущая записная книжка healthcare#_msft_omop_drug_exposure_era_sample. Этот анализ расширяет Запрос приема препарата DEX03: распределение возраста, стратифицированное по препаратам путем включения стратификации по полу и возрасту.

Перед запуском записной книжки учитывайте следующие необходимые условия:

  • Если вы хотите изменить конфигурацию записной книжки, убедитесь, что вы создали копию этой записной книжки. Не обновляйте записную книжку напрямую.
  • Убедитесь, что таблица drug_era содержит данные, запустив записную книжку периоды приема препарата. При запуске этой записной книжки все существующие записи drug_era заменяются новыми записями на основе последних OMOP данных.
  • Используйте эту записную книжку "как есть" для исследовательского анализа и создайте копию для выполнения пользовательского анализа.

Ниже приведены ключевые параметры конфигурации записной книжки. Вы можете изменить эти параметры для альтернативного исследовательского анализа воздействия лекарств на пациента:

  • primary_drug_concept_id: первичное воздействие действующего вещества на пациентов.
  • secondary_drug_concept_id: вторичное воздействие действующего вещества на пациентов.
  • year: целевой год, в течение которого пациенты активно подвергались воздействию как первичных, так и вторичных лекарств.

Дополнительные сведения о выполнении записной книжки см. в разделе Использование примера записной книжки преобразований OMOP.