医療データ ソリューションの OMOP 変換を展開および構成する
注意
このコンテンツは現在更新中です。
OMOP 変換は、Observational Medical Outcomes Partnership (OMOP) のオープン コミュニティ標準を通じて、標準化された分析用のデータ準備を有効にします。 医療データ ソリューションを自分の Fabric ワークスペースと医療データ ファンデーション機能に展開したあとに、この機能を使用してください。
OMOP 変換は、Microsoft Fabric の医療データ ソリューションのオプション機能です。 特定のニーズやシナリオに応じて、使用するかどうかを柔軟に決定できます。
前提条件
- Microsoft Fabric に医療データ ソリューションを展開する。
- 医療データ ファンデーションの展開 で、基盤となるノートブックとパイプラインをインストールする。
OMOP 変換を展開する
この機能は、医療データ ソリューション: 医療データ ファンデーションの展開 で説明されている設定モジュールを使用して展開できます。 ただし、このモジュールのサンプル データ選択手順では、この機能のサンプル データは展開されません。 OMOP 変換サンプル データは、機能の展開が完了すると、医療データ ソリューション環境にのみインストールされます。
機能の展開にセットアップ モジュールを使用せず、代わりに機能タイルを使用する場合は、次の手順に従います。
Fabric の医療データ ソリューションのホーム ページに移動します。
OMOP 変換タイルを選択します。
機能ページで、ワークスペースに展開 を選択します。
展開の完了には数分かかる場合があります。 展開の進行中は、タブやブラウザーを閉じないでください。 待っている間、別のタブで作業することができます。
展開が完了すると、メッセージ バーに通知が表示されます。
メッセージ バーから 機能の管理 を選択し、機能の管理 ページに移動します。
そこでは、機能を使用して展開されたアーティファクトを表示、構成、および管理できます。
アーティファクト
この機能により、次のアーチファクトが医療データ ソリューション環境にインストールされます。
アーティファクト | タイプ |
---|---|
healthcare#_msft_gold_omop | レイクハウス |
healthcare#_msft_omop_silver_gold_transformation | ノートブック |
healthcare#_msft_omop_drug_exposure_era_sample | ノートブック |
healthcare#_msft_omop_drug_exposure_insights_sample | ノートブック |
healthcare#_msft_omop_analytics | データ パイプライン |
healthcare#_msft_omop_semantic_model | セマンティック モデル |
Vocab-HDS | サンプル データ |
OMOP シルバー ノートブックのレビュー
healthcare#_msft_omop_silver_gold_transformation ノートブックは医療データ ソリューション ライブラリの一部として付属している OMOP API をデータ変換に使用します。 このノートブックは、healthcare#_msft_silver レイクハウスのリソースを OMOP Common Data Model に変換します。 変換されたデータは、レイクハウス OMOP に挿入されます。
このノートブックは、OMOP 変換データ パイプラインの実行に必要な事前構成済みの値を使用して展開されます。 一部の構成パラメーターは グローバル構成 から継承され、ノートブック レベルでオーバーライドできます。 既定では、ノートブックの構成ファイルを変更することは期待されません。 必要に応じて、自分の環境内のそれぞれのノートブックと構成ファイルを選択して構成を確認または変更できます。
ノートブックの実行の詳細については、OMOP 変換の使用 を参照してください。
OMOP セマンティック モデルをレビューする
OMOP セマンティック モデル healthcare#_msft_omop_semantic_model は、OMOP ゴールド レイクハウスに基づくカスタムビルド セマンティック モデルです。 これには、次の OMOP テーブル間のいくつかのキー OMOP CDM バージョン 5.4 関係が含まれています。
- Location
- Person
- Observation
- Procedure_Occurrence
- Condition_Occurrence
- Note
- Drug_Exposure
- Visit_Ocurrence
- Image_Occurrence
- Measurement
これらのリレーションシップは、医療データ ソリューションの Power BI 検出と構築 (プレビュー) のレポートを レポートの生成に必要な最小限のセット に生成するために必要な最小セットを形作ります。 このセマンティック モデルを基盤として使用し、OMOP レイクハウスから OMOP テーブルとリレーションシップを追加して OMOP 標準のレイクハウス データからカスタム Power BI レポートを作成できます。
薬曝露期間のサンプル ノートブックを構成する
healthcare#_msft_omop_drug_exposure_era_sample サンプル ノートブックは、主に探索目的で Azure Synapse Analytics ノートブック で PySpark (Python) 言語を使用して OMOP で drug_era テーブル レコードを生成する方法を示しています。 drug_era テーブル レコードの生成は、OHDSI drug era サンプルスクリプト に従っており、Azure Synapse Analytics の PySpark で動作するように調整されています。 ドラッグ ピリオド ジェネレーター コードはカスタム Python ライブラリに含まれており、ホイール (WHL) ファイルとしてパッケージ化され、簡単にアクセスできるように Apache Spark プールにアップロードされます。
ノートブックを実行する前に、次の前提条件に留意してください。
OMOP データベースが次の表に有効なデータがあることを確認します。
- drug_exposure
- 概念
- concept_ancestor
このデータは、サンプル データを使用して生成することも、FHIR から OMOP データへのパイプラインを実行して独自のデータを生成することもできます。
カスタム ライブラリ ホイール パッケージが、このノートブックの実行に使用する Spark プールにアタッチされていることを確認します。
このノートブックの主要な構成パラメーターは omop_database_name
です。 このパラメータは、drug_era テーブルを生成するためのデータが格納されている OMOP データベースの名前を識別します。 この値は、OMOP データベース グローバル構成ファイルのデフォルト値と異なる場合にのみ更新してください。
OMOP drug_exposure テーブルが有効なデータが入力されている場合、このノートブックは DrugEraGenerator モジュールを呼び出し、人が有効成分に曝露された期間をつなぎ合わせ、30 日間のギャップを許容します。 DrugEraGenerator モジュールは、最新の OMOP データに基づいて、既存の drug_era レコードをすべて削除し、新しいレコードを生成します。
ノートブックの実行の詳細については、OMOP 変換サンプル ノートブックの使用 を参照してください。
薬曝露インサイトのサンプル ノートブックを構成する
healthcare#_msft_omop_drug_exposure_insights_sample サンプル ノートブックでは、Azure Synapse Analytics ノートブックの PySpark を使用した drug_era テーブルの探索的分析を示します。 この分析により、特定の年の性別と年齢で層別化された有効成分への患者の二次薬物曝露を表示するヒストグラムが生成されます。 drug_era テーブルは、前の ノートブック healthcare#_msft_omop_drug_exposure_era_sample が呼び出すカスタム ライブラリ DrugEraGenerator を使用して生成されます。 この分析は 薬物曝露クエリ DEX03: 薬物によって層別化された年齢の分布、性別と年齢の両方に基づく層別化を組み込むことで拡張します。
ノートブックを実行する前に、次の前提条件に留意してください。
- ノートブックの構成を編集する場合は、必ずこのノートブックのコピーを作成してください。 ノートブックを直接更新しないでください。
- 薬物曝露期間ノートブックを実行して drug_era テーブルにデータが含まれていることを確認します。 このノートブックを実行すると、最新の OMOP データに基づいて、既存のレコード drug_era を最新のレコードに置き換えます。
- このノートブックをそのまま探索的分析に使用し、コピーを作成してカスタム分析を実行します。
以下は、このノートブックの主な構成パラメータです。 患者の薬物曝露に関する代替探索的分析のために、これらのパラメーターを変更できます。
primary_drug_concept_id
:患者への主要な有効成分の曝露。secondary_drug_concept_id
:患者への二次的な有効成分の曝露。year
:患者が一次薬と二次薬の両方に積極的に曝露された目標年。
ノートブックの実行の詳細については、OMOP 変換サンプル ノートブックの使用 を参照してください。