共用方式為


在醫療保健資料解決方案中部署和設定 OMOP 轉換

注意

目前正在更新此內容。

OMOP 轉換透過觀察性醫療結果研究聯盟 (OMOP) 開放社區標準為標準化分析提供資料準備。 將醫療保健資料解決方案和醫療保健資料基礎功能部署到 Fabric 工作區後,就可以使用該功能。

OMOP 轉換是 Microsoft Fabric 中的醫療保健資料解決方案底下的一項選用功能。 您可以根據特定需求或情境靈活地決定是否使用它。

先決條件

部署 OMOP 轉換

您可以使用醫療保健資料解決方案:部署醫療保健資料基礎中所述的設定模組來部署該功能。 但是,此模組中的樣本資料選取步驟不會為此功能部署樣本資料。 OMOP 轉換樣本資料在完成功能部署後,以獨佔方式安裝在醫療保健資料解決方案環境中。

如果您沒有使用設定模組來部署此功能,而是希望使用功能面板,請按照以下步驟操作:

  1. 前往 Fabric 上的醫療保健資料解決方案首頁。

  2. 選取 OMOP 轉換圖格。

    顯示 OMOP 轉換圖格的螢幕截圖。

  3. 在功能頁面上,選擇部署到工作區

    顯示如何將功能部署到工作區的螢幕截圖。

  4. 部署可能需要幾分鐘才能完成。 部署過程中請勿關閉索引標籤或瀏覽器。 等待期間,您可以在另一個索引標籤中工作。

    部署完成後,您可以在訊息欄上看到一則通知。

  5. 在訊息列中選擇管理能力,進入能力管理頁面。

    在這裡,您可以查看、設定和管理使用該功能部署的成品。

成品

該功能在醫療保健資料解決方案環境中安裝以下成品:

成品 類型​
healthcare#_msft_gold_omop 湖倉
healthcare#_msft_omop_silver_gold_transformation 筆記本
healthcare#_msft_omop_drug_exposure_era_sample 筆記本
healthcare#_msft_omop_drug_exposure_insights_sample 筆記本
healthcare#_msft_omop_analytics 資料準銷售案源
healthcare#_msft_omop_semantic_model 語意模型
Vocab-HDS 範例資料

檢閱 OMOP 銀牌筆記本

healthcare#_msft_omop_silver_gold_transformation 筆記本使用作為醫療保健資料解決方案庫的一部分提供的 OMOP API 進行資料轉換。 該筆記本將 healthcare#_msft_silver 湖倉中資源轉換成 OMOP common data model。 然後將轉換後的資料插入到 OMOP 湖倉中。

筆記本利用所需的預設定值部署,以執行 OMOP 轉換資料管線。 某些設定參數繼承自全域設定,且可以在筆記本等級覆寫。 根據預設,不需要對筆記本設定檔進行任何變更。 如果需要,可以透過選取環境中的相應筆記本和設定檔來查看或修改設定。

若要了解有關筆記本執行的詳細資訊,請參閱使用 OMOP 轉換

檢閱 OMOP 語意模型

OMOP 語意模型 healthcare#_msft_omop_semantic_model 是基於 OMOP 金牌湖倉的訂製語意模型。 它包括下面 OMOP 表格之間的一些關鍵 OMOP CDM 版本 5.4 關係:

  • 位置
  • 人員
  • 觀測
  • Procedure_Occurrence
  • Condition_Occurrence
  • 注意
  • Drug_Exposure
  • Visit_Ocurrence
  • Image_Occurrence
  • 量值

這些關係形成在醫療保健資料解決方案的發現和建置同類群組 (預覽版) 功能中,產生 Power BI報告所需的最小集合。 您可以使用此語意模型作為基礎,從 OMOP 湖倉新增更多 OMOP 表格和關係,以根據您的 OMOP 標準湖倉資料建立自訂 Power BI 報告。

設定藥物暴露時代樣本筆記本

healthcare#_msft_omop_drug_exposure_era_sample 樣本筆記本示範如何在 Azure Synapse Analytics 筆記本中的使用 PySpark (Python) 語言的 OMOP 中產生 drug_era 表格記錄,主要用於探索目的。 drug_era 表格記錄產生遵循 OHDSI 藥物時代樣本指令碼,該指令碼適用於在 Azure Synapse Analytics 中使用 PySpark。 藥物時代產生器指令碼包含在自訂 Python 庫中,該庫打包為 wheel (WHL) 檔案並上傳到 Apache Spark 集區以便於存取。

在執行筆記本之前,請記住以下先決條件:

  • 確定 OMOP 資料庫在下表中具有有效資料:

    • drug_exposure
    • 概念
    • concept_ancestor

    您可以使用樣本資料或你自己的資料,透過執行 FHIR 到 OMOP 資料管線來產生此資料。

  • 請確認自訂庫 wheel 套件已附加到用於執行此筆記本的 Spark 集區。

此筆記本的關鍵設定參數為 omop_database_name。 此參數會識別包含用於產生 drug_era 表格的資料的 OMOP 資料庫名稱 。 僅當您的 OMOP 資料庫與全域設定檔中的預設值不同時,才更新此值。

如果 OMOP drug_exposure 表格填入有效資料,則此筆記本將叫用 DrugEraGenerator 模組,該模組會將一個人接觸到活性藥物成分的時間段串在一起,允許 30 天間隔。 DrugEraGenerator 模組會刪除所有現有的 drug_era 記錄,並根據最新 OMOP 資料產生新記錄。

若要了解有關筆記本執行的詳細資訊,請參閱使用 OMOP 轉換樣本筆記本

設定藥物暴露深入解析樣本筆記本

healthcare#_msft_omop_drug_exposure_insights_sample 樣本筆記本展示對在 Azure Synapse Analytics 筆記本中使用 PySpark 的drug_era 表格的探索性分析。 該分析產生一個長條圖,顯示病患對活性成分的二次藥物暴露,按特定年份的性別和年齡分層。 drug_era 表格是使用上一個筆記本 healthcare#_msft_omop_drug_exposure_era_sample 叫用的自訂庫 DrugEraGenerator 產生的。 該分析透過合併基於性別和年齡的分層擴充了藥物暴露查詢 DEX03:年齡分佈,按藥物分層

在執行筆記本之前,請記住以下先決條件:

  • 如果要編輯筆記本設定,請務必複製此筆記本。 不要直接更新筆記本。
  • 請透過執行藥物暴露時代筆記本來確認 drug_era 表格包含資料。 執行此筆記本會根據最新 OMOP 資料,將任何現有 drug_era 記錄替換為新記錄。
  • 按原樣使用此筆記本以進行探索性分析,並建立副本以執行自訂分析。

以下關鍵筆記本設定參數。 您可以修改這些參數,以便對病患藥物暴露進行替代探索性分析:

  • primary_drug_concept_id:病患接觸的主要活性成分。
  • secondary_drug_concept_id:病患接觸的次要活性成分。
  • year:病患積極接觸主要和次要藥物的目標年份。

若要了解有關筆記本執行的詳細資訊,請參閱使用 OMOP 轉換樣本筆記本