在醫療保健資料解決方案中部署和設定 OMOP 轉換

發行項
11/18/2024

注意

目前正在更新此內容。

OMOP 轉換透過觀察性醫療結果研究聯盟 (OMOP) 開放社區標準為標準化分析提供資料準備。將醫療保健資料解決方案和醫療保健資料基礎功能部署到 Fabric 工作區後，就可以使用該功能。

OMOP 轉換是 Microsoft Fabric 中的醫療保健資料解決方案底下的一項選用功能。您可以根據特定需求或情境靈活地決定是否使用它。

先決條件

在 Microsoft Fabric 中部署醫療保健資料解決方案。
在部署醫療保健資料基礎中安裝基礎筆記本和管線。

部署 OMOP 轉換

您可以使用醫療保健資料解決方案：部署醫療保健資料基礎中所述的設定模組來部署該功能。但是，此模組中的樣本資料選取步驟不會為此功能部署樣本資料。 OMOP 轉換樣本資料在完成功能部署後，以獨佔方式安裝在醫療保健資料解決方案環境中。

如果您沒有使用設定模組來部署此功能，而是希望使用功能面板，請按照以下步驟操作：

前往 Fabric 上的醫療保健資料解決方案首頁。
選取 OMOP 轉換圖格。
在功能頁面上，選擇部署到工作區。
部署可能需要幾分鐘才能完成。部署過程中請勿關閉索引標籤或瀏覽器。等待期間，您可以在另一個索引標籤中工作。

部署完成後，您可以在訊息欄上看到一則通知。
在訊息列中選擇管理能力，進入能力管理頁面。

在這裡，您可以查看、設定和管理使用該功能部署的成品。

成品

該功能在醫療保健資料解決方案環境中安裝以下成品：

成品	類型
healthcare#_msft_gold_omop	湖倉
healthcare#_msft_omop_silver_gold_transformation	筆記本
healthcare#_msft_omop_drug_exposure_era_sample	筆記本
healthcare#_msft_omop_drug_exposure_insights_sample	筆記本
healthcare#_msft_omop_analytics	資料準銷售案源
healthcare#_msft_omop_semantic_model	語意模型
Vocab-HDS	範例資料

檢閱 OMOP 銀牌筆記本

healthcare#_msft_omop_silver_gold_transformation 筆記本使用作為醫療保健資料解決方案庫的一部分提供的 OMOP API 進行資料轉換。該筆記本將 healthcare#_msft_silver 湖倉中資源轉換成 OMOP common data model。然後將轉換後的資料插入到 OMOP 湖倉中。

筆記本利用所需的預設定值部署，以執行 OMOP 轉換資料管線。某些設定參數繼承自全域設定，且可以在筆記本等級覆寫。根據預設，不需要對筆記本設定檔進行任何變更。如果需要，可以透過選取環境中的相應筆記本和設定檔來查看或修改設定。

若要了解有關筆記本執行的詳細資訊，請參閱使用 OMOP 轉換。

檢閱 OMOP 語意模型

OMOP 語意模型 healthcare#_msft_omop_semantic_model 是基於 OMOP 金牌湖倉的訂製語意模型。它包括下面 OMOP 表格之間的一些關鍵 OMOP CDM 版本 5.4 關係：

位置
人員
觀測
Procedure_Occurrence
Condition_Occurrence
注意
Drug_Exposure
Visit_Ocurrence
Image_Occurrence
量值

這些關係形成在醫療保健資料解決方案的發現和建置同類群組 (預覽版) 功能中，產生 Power BI報告所需的最小集合。您可以使用此語意模型作為基礎，從 OMOP 湖倉新增更多 OMOP 表格和關係，以根據您的 OMOP 標準湖倉資料建立自訂 Power BI 報告。

設定藥物暴露時代樣本筆記本

healthcare#_msft_omop_drug_exposure_era_sample 樣本筆記本示範如何在 Azure Synapse Analytics 筆記本中的使用 PySpark (Python) 語言的 OMOP 中產生 drug_era 表格記錄，主要用於探索目的。 drug_era 表格記錄產生遵循 OHDSI 藥物時代樣本指令碼，該指令碼適用於在 Azure Synapse Analytics 中使用 PySpark。藥物時代產生器指令碼包含在自訂 Python 庫中，該庫打包為 wheel (WHL) 檔案並上傳到 Apache Spark 集區以便於存取。

在執行筆記本之前，請記住以下先決條件：

確定 OMOP 資料庫在下表中具有有效資料：
- drug_exposure
- 概念
- concept_ancestor
您可以使用樣本資料或你自己的資料，透過執行 FHIR 到 OMOP 資料管線來產生此資料。
請確認自訂庫 wheel 套件已附加到用於執行此筆記本的 Spark 集區。

此筆記本的關鍵設定參數為 omop_database_name。此參數會識別包含用於產生 drug_era 表格的資料的 OMOP 資料庫名稱。僅當您的 OMOP 資料庫與全域設定檔中的預設值不同時，才更新此值。

如果 OMOP drug_exposure 表格填入有效資料，則此筆記本將叫用 DrugEraGenerator 模組，該模組會將一個人接觸到活性藥物成分的時間段串在一起，允許 30 天間隔。 DrugEraGenerator 模組會刪除所有現有的 drug_era 記錄，並根據最新 OMOP 資料產生新記錄。

若要了解有關筆記本執行的詳細資訊，請參閱使用 OMOP 轉換樣本筆記本。

設定藥物暴露深入解析樣本筆記本

healthcare#_msft_omop_drug_exposure_insights_sample 樣本筆記本展示對在 Azure Synapse Analytics 筆記本中使用 PySpark 的drug_era 表格的探索性分析。該分析產生一個長條圖，顯示病患對活性成分的二次藥物暴露，按特定年份的性別和年齡分層。 drug_era 表格是使用上一個筆記本 healthcare#_msft_omop_drug_exposure_era_sample 叫用的自訂庫 DrugEraGenerator 產生的。該分析透過合併基於性別和年齡的分層擴充了藥物暴露查詢 DEX03：年齡分佈，按藥物分層。

在執行筆記本之前，請記住以下先決條件：

如果要編輯筆記本設定，請務必複製此筆記本。不要直接更新筆記本。
請透過執行藥物暴露時代筆記本來確認 drug_era 表格包含資料。執行此筆記本會根據最新 OMOP 資料，將任何現有 drug_era 記錄替換為新記錄。
按原樣使用此筆記本以進行探索性分析，並建立副本以執行自訂分析。

以下關鍵筆記本設定參數。您可以修改這些參數，以便對病患藥物暴露進行替代探索性分析：

primary_drug_concept_id：病患接觸的主要活性成分。
secondary_drug_concept_id：病患接觸的次要活性成分。
year：病患積極接觸主要和次要藥物的目標年份。

若要了解有關筆記本執行的詳細資訊，請參閱使用 OMOP 轉換樣本筆記本。

共用方式為

在醫療保健資料解決方案中部署和設定 OMOP 轉換

先決條件

部署 OMOP 轉換

成品

檢閱 OMOP 銀牌筆記本

檢閱 OMOP 語意模型

設定藥物暴露時代樣本筆記本

設定藥物暴露深入解析樣本筆記本

意見反應

其他資源

共用方式為

在醫療保健資料解決方案中部署和設定 OMOP 轉換

先決條件

部署 OMOP 轉換

成品

檢閱 OMOP 銀牌筆記本

檢閱 OMOP 語意模型

設定藥物暴露時代樣本筆記本

設定藥物暴露深入解析樣本筆記本

相關資訊

意見反應

其他資源