資料資產策略概觀
整合來自不同系統和應用程式的醫療保健與生命科學資料是一項成本高昂且耗時的工作。 為了解決此問題,實施資料資產策略變得至關重要,因為它為組織建立了整合的標準,以有效地管理所有資料,無論其儲存位置或格式如何。
資料資產策略是指組織為有效管理整個資料生態系統所採用的全面、結構化的方法。 該策略涉及制定明確的計劃和一套指導方針,用於跨組織內各種來源、系統和應用程式獲取、儲存、處理、保護和使用資料。 由於醫療保健與生命科學機構處理各種資料,包括臨床資料、影像資料、動作和研究資料;有效的資料管理對於維護機密性、遵守法規、獲得競爭優勢以及為病患提供有效的照護至關重要。
注意
Microsoft Fabric 是一款面向企業的多合一分析解決方案,涵蓋從資料移動到資料科學、即時分析和商業智慧的所有內容。 它提供一整套服務,包括資料湖、資料工程和資料整合,全部集中在一個地方。 Microsoft Fabric 中的醫療保健資料解決方案可讓醫療保健組織打破資料孤島,並在單一整合存放區中協調不同的醫療資料,在該存放區中分析和 AI 工作負載可以大規模執行。 利用該平台的原生功能,醫療保健組織可以在每個照護點建立互聯體驗,增強員工的能力,並從臨床和營運資料中釋放價值。 Microsoft Fabric 中的醫療保健資料解決方案目前處於預覽階段,此「架構完善」文件將在未來版本中進行更新,以包含 Microsoft Fabric 中的醫療保健資料解決方案。
醫療保健和生命科學中的資料管理
隨著醫療保健產業轉向價值型照護模式,強調以病患為中心的照護,透過沉浸式體驗產生的病患資料量顯著增長。 各個接觸點的醫療保健資料呈指數級增長,需要強大的資料管理策略來有效管理和利用這些資料,以產生可動作的深入解析,從而改善成員和病患的整體健康狀況。
資料管理挑戰
醫療保健和生命科學產業是複雜且動態的環境,需要高度整合和互通性才能有效運作。 該產業面臨的一個主要挑戰是,它傳統上是孤立的,不同的提供者和組織使用不同的系統和技術。 這些系統和技術之間缺乏整合和互通性,導致病患照護效率低下、錯誤和缺乏連續性。 以下是一些常見的資料管理挑戰:
- 資料孤島:不同系統之間缺乏資料共用導致資料孤島。 醫療保健提供者難以存取和共用病患資料,這可能導致照護缺乏連續性。
- 缺乏標準化:醫療保健組織和生命科學公司使用不同的系統和技術,導致難以無縫地溝通和交換資料。
- 系統的複雜性:醫療保健和生命科學系統日益複雜,有效整合和互通資料面臨挑戰,從而導致成本增加和照護服務延遲。
- 資料格式錯誤或缺失:資料格式錯誤或缺失會影響從這些資料得出的深入解析的準確性和可靠性。
- 安全和隱私問題:病患資料的安全和隱私對於醫療保健提供者和生命科學公司至關重要。 跨不同系統共用資料會增加資料外洩的風險並損害病患隱私。
- 產業法規:醫療保健和生命科學產業對資料處理有最嚴格的產業法規,這使得資料共用和存取變得困難。
- 非統一資料的去識別化:法律通常要求將資料去識別化,這既困難又耗時。
- 地理上的唯一資料集:很難轉換地理上的唯一資料集以進行研究 (即人口健康資料)。
資料管理階段
有效管理大量資料涉及多個階段,每個階段對於使用基礎資料產生高品質的可執行的深入解析都同樣重要。
主要階段如下:
探索
醫療保健和生命科學背景下的資料發現是指識別資料來源、資料格式 (例如結構化資料、非結構化資料) 並存取它們的過程。 發現資料的幾種方法包括真實世界的資料和真實世界的證據。 真實世界資料是指從傳統臨床試驗之外的各種來源常規收集的資料,例如電子健康記錄、索賠和計費活動、處方資料、可穿戴裝置資料以及透過病患調查收集的資料或其他病患產生的資料方法。 下圖根據分類和資料標準展示了最常見的醫療保健資料。
擷取
擷取是連線、收集和控制探索階段中確定各種來源之資訊流程的過程。 下圖展示了不同的選項,例如 Azure Functions、Logic Apps、Azure Data Factory 等。 由 Microsoft 提供,用於擷取各種資訊類型。
- 下圖顯示了從智慧型穿戴裝置等醫療裝置中擷取 IoT 資料的擷取管線。
- 下圖說明了醫療裝置產生的資料可能不是標準格式,因此,要先對其進行標準化,然後將其作為 FHIR 觀察資源儲存在 FHIR 伺服器中。 圖中顯示的步驟由 Azure 健康資料服務中的醫療技術服務自動執行。
- 下圖說明了處理臨床資料、DICOM 資料、非結構化資料和 SDoH 的擷取管線。
持續性
將擷取的資料儲存在永久儲存體上非常重要。 這可讓其他應用程式 (例如機器學習管線) 使用資料並產生資料深入解析,並讓 Power BI 視覺化資料的分佈。 Microsoft 提供各種持續性平台,例如 Azure Data Lake Storage、Azure Health Data Services 和 Microsoft Dataverse 來儲存您的醫療保健資料。 微軟也提供 FHIR 服務 API、DICOM 服務、醫療技術服務等 API,Dataverse 醫療保健 API 會將資料擷取到所提供的平台中。
整合
整合是指將不同的系統、技術、資料來源和流程整合在一起,為病患、醫療保健提供者和其他利害關係人創造具有凝聚力體驗的過程。 Microsoft Cloud for Healthcare 提供即用型工具來整合 Dataverse 資料儲存庫與各種醫療保健資料來源 (例如 Azure 健康資料服務、非 Microsoft FHIR 伺服器等)。下圖說明了 FHIR 資料與 Azure 健康資料服務中的 Azure Databricks Delta Lake 的整合。 如需更多資訊,請參閱將 FHIR 資料連接到 Azure 健康資料服務中的 Azure Databricks Delta Lake
智慧
智慧是指將智慧新增到資料中以得出更深入見解的過程。 Microsoft 提供了 Azure 機器學習、認知服務、Azure Databricks、Azure Synapse Analytics 等工具,來為醫療保健資料新增智慧。
分析
分析涉及分析醫療保健資料以發現趨勢和模式。 Power BI 等工具可用於視覺化醫療保健資料的趨勢和模式,以改善臨床決策支援並提高營運效率。
下圖展示了資料保健資料的完整生命週期:
下圖展示了醫療技術資料的完整生命週期:
由 Microsoft 提供的資料管理解決方案
Microsoft 提供了一系列廣泛的工具來處理和管理醫療保健資料。 下表提供了可用於管理醫療保健資料的完整工具清單。 您可以點擊各個工具對應的參考連結以獲取更多資訊。
資料階段 | 工具 | 描述 | 福利 | 參考連結 |
---|---|---|---|---|
擷取 | FHIR-Bulk Loader 和匯出 | 提供引入和匯出 FHIR 資料服務的 Azure Function 應用程式方案。 | FHIR-Bulk Loader 每小時可以匯入數十萬個檔案。 | microsoft/fhir-loader:大量 FHIR 資料載入程式 |
擷取 | FHIR 轉換器 | 可將健康資料從舊版格式轉換為 FHIR 標準格式 | 支援以下轉換:1. HL7v2 至 FHIR 2。 C-CDA 至 FHIR 3。 JSON 至 FHIR 4。 FHIR STU3 至 FHIR R4 | microsoft/FHIR-Converter:將舊資料格式轉換為 FHIR 的轉換公用程式 |
擷取 | Healthkit-on-FHIR | HealthKitOnFhir 是一個 Swift 程式庫,可自動將 Apple HealthKit 資料匯出到 FHIR® 伺服器。 | HealthKit 資料可以透過適用於 Azure 的 IoMT FHIR 連接器進行路由,以將高頻率資料分組,從而減少產生的觀察資源的數量。 HealthKit 資料也可以直接匯出到 FHIR 伺服器 (適用於低頻率資料)。 | microsoft/healthkit-on-fhir:HealthKitOnFhir 是一個 Swift 程式庫,可自動將 Apple HealthKit 資料匯出到 FHIR 伺服器 |
持續性 | Microsoft Cloud for Healthcare 資料模型 | Microsoft Cloud for Healthcare 中的資料模型是根據快速健康照護互通資源 (FHIR) 標準架構建立的,可輕鬆部署在 Dataverse 環境中。 | 它簡化了新使用案例和工作流程的實作,而無需重新定義醫療保健資料架構。 FHIR 型的模型讓醫療保健客戶可以更輕鬆、更快速和更安全地使用 Dynamics 365。 | 資料模型概觀 |
持續性 | Dataverse Healthcare APIs | 支援以 FHIR 格式向 Dataverse 實體寫入 FHIR 資料以及從 Dataverse 實體讀取資料。 | FHIR 資料到 Common Data Model 的轉換,反之亦然 | Dataverse Healthcare API 概觀 |
持續性 | Azure 健康資料服務 | 它是一個受管理平台即服務 (PaaS),提供統一平台來儲存 FHIR、DICOM 和醫療技術資料。 | 它支援更安全、更合規的路徑來擷取、保留和連接雲端中的健康資料。 | 開始使用 Azure 健康資料服務 |
整合 | 資料整合工具組 | 它提供了廣泛的預設實體對應和屬性對應集合,這些對應建構為符合 HL7 FHIR 規範,並部署為 Dataverse 記錄。 | 它具有高度可設定性,可以滿足各種解決方案的要求。 | 資料整合工具組 - Microsoft Cloud for Healthcare 概觀 |
整合 | 虛擬健康資料表格 | 支援將資料直接從 FHIR 伺服器引入 Microsoft Cloud for Healthcare 解決方案,而不將資料永久儲存在 Dataverse 實體中。 | 避免資料重複,節省儲存成本。 | 虛擬健康表格的概觀 |
智慧 | Text Analytics for Health | 這是 Azure AI 語言提供的預建功能。 它是一種雲端式 API 服務,套用機器學習智慧從各種非結構化文字 (例如醫生筆記、出院摘要、臨床文件和電子健康記錄) 中擷取和標記相關醫療資訊。 | Text Analytics for Health 可執行四個關鍵功能,即實體識別、關係擷取、實體連結和判斷提示偵測,所有這些功能都透過單一 API 呼叫來執行。 | Azure AI 語言中的 Text Analytics for Health 是什麼? - Azure AI 服務 |
持續性和分析 | 醫療保健資料庫範本 | Azure Synapse 中的資料庫範本是特定產業的結構描述定義,可提供快速建立資料庫 (亦即資料庫湖) 的方法,以快速建置含分析資訊的產業應用程式。 | 您可以使用這些資訊藍圖,來規劃、架構和設計資料治理、報表、商業智慧和進階分析的資料解決方案。 | 將醫療保健資料庫範本與 Microsoft Cloud for Healthcare 結合使用 |
分析 | FHIR 服務分析與 Azure Databricks Delta Lake Analytics | Data Lakehouse 是一種開放的資料架構,結合了傳統資料湖和資料倉儲的現有功能。 Delta Lake 已成為領先的儲存框架,能夠在現有資料湖技術之上建立 Lakehouse 架構。 Azure 健康資料服務透過匯出符合開放性 SQL on FHIR 標準的 FHIR 資料 parquet 檔案來支援 Lakehouse 架構。 | 為 FHIR 資料建置 Lakehouse 具有以下優點:1. 將您的 FHIR 資料與其他資料集結合。 2. 擁有一致的企業就緒資料位置,可在整個組織內提供更多自助服務。 3. 中繼資料管理和資料版本控制簡化了經常更新的資料。 | healthcare-apis-samples/src/azuredatabricks-deltalake 主要 · microsoft/healthcare-apis-samples |
正在測試 | Synthea | Synthea 是一個模擬病患產生器,可以對合成病患的病史進行建模。 它輸出高品質的模擬內容、逼近真實的病患資料和涵蓋醫療保健各個方面的相關健康記錄。 | 產生的資料不受成本、隱私和安全性限制。 它可以不受限制地用於學術界、研究、產業和政府的各種二次使用。 | synthetichealth/synthea Wiki |
另請參閱
Microsoft Cloud for Healthcare 平台上有一些常用的架構來處理醫療保健資料。 這些可以用作參考來客製化處理和管理醫療保健資料所需的確切解決方案。 如需詳細資訊,請參閱 Microsoft Cloud for Healthcare 參考架構。
詳細了解 Microsoft Fabric 端對端情境: