Azure 中的 Lamna Healthcare 雲端規模分析方案
此參考架構是針對想要使用雲端規模分析的客戶所撰寫,不僅可擴縮性,還能保護其數據。 它示範如何控制敏感數據的存取權,以及如何與分析師共用適當的脫敏數據。
客戶資料
Lamna Healthcare (Lamna) 為醫療保健提供者提供患者管理服務。 他們在整個業務過程中處理高度敏感的病患數據。 必須謹慎限制對詳細數據的存取。 不過,Lamna 也希望能安全地使用這些數據的某些版本來指導其商務運作。 他們需要一個機制來與不違反病患信任或數據保護法的分析師共享數據。
現狀
今天,Lamna 將所有的數據儲存在本地。 病患數據會儲存在傳統的資料庫系統中。 不過,隨著業務成長,數據量增加,公司必須將病患應用程式遷移至雲端。 在此轉換過程中,他們想要把數據從應用程式複製到雲端分析平台,這樣分析師們能夠更有效地利用數據,而不會增加應用程式資料庫的負載。
Lamna 的一個重要考慮是患者數據的安全性。 身為醫療保健公司,它們受限於數個不同的數據保護法律。
架構解決方案
Lamna 會實作雲端級分析作為其雲端式分析平台的解決方案。 它們依賴多個登陸區域來增加延展性,以及清楚區分敏感數據產品。
資料管理著陸區
每個雲端規模分析實作的重要概念是具有一個數據管理登陸區域。 此訂用帳戶包含將在所有登陸區域共用的資源。 這包括共用的網路元件,例如防火牆和私人 DNS 區域。 它也包含數據和雲端治理的資源。 Microsoft Purview 和 Databricks Unity Catalog 已作為租戶層級的服務進行部署。
病人資料著陸區
在 Lamna 的組織圖中,患者管理群組是作業群組的一部分。 不過,鑒於他們所使用的數據非常敏感,他們在雲端規模分析架構中有自己的數據登陸區域。
此登陸區域會裝載來自公司病患管理應用程式和相關數據產品的詳細病患數據和健康記錄複本。 這些數據產品會由數據應用程式載入登陸區域,這些應用程式會定期將數據內嵌至雲端,並將其降落在 Azure Data Lake Storage 中。
營運數據落地區域
Lamna 的運營小組負責公司的核心業務營運,即為醫療保健提供者提供諮詢服務。 在作業數據登陸區域中,他們會儲存與這些醫療保健提供者及其互動服務相關的數據。
與所有商務數據一樣,這些數據產品有敏感度元素,而 Lamna 則想要保護其用戶端清單。 不過,由於此數據不包含個人的健康情況資訊,因此不受最嚴格的數據保護法約束。
數據應用程式
作業登陸區域具有 資料應用程式,可從 Lamna 的內部部署作業系統載入醫療保健提供者數據。 就像所有數據應用程式一樣,這會將數據存放到雲端 as-is,而且不會對數據產品進行轉換。
數據產品
整個 Lamna 的分析師需要存取數據,才能為企業建置報表。 不過,大部分的數據對於廣大觀眾來說太敏感了。 為了安全地存取高度敏感的病患數據,作業小組在其登陸區域中建立了 Tokenized 病患數據集 產品。 他們使用 Azure Data Factory,從病患登陸區域複製病患數據。 不過,小組會小心移除或標記包含個人資料的任何數據行。 此步驟可讓分析師將數據用於商務目的,而不公開患者的任何個人詳細數據。
營銷數據著陸區
行銷小組著重於取得新客戶,以及管理 Lamna 在市集中的位置。 其行銷登陸區域主要用於儲存和分析其服務市場和醫療保健產業的相關外部數據產品。
然而,為了支持新的行銷活動,該團體希望為 Lamna 的客戶所服務的患者進行健康成果研究。 他們希望產生一份以事實為基礎的報告,由強有力的統計證據支援,表明他們對醫療保健的方法會導致更好的結果。
為了支援這項新努力,行銷小組的研究人員必須以安全且合規的方式存取高度敏感的患者數據,同時仍能夠取得所需的資訊。
為了符合此需求,行銷小組會從作業小組所建立的標記化病患數據集建立匯總的數據產品。 這些數據產品不包含個別的健康情況記錄。 相反地,它們會依據不同的軸將記錄分組。 這有助於研究人員對全體人口進行研究,而不會冒著洩露個人健康資訊的風險。
圖 1:Lamna 架構的圖表。 並非所有 Azure 服務都會在圖表中表示。 簡化以強調如何在架構內組織資源的核心概念。
理由
所有敏感數據應該一律被賦予自己的數據登陸區域嗎?
不。 只有需要特定保護的極度限制數據,例如即時存取或客戶管理的金鑰,才需要專屬的網域區。 針對其他案例,Azure 中的其他數據保護功能可為您的數據提供高度安全的環境。 這包括數據列層級安全性、數據行層級安全性,以及加密的數據行。
後續步驟
- 繼續 雲端規模分析的部署範本。
- 深入瞭解 瞭解 Azure中雲端規模分析的數據隱私權。