你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 中云规模分析的 Lamna Healthcare 场景

此参考体系结构是为想要使用云缩放分析的客户编写的,不仅为了可伸缩性,而且要保护其数据。 它演示了如何控制对敏感数据的访问,以及如何与分析师共享适当的脱敏数据。

客户个人资料

Lamna Healthcare (Lamna) 向医疗保健提供商提供患者管理服务。 在整个业务过程中,他们处理高度敏感的患者数据。 必须仔细限制对详细数据的访问。 但是,Lamna 还希望安全地使用此数据的一些版本来告知其业务惯例。 他们需要一种机制来与不违反患者信任或数据保护法的分析师共享数据。

现状

今天,Lamna 在本地存储其所有数据。 患者数据存储在传统的数据库系统中。 但是,随着业务的增长和数据量增加,公司必须将患者应用程序迁移到云。 作为此转换的一部分,他们希望将数据从应用程序复制到基于云的分析平台,使分析人员能够更好地利用数据,而无需在应用程序数据库上额外加载数据。

Lamna 的一个关键问题是患者数据的安全性。 作为一家医疗保健公司,它们受多项不同的数据保护法的约束。

体系结构解决方案

Lamna 将实现云规模分析作为基于云的分析平台的解决方案。 它们依赖于多个登陆区域来提高可伸缩性和明确分离敏感数据产品。

数据管理登陆区域

每个云规模分析实施的关键概念是在拥有一个数据管理着陆区。 此订阅包含跨所有登陆区域共享的资源。 这包括共享网络组件,例如防火墙和专用 DNS 区域。 它还包括用于数据和云治理的资源。 Microsoft Purview 和 Databricks Unity Catalog 已作为租户级别的服务进行部署。

患者数据登陆区域

在 Lamna 的组织图中,患者管理组是操作组的一部分。 但是,鉴于他们使用的数据的极端敏感度,他们在云规模分析体系结构中有自己的数据登陆区域。

此落地区域托管了一份来自公司患者管理应用程序与相关数据产品的详细患者数据和健康记录的副本。 这些数据产品由数据应用程序加载到登陆区域,这些应用程序会定期将数据引入云中,并将其降落在 Azure Data Lake Storage 中。

运营数据登陆区域

Lamna 运营团队负责公司的核心业务线,即向医疗保健提供商提供咨询服务。 在运营数据登陆区域中,他们存储与这些医疗保健提供商及其参与的服务相关的数据。

与所有业务数据一样,这些数据产品具有敏感度元素,而 Lamna 希望保护其客户端列表。 但是,由于这些数据不包括有关个人的健康信息,因此不受最严格的数据保护法的管理。

数据应用程序

运营登录区域具有数据应用程序,可从 Lamna 的本地运营系统加载健康护理提供方数据。 与所有数据应用程序一样,这会将数据按原样放置在云中,并且不会对数据产品应用转换。

数据产品

整个 Lamna 的分析师都需要访问数据来为业务生成报表。 但是,对于广大受众来说,大部分数据过于敏感。 为了安全地提供对高度敏感的患者数据的访问,运营团队在其登陆区域中创建了一个 标记化患者数据集 产品。 使用 Azure 数据工厂,从患者登陆区域复制患者数据。 但是,团队小心翼翼地删除或标记包含个人数据的任何列。 此步骤允许分析师将数据用于业务目的,而无需公开患者的任何个人信息。

营销数据登陆区域

营销组专注于获取新客户和管理 Lamna 在市场中的地位。 他们的营销登陆区域主要用于存储和分析外部数据产品,了解他们服务的市场和医疗保健行业。

为了支持一项新的市场营销活动,该组织希望对Lamna客户所服务患者的健康结果进行研究。 他们希望生成一份基于事实的报告,由强有力的统计证据支持,表明他们对医疗保健的方法会导致更好的结果。

为了支持这项新工作,营销组中的研究人员需要以安全合规的方式访问高度敏感的患者数据,同时仍能够获取所需的信息。

为了满足此需求,营销团队从运营团队创建的标记化患者数据集创建聚合数据产品。 这些数据产品不包含个人健康记录。 相反,它们跨不同的轴对记录进行分组。 这有助于研究人员对整个人群进行研究,而不会冒着访问任何个人健康信息的风险。

Lamna 体系结构的关系图。

图 1:Lamna 体系结构示意图。 并非所有 Azure 服务都在关系图中表示。 它以简化的方式突出显示了在体系结构中如何组织资源的核心概念。

理由

是否应始终为所有敏感数据提供自己的数据登陆区域?

不。 只有需要特定保护的最受限数据(如实时访问或客户管理的密钥)需要自己的登陆区域。 对于其他方案,Azure 中的其他数据保护功能为数据提供了高度安全的环境。 这包括行级安全性、列级安全性和加密列。

后续步骤