你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 中的 Lamna Healthcare 云规模分析方案

此参考体系结构适用于想要使用云规模分析实现可伸缩性,同时也要保护其数据的客户。 它演示了如何控制对敏感数据的访问,以及如何与分析师共享适当脱敏的数据。

客户配置文件

Lamna 医疗保健 (Lamna) 为医疗保健提供者提供患者管理服务。 他们在整个业务过程中处理高度敏感的患者数据。 必须仔细限制对详细数据的访问。 但是,Lamna 也希望安全地使用这些数据的某些版本来告知其业务实践。 他们需要一种机制来与分析师共享数据,而不会违反患者信任或数据保护法。

当前情况

如今,Lamna 将其所有数据都存储在本地。 患者数据存储在传统的数据库系统中。 然而,随着他们业务的增长和数据量的增加,公司必须将他们的患者应用程序迁移到云端。 作为这一转变的一部分,他们希望将数据从应用程序复制到一个基于云的分析平台,这样他们的分析人员就可以更好地利用数据,而不会给应用程序数据库增加额外的负载。

Lamna 的一个关键问题是患者数据的安全性。 作为一家医疗保健公司,他们必须要遵守多种不同的数据保护法律。

体系结构解决方案

Lamna 将实施云规模分析作为基于云的分析平台的解决方案。 他们将依赖多个登录区域来提高可扩展性和明确分离敏感数据产品。

数据管理登陆区域

每个云规模分析实施的一个关键概念是拥有一个数据管理登陆区域。 此订阅包含跨所有登陆区域共享的资源。 这包括共享网络组件,例如防火墙和专用 DNS 区域。 还包括用于数据和云治理的资源,例如 Azure Policy 和 Azure Purview。

患者数据登陆区域

在 Lamna 的组织结构图中,患者管理组是运营组的一部分。 然而,鉴于他们使用的数据极其敏感,他们将在云规模分析架构中拥有自己的数据登陆区域。

此登陆区域将托管来自公司患者管理应用程序和相关数据产品的详细患者数据和健康记录的副本。 这些数据产品将通过数据集成加载到登陆区域,这些数据应用程序会定期将数据引入云并将其登陆 Azure Data Lake Storage。

运营数据登陆区域

Lamna 的运营团队负责公司的核心业务,即为医疗保健提供商提供咨询服务。 在他们的运营数据登录区域,他们存储与这些医疗保健提供者和他们参与的服务相关的数据。

与所有业务数据一样,这些数据产品存在敏感性因素,Lamna 希望保护其客户列表。 但是,由于这些数据不包括个人的健康信息,因此无需遵守最严格的数据保护法。

数据应用程序

运营登录区域具有数据应用程序,可从 Lamna 的本地运营系统加载医疗保健提供者数据。 与所有数据应用程序一样,这会将数据按原样放置在云中,并且不会对数据产品应用转换。

数据产品

Lamna 的分析师需要访问数据以获取生成业务报告。 但是,对于广大受众而言,大部分数据过于敏感。 为了安全地提供对高度敏感的患者数据的访问,运营团队在他们的登陆区域创建了一个“标记化的患者数据集”产品。 他们使用 Azure 数据工厂从患者登陆区域复制患者数据。 但是,该团队小心翼翼地删除或标记任何包含个人数据的列。 这允许分析师将数据用于商业目的,而不会暴露患者的任何个人详细信息。

营销数据登陆区域

营销团队专注于获得新客户和管理 Lamna 在市场中的地位。 营销团队的营销登陆区域主要用于存储和分析有关他们所服务的市场和医疗保健行业的外部数据产品。

然而,为了推动新的营销,该组织希望对 Lamna 客户所服务的患者的健康结果进行研究。 他们希望制作一份基于事实的报告,并得到强有力的统计证据的支持,表明他们的医疗保健方法会带来更好的结果。

为了支持这项新工作,营销团队的研究人员需要以安全和合规的方式访问高度敏感的患者数据,同时仍然能够获得他们需要的信息。

为了满足这一需求,营销团队从运营团队创建的标记化患者数据集创建聚合数据产品。 这些数据产品不包含个人健康记录。 相反,它们将记录分组到不同的轴上。 这有助于研究人员对总体进行研究,而不会冒险访问任何个人的健康信息。

体系结构示意图。

图 1:体系结构示意图。 示意图中并未体现所有 Azure 服务。 它经过简化,用于突出如何在体系结构中组织资源的核心概念。

理由

是否应该始终为所有敏感数据提供自己的数据登陆区域?

否。 只有需要特定保护的最严格限制的数据(例如即时访问或客户管理的密钥)才需要自己的登陆区域。 对于其他方案,Azure 中的其他数据保护功能可以为你的数据提供高度安全的环境。 这包括行级安全性、列级安全性和加密列。

部署模板

若要部署体系结构,请使用以下 GitHub 存储库中的数据管理登陆区域和数据登陆区域参考实现模板:

使用以下模板在 Lamna 数据登陆区域中部署其他数据应用程序和数据产品:

名称 数据登陆区域 类型 模板
患者 患者 数据应用程序 数据产品批处理模板
健康记录 患者 数据应用程序 数据产品批处理模板
提供程序 操作 数据应用程序 数据产品批处理模板
已标记患者 操作 数据产品 数据产品批处理模板
聚合患者数据 Marketing 数据产品 数据产品批处理模板

重要

并非要部署上述参考实现模板中的所有内容才能满足 Lamna 的需求。 模板需要进行一定程度的自定义。 在部署之前,应从模板中删除不需要的服务。

后续步骤