Cenário do Lamna Healthcare para análise em escala de nuvem no Azure
Essa arquitetura de referência foi escrita para clientes que desejam usar análises em escala de nuvem não apenas para escalabilidade, mas para proteger seus dados. Ele demonstra como o acesso a dados confidenciais pode ser controlado e como dados adequadamente dessensibilizados podem ser compartilhados com analistas.
Perfil do cliente
A Lamna Healthcare (Lamna) oferece serviços de gestão de pacientes a prestadores de cuidados de saúde. Eles lidam com dados de pacientes altamente confidenciais ao longo do curso de seus negócios. O acesso aos dados pormenorizados deve ser cuidadosamente restringido. No entanto, a Lamna também gostaria de usar com segurança alguma versão desses dados para informar suas práticas comerciais. Eles precisam de um mecanismo para compartilhar os dados com analistas que não viole a confiança do paciente ou as leis de proteção de dados.
Situação atual
Hoje, a Lamna armazena todos os seus dados no local. Os dados do paciente são armazenados em um sistema de banco de dados tradicional. No entanto, à medida que o seu negócio cresceu e o volume de dados aumentou, a empresa deve migrar as suas aplicações de pacientes para a nuvem. Como parte dessa transição, eles gostariam de copiar os dados do aplicativo para uma plataforma de análise baseada em nuvem que permitirá que seus analistas façam melhor uso dos dados sem colocar carga extra no banco de dados do aplicativo.
Uma preocupação crítica para Lamna é a segurança dos dados dos pacientes. Como uma empresa de saúde, eles estão sujeitos a várias leis diferentes de proteção de dados.
Solução arquitetónica
A Lamna implementará análises em escala de nuvem como sua solução para uma plataforma de análise baseada em nuvem. Eles dependem de várias zonas de aterrissagem, tanto para maior escalabilidade quanto para uma separação clara de produtos de dados confidenciais.
Zona de aterrissagem de gerenciamento de dados
Um conceito crítico para cada implementação de análise em escala de nuvem é ter uma zona de aterrissagem de gerenciamento de dados. Esta subscrição contém recursos que serão partilhados em todas as zonas de aterragem. Isso inclui componentes de rede compartilhados, como um firewall e zonas DNS privadas. Também inclui recursos para governança de dados e nuvem. O Microsoft Purview e o Databricks Unity Catalog foram implantados como serviços no nível do locatário.
Área de receção de dados de pacientes
No organograma de Lamna, o grupo de gestão de pacientes faz parte do grupo de operações. No entanto, dada a extrema sensibilidade dos dados que usam, eles têm sua própria zona de aterrissagem de dados na arquitetura de análise em escala de nuvem.
Esta zona de aterrissagem hospeda uma cópia dos dados detalhados do paciente e registros de saúde do aplicativo de gerenciamento de pacientes da empresa e produtos de dados relacionados. Esses produtos de dados são carregados na zona de destino por aplicações de dados que vão regularmente ingerir os dados para a nuvem e armazená-los no Azure Data Lake Storage.
Zona de aterrissagem de dados de operações
O grupo de operações da Lamna é responsável pela linha de negócio principal da empresa, nomeadamente a prestação de serviços de consultoria a prestadores de cuidados de saúde. Na sua zona de aterragem de dados de operações, armazenam dados relacionados com estes prestadores de cuidados de saúde e os serviços com os quais se envolvem.
Como todos os dados de negócios, há um elemento de sensibilidade a esses produtos de dados, e Lamna of quer proteger sua lista de clientes. No entanto, como esses dados não incluem informações de saúde sobre indivíduos, eles não estão sujeitos às leis de proteção de dados mais rigorosas.
Aplicações de dados
A zona de desembarque de operações possui uma aplicação de dados que carrega as informações do prestador de serviços de saúde a partir do sistema de operações na instalação local da Lamna. Como todos os aplicativos de dados, isso coloca os dados na nuvem as-is e não aplica transformações aos produtos de dados.
Produtos de dados
Os analistas de toda a Lamna precisam de acesso aos dados para criar relatórios para o negócio. No entanto, muitos dos dados são demasiado sensíveis para um público alargado. Para fornecer acesso seguro aos dados altamente confidenciais dos pacientes, a equipe de operações criou um conjunto de dados Tokenized pacientes produto em sua zona de pouso. Usando o Azure Data Factory, eles copiam os dados dos pacientes da zona de receção dos pacientes. No entanto, a equipe teve o cuidado de remover ou tokenizar quaisquer colunas que contenham dados pessoais. Esta etapa permite que os analistas usem os dados para fins comerciais sem expor quaisquer detalhes pessoais dos pacientes.
Zona de receção de dados de marketing
O grupo de marketing está focado na obtenção de novos clientes e na gestão da posição da Lamna no mercado. A sua zona de destino de marketing é utilizada principalmente para armazenar e analisar produtos de dados externos sobre os mercados que servem e a indústria de saúde.
No entanto, para apoiar um novo impulso de marketing, o grupo quer realizar um estudo de resultados de saúde para os pacientes atendidos pelos clientes da Lamna. Esperam produzir um relatório baseado em factos, apoiado por fortes provas estatísticas, que demonstrem que a sua abordagem aos cuidados de saúde conduz a melhores resultados.
Para apoiar esse novo esforço, os pesquisadores do grupo de marketing precisam acessar os dados altamente confidenciais dos pacientes de forma segura e compatível, ao mesmo tempo em que podem obter as informações de que precisam.
Para atender a essa necessidade, a equipe de marketing cria produtos de dados agregados a partir do conjunto de dados de pacientes tokenizados criado pela equipe de operações. Esses produtos de dados não contêm registros de saúde individuais. Em vez disso, eles agrupam registros em diferentes eixos. Isso ajuda os pesquisadores a realizar estudos da população como um todo, sem arriscar o acesso às informações de saúde de qualquer indivíduo.
Figura 1: Diagrama da arquitetura Lamna. Nem todos os serviços do Azure são representados no diagrama. É simplificado para destacar os principais conceitos de como os recursos são organizados dentro da arquitetura.
Fundamentação
Todos os dados confidenciais devem sempre receber sua própria zona de aterrissagem de dados?
Não. Apenas os dados mais restritos que exigem proteções específicas, como acesso just-in-time ou chaves gerenciadas pelo cliente, exigem sua própria zona de destino. Para outros cenários, outros recursos de proteção de dados no Azure fornecem um ambiente altamente seguro para seus dados. Isso inclui segurança em nível de linha, segurança em nível de coluna e colunas criptografadas.