Escenario de Lamna Healthcare para el análisis a escala en la nube en Azure
Esta arquitectura de referencia está escrita para los clientes que desean usar análisis a escala de la nube no solo para la escalabilidad, sino para proteger sus datos. Muestra cómo se puede controlar el acceso a datos confidenciales y cómo se pueden compartir los datos desensitizados adecuadamente con los analistas.
Perfil de cliente
Lamna Healthcare (Lamna) ofrece servicios de administración de pacientes a proveedores de atención sanitaria. Manejan datos de pacientes altamente confidenciales a lo largo del curso de su negocio. El acceso a los datos detallados debe restringirse cuidadosamente. Sin embargo, Lamna también desea usar de forma segura algunas versiones de estos datos para informar a sus prácticas empresariales. Necesitan un mecanismo para compartir los datos con analistas que no infringen la confianza del paciente ni las leyes de protección de datos.
Situación actual
En la actualidad, Lamna almacena todos sus datos en el entorno local. Los datos del paciente se almacenan en un sistema de base de datos tradicional. Sin embargo, a medida que su negocio ha crecido y el volumen de datos ha aumentado, la empresa debe migrar sus aplicaciones de pacientes a la nube. Como parte de esta transición, les gustaría copiar los datos de la aplicación en una plataforma de análisis basada en la nube que permitirá a sus analistas usar mejor los datos sin poner carga adicional en la base de datos de la aplicación.
Una preocupación crítica para Lamna es la seguridad de los datos del paciente. Como empresa sanitaria, están sujetos a varias leyes de protección de datos diferentes.
Solución arquitectónica
Lamna implementará el análisis a escala en la nube como solución para una plataforma de análisis basada en la nube. Se basan en varias zonas de aterrizaje para aumentar la escalabilidad y para una separación clara de los productos de datos confidenciales.
Zona de aterrizaje de administración de datos
Un concepto crítico para cada implementación de análisis a escala en la nube es tener una zona de aterrizaje de administración de datos. Esta suscripción contiene recursos que se compartirán en todas las zonas de aterrizaje. Esto incluye componentes de red compartidos, como un firewall y zonas DNS privadas. También incluye recursos para los datos y la gobernanza en la nube. Microsoft Purview y Databricks Unity Catalog se han implementado como servicios a nivel de tenant.
Zona de aterrizaje de datos de pacientes
En el organigrama de Lamna, el grupo de administración de pacientes forma parte del grupo de operaciones. Sin embargo, dada la confidencialidad extrema de los datos que usan, tienen su propia zona de aterrizaje de datos en la arquitectura de análisis a escala de la nube.
Esta zona de aterrizaje hospeda una copia de los datos detallados del paciente y los registros de salud de la aplicación de administración de pacientes de la empresa y los productos de datos relacionados. Estos productos de datos son cargados en la zona de aterrizaje por aplicaciones de datos que ingerirán periódicamente los datos en la nube y los colocarán en Azure Data Lake Storage.
Zona de aterrizaje de datos de operaciones
El grupo de operaciones de Lamna es responsable de la línea de negocio principal de la empresa, a saber, proporcionar servicios de consultoría a los proveedores de atención sanitaria. En su zona de aterrizaje de datos de operaciones, almacenan datos relacionados con estos proveedores de atención sanitaria y los servicios con los que interactúan.
Al igual que todos los datos empresariales, hay un elemento de sensibilidad en estos productos de datos, y Lamna quiere proteger su lista de clientes. Sin embargo, dado que estos datos no incluyen información sanitaria sobre individuos, no está sujeto a las leyes de protección de datos más estrictas.
Aplicaciones de datos
La zona de aterrizaje de operaciones tiene una aplicación de datos que carga los datos de los proveedores de atención sanitaria desde el sistema de operaciones local de Lamna. Al igual que todas las aplicaciones de datos, esto ubica los datos en la nube as-is y no aplica transformaciones a los productos de datos.
Productos de datos
Los analistas de Lamna necesitan acceso a los datos para crear informes para la empresa. Sin embargo, gran parte de los datos es demasiado sensible para un público amplio. Para proporcionar acceso seguro a los datos altamente confidenciales de los pacientes, el equipo de operaciones creó un producto Conjunto de datos de pacientes tokenizados en su zona de aterrizaje. Usando Azure Data Factory, copian los datos de los pacientes de la zona de recepción de pacientes. Sin embargo, el equipo tuvo cuidado de quitar o tokenizar las columnas que contienen datos personales. Este paso permite a los analistas usar los datos para fines empresariales sin exponer ningún dato personal de los pacientes.
Zona de aterrizaje de datos de marketing
El grupo de marketing se centra en obtener nuevos clientes y administrar la posición de Lamna dentro del marketplace. Su zona de aterrizaje de marketing se usa principalmente para almacenar y analizar productos de datos externos sobre los mercados que sirven y la industria sanitaria.
Sin embargo, para apoyar una nueva campaña de marketing, el grupo quiere llevar a cabo un estudio sobre los resultados de salud de los pacientes atendidos por los clientes de Lamna. Esperan producir un informe basado en hechos respaldado por pruebas estadísticas sólidas que muestran que su enfoque para la atención sanitaria conduce a mejores resultados.
Para apoyar este nuevo esfuerzo, los investigadores del grupo de marketing necesitan acceder a los datos de pacientes altamente confidenciales de una manera segura y compatible, a la vez que pueden obtener la información que necesitan.
Para satisfacer esta necesidad, el equipo de marketing crea productos de datos agregados a partir del conjunto de datos de pacientes tokenizados creado por el equipo de operaciones. Estos productos de datos no contienen registros de estado individuales. En su lugar, agrupan registros en distintos ejes. Esto ayuda a los investigadores a realizar estudios de la población en su conjunto sin arriesgar el acceso a la información de salud de ninguna persona.
Figura 1: Diagrama de la arquitectura de Lamna. No todos los servicios de Azure se representan en el diagrama. Se simplifica para resaltar los conceptos básicos de cómo se organizan los recursos dentro de la arquitectura.
Fundamento
¿Todos los datos confidenciales siempre se deben asignar a su propia zona de aterrizaje de datos?
No. Solo los datos más restringidos que requieren protecciones específicas, como el acceso Just-In-Time o las claves administradas por el cliente, requieren su propia zona de aterrizaje. En otros escenarios, otras características de protección de datos de Azure proporcionan un entorno muy seguro para los datos. Esto incluye la seguridad de nivel de fila, la seguridad de nivel de columna y las columnas cifradas.
Pasos siguientes
- Continúe con Plantillas de despliegue para el análisis a escala de la nube.
- Obtenga más información en Descripción de la privacidad de los datos para el análisis a escala en la nube en Azure.