Scenario di Lamna Healthcare per l'analisi su scala cloud in Azure
Questa architettura di riferimento è scritta per i clienti che vogliono usare l'analisi su scala cloud non solo per la scalabilità, ma per proteggere i dati. Illustra come è possibile controllare l'accesso ai dati sensibili e come condividere i dati non sensibili con gli analisti in modo appropriato.
Profilo del cliente
Lamna Healthcare (Lamna) offre servizi di gestione dei pazienti ai provider di servizi sanitari che, nello svolgimento del loro lavoro, gestiscono dati dei pazienti altamente sensibili. L'accesso ai dati dettagliati deve essere limitato accuratamente. Tuttavia, Lamna ha anche la necessità di usare in modo sicuro una versione di questi dati per le proprie procedure aziendali. È necessario predisporre un meccanismo per condividere i dati con gli analisti che non violi la fiducia dei pazienti o le leggi sulla protezione dei dati.
Situazione attuale
Oggi Lamna archivia tutti i dati in locale. I dati dei pazienti vengono archiviati in un sistema di database tradizionale. Tuttavia, con la crescita dell'azienda e l'aumento del volume di dati, è necessario eseguire la migrazione delle applicazioni con i dati dei pazienti nel cloud. Nell'ambito di questa transizione, l'azienda vuole copiare i dati dall'applicazione in una piattaforma di analisi basata sul cloud che consenta agli analisti di usare meglio i dati senza caricare in modo aggiuntivo il database dell'applicazione.
Un problema critico per Lamna è la sicurezza dei dati dei pazienti. In qualità di azienda sanitaria, sono soggetti a diverse leggi sulla protezione dei dati.
Soluzione progettuale
Lamna implementerà l'analisi su scala cloud come soluzione per una piattaforma di analisi basata sul cloud. Si basano su più zone di destinazione sia per una maggiore scalabilità che per una netta separazione dei prodotti dati sensibili.
Zona di destinazione per la gestione dei dati
Un concetto critico per ogni implementazione di analisi su scala cloud prevede una zona di destinazione per la gestione dei dati. Questa sottoscrizione contiene risorse che verranno condivise in tutte le zone di destinazione. Sono inclusi componenti di rete condivisi, come ad esempio un firewall e zone DNS private, nonché risorse per la governance dei dati e del cloud, come Criteri di Azure e Azure Purview.
Zona di destinazione dei dati dei pazienti
Nell'organigramma di Lamna il gruppo di gestione dei pazienti fa parte del gruppo operativo. Tuttavia, data l'estrema sensibilità dei dati usati, avranno la propria zona di destinazione dei dati nell'architettura di analisi su scala cloud.
Questa zona di destinazione ospiterà una copia dei dati dettagliati dei pazienti e dei record sanitari dell'applicazione di gestione dei pazienti dell'azienda e dei prodotti dati correlati. Questi prodotti dati verranno caricati nella zona di destinazione da applicazioni dati che inseriscono regolarmente i dati nel cloud e lo inseriscono in Azure Data Lake Storage.
Zona di destinazione dei dati operativi
Il gruppo operativo di Lamna è responsabile della line-of-business principale dell'azienda, ovvero servizi di consulenza per provider di servizi sanitari. Il gruppo usa la zona di destinazione dei dati operativi per archiviare i dati relativi a questi provider di servizi sanitari e ai servizi che l'azienda ha offerto loro.
Come tutti i dati aziendali, c'è un elemento di riservatezza per questi prodotti dati e Lamna di vuole proteggere il proprio elenco di client. Tuttavia, poiché questi dati non includono informazioni sanitarie sugli individui, non sono soggetti alle leggi più rigorose sulla protezione dei dati.
Applicazioni dati
La zona di destinazione delle operazioni include un'applicazione dati che carica i dati del provider di servizi sanitari dal sistema operativo locale di Lamna. Analogamente a tutte le applicazioni dati, i dati vengono inseriti nel cloud così come sono e non applicano trasformazioni ai prodotti dati.
Prodotti di dati
Gli analisti di Lamna devono accedere ai dati per creare report per l'azienda. Tuttavia, gran parte dei dati è troppo sensibile per un pubblico ampio. Per offrire l'accesso sicuro ai dati dei pazienti altamente sensibili, il team operativo ha creato un prodotto di set di dati dei pazienti in formato token nella zona di destinazione. Usando Azure Data Factory, i membri del team copiano i dati dei pazienti dalla zona di destinazione dei pazienti, non prima però di aver rimosso o trasformato in formato token tutte le colonne contenenti dati personali. In questo modo gli analisti possono usare i dati per scopi aziendali senza esporre i dettagli personali dei pazienti.
Zona di destinazione dei dati di marketing
L'attività del gruppo di marketing è incentrata sull'acquisizione di nuovi clienti e sulla gestione della posizione di Lamna all'interno del mercato. La loro zona di destinazione di marketing viene usata principalmente per archiviare e analizzare i prodotti dati esterni sui mercati che servono e sul settore sanitario.
Tuttavia, per supportare nuove iniziative di marketing, il gruppo vuole condurre uno studio dei risultati sanitari per i pazienti in carico ai clienti di Lamna. Il gruppo vuole produrre un report basato sui fatti supportato da solide evidenze statistiche che dimostri che l'approccio dell'azienda al settore sanitario porta a risultati migliori.
Per supportare questo nuovo lavoro, i ricercatori del gruppo marketing dovranno accedere ai dati dei pazienti altamente sensibili in modo sicuro e conforme, pur potendo ottenere le informazioni necessarie.
Per soddisfare questa esigenza, il team di marketing crea prodotti dati aggregati dal set di dati dei pazienti con token creato dal team operativo. Questi prodotti dati non contengono singoli record di integrità. ma raggruppano i record su assi diversi. In questo modo i ricercatori possono condurre studi sulla popolazione nel suo complesso senza rischiare di accedere alle informazioni sanitarie di una singola persona.
Figura 1: Diagramma dell'architettura. Nel diagramma non sono rappresentati tutti i servizi di Azure. Il diagramma è stato semplificato per evidenziare i concetti di base relativi all'organizzazione delle risorse all'interno dell'architettura.
Spiegazione
I dati sensibili devono avere sempre una loro zona di destinazione?
No. Solo i dati più limitati che richiedono protezioni specifiche, ad esempio l'accesso just-in-time o le chiavi gestite dal cliente, richiedono la propria zona di destinazione. Per altri scenari, vi sono altre funzionalità di protezione dei dati in Azure che offrono un ambiente altamente sicuro per i dati. Tra queste, la sicurezza a livello di riga, la sicurezza a livello di colonna e le colonne crittografate.
Modelli di distribuzione
Per distribuire l'architettura, usare i modelli di implementazione di riferimento della zona di destinazione per la gestione dei dati e della zona di destinazione per i dati nei repository GitHub seguenti:
- Modello della zona di destinazione per la gestione dei dati
- Modello della zona di destinazione per i dati
Usare i modelli seguenti per distribuire altre applicazioni dati e prodotti dati nelle zone di destinazione dei dati Lamna:
Nome | Zona di destinazione dei dati | Tipo | Modello |
---|---|---|---|
Pazienti | Pazienti | Applicazione dati | Modello batch dei prodotti di dati |
Record sanitari | Pazienti | Applicazione dati | Modello batch dei prodotti di dati |
Provider | Gestione operativa | Applicazione dati | Modello batch dei prodotti di dati |
Pazienti in formato token | Gestione operativa | Prodotto di dati | Modello batch dei prodotti di dati |
Dati aggregati dei pazienti | Marketing | Prodotto di dati | Modello batch dei prodotti di dati |
Importante
Non tutti gli elementi nei modelli di implementazione di riferimento precedenti dovranno essere distribuiti per soddisfare le esigenze di Lamna. Per i modelli saranno necessarie alcune personalizzazioni. I servizi non necessari devono essere rimossi dai modelli prima della distribuzione.
Passaggi successivi
- Continuare a Modelli di distribuzione per l'analisi su scala cloud.
- Altre informazioni su Informazioni sulla privacy dei dati per l'analisi su scalabilità cloud in Azure.