Lamna Healthcare-scenario voor analyses op cloudschaal in Azure
Deze referentiearchitectuur is geschreven voor klanten die analyses op cloudschaal willen gebruiken, niet alleen voor schaalbaarheid, maar voor het beveiligen van hun gegevens. Het laat zien hoe toegang tot gevoelige gegevens kan worden beheerd en hoe op de juiste wijze gedesensitaliseerde gegevens kunnen worden gedeeld met analisten.
Klantprofiel
Lamna Healthcare (Lamna) biedt diensten voor patiëntbeheer aan zorgaanbieders. Ze verwerken zeer gevoelige patiëntgegevens gedurende de loop van hun bedrijf. De toegang tot de gedetailleerde gegevens moet zorgvuldig worden beperkt. Lamna wil echter ook een bepaalde versie van deze gegevens veilig gebruiken om de bedrijfspraktijken ervan te informeren. Ze hebben een mechanisme nodig om de gegevens te delen met analisten die geen inbreuk maken op het vertrouwen van patiënten of gegevensbeschermingswetten.
Huidige situatie
Vandaag slaat Lamna al zijn gegevens on-premises op. De patiëntgegevens worden opgeslagen in een traditioneel databasesysteem. Naarmate hun bedrijf echter groeit en het volume aan gegevens is toegenomen, moet het bedrijf hun patiëntentoepassingen migreren naar de cloud. Als onderdeel van deze overgang willen ze de gegevens uit de toepassing kopiëren naar een analyseplatform in de cloud waarmee hun analisten beter gebruik kunnen maken van de gegevens zonder dat ze extra belasting in de toepassingsdatabase hoeven te leggen.
Een kritieke zorg voor Lamna is de beveiliging van de patiëntgegevens. Als gezondheidszorgbedrijf zijn ze onderworpen aan verschillende wetten voor gegevensbescherming.
Architecturale oplossing
Lamna implementeert analyses op cloudschaal als hun oplossing voor een cloudanalyseplatform. Ze zijn afhankelijk van meerdere landingszones voor een grotere schaalbaarheid en voor een duidelijke scheiding van gevoelige gegevensproducten.
Landingszone voor gegevensbeheer
Een kritiek concept voor elke implementatie van analyses op cloudschaal heeft één landingszone voor gegevensbeheer. Dit abonnement bevat resources die worden gedeeld in alle landingszones. Dit omvat gedeelde netwerkonderdelen, zoals een firewall en privé-DNS-zones. Het omvat ook resources voor gegevens en cloudgovernance. Microsoft Purview en Databricks Unity Catalog zijn geïmplementeerd als services op tenantniveau.
Landingszone voor patiëntgegevens
In het organigram van Lamna maakt de patiëntenbeheergroep deel uit van de operationele groep. Gezien de extreme gevoeligheid van de gegevens die ze gebruiken, hebben ze echter hun eigen gegevenslandingszone in de analysearchitectuur op cloudschaal.
Deze landingszone fungeert als host voor een kopie van de gedetailleerde patiëntgegevens en gezondheidsdossiers van de toepassing voor patiëntbeheer van het bedrijf en gerelateerde gegevensproducten. Deze gegevensproducten worden geladen in de landingszone door gegevenstoepassingen die regelmatig de gegevens opnemen in de cloud en deze in Azure Data Lake Storage landen.
Landingszone voor bewerkingsgegevens
De operationele groep bij Lamna is verantwoordelijk voor de kern line-of-business van het bedrijf, namelijk het aanbieden van adviesdiensten aan zorgaanbieders. In hun landingszone voor operationele gegevens slaan ze gegevens op die betrekking hebben op deze zorgaanbieders en de services waarmee ze samenwerken.
Net als alle bedrijfsgegevens is er een element van gevoeligheid voor deze gegevensproducten en wil Lamna de lijst met clients beschermen. Omdat deze gegevens echter geen gezondheidsinformatie over personen bevatten, is deze niet onderworpen aan de strengste wetgeving voor gegevensbescherming.
Gegevenstoepassingen
De operationele landingszone heeft een gegevenstoepassing waarmee de gegevens van de zorgverlener worden geladen vanuit het on-premises operationele systeem van Lamna. Net als bij alle gegevenstoepassingen worden de gegevens in de cloud as-is geplaatst en worden er geen transformaties toegepast op de gegevensproducten.
Gegevensproducten
Analisten in Lamna hebben toegang nodig tot gegevens om rapporten voor het bedrijf te maken. Veel van de gegevens zijn echter veel te gevoelig voor een breed publiek. Om veilig toegang te bieden tot de zeer gevoelige patiëntgegevens, heeft het operationsteam in hun landingszone een product gemaakt, een getokeniseerde patiënten dataset. Met behulp van Azure Data Factory kopiëren ze patiëntgegevens uit de patiëntenlandingszone. Het team was echter voorzichtig met het verwijderen of tokeniseren van kolommen met persoonlijke gegevens. Met deze stap kunnen analisten de gegevens gebruiken voor zakelijke doeleinden zonder eventuele persoonlijke gegevens van de patiënten bloot te leggen.
Landingszone voor marketinggegevens
De marketinggroep is gericht op het verkrijgen van nieuwe klanten en het beheren van de positie van Lamna binnen de marketplace. Hun marketinglandingszone wordt voornamelijk gebruikt voor het opslaan en analyseren van externe gegevensproducten over de markten die ze bedienen en de gezondheidszorg.
Om een nieuwe marketingpush te ondersteunen, wil de groep echter een onderzoek uitvoeren naar gezondheidsresultaten voor de patiënten die door Lamna's cliënten worden bediend. Ze hopen een op feiten gebaseerd rapport te produceren dat wordt ondersteund door sterk statistisch bewijs dat hun benadering van gezondheidszorg leidt tot betere resultaten.
Om deze nieuwe inspanning te ondersteunen, moeten onderzoekers in de marketinggroep toegang krijgen tot de zeer gevoelige patiëntgegevens op een veilige en compatibele manier, terwijl ze nog steeds de informatie kunnen verkrijgen die ze nodig hebben.
Om aan deze behoefte te voldoen, maakt het marketingteam producten van geaggregeerde gegevens uit de gegevensset met getokeniseerde patiënten die door het operationsteam zijn gemaakt. Deze gegevensproducten bevatten geen afzonderlijke gezondheidsrecords. In plaats daarvan groeperen ze records over verschillende assen. Dit helpt onderzoekers om studies van de populatie als geheel uit te voeren zonder de toegang tot gezondheidsinformatie van een persoon te riskeren.
Afbeelding 1: Diagram van Lamna-architectuur. Niet alle Azure-services worden weergegeven in het diagram. Het is vereenvoudigd om de belangrijkste concepten te benadrukken van de wijze waarop resources in de architectuur worden georganiseerd.
Beredenatie
Moeten alle gevoelige gegevens altijd een eigen landingszone voor gegevens krijgen?
Nee. Alleen de meest beperkte gegevens waarvoor specifieke beveiligingen zijn vereist, zoals Just-In-Time-toegang of door de klant beheerde sleutels, hebben een eigen landingszone nodig. Voor andere scenario's bieden andere functies voor gegevensbeveiliging in Azure een zeer veilige omgeving voor uw gegevens. Dit omvat beveiliging op rijniveau, beveiliging op kolomniveau en versleutelde kolommen.
Volgende stappen
- Ga door met implementatiesjablonen voor analyse op cloudschaal.
- Meer informatie in Inzicht in gegevensprivacy voor analyses op cloudschaal in Azure.