Sdílet prostřednictvím


Scénář Lamna Healthcare pro analýzy v cloudovém měřítku v Azure

Tato referenční architektura je napsaná pro zákazníky, kteří chtějí využívat analýzy v cloudovém měřítku nejen pro škálovatelnost, ale také pro zabezpečení dat. Ukazuje, jak lze řídit přístup k citlivým datům a jak lze s analytiky odpovídajícím způsobem desensitizovaná data sdílet.

Profil zákazníka

Lamna Healthcare (Lamna) nabízí služby správy pacientů poskytovatelům zdravotní péče. V průběhu svého podnikání zpracovávají vysoce citlivá data pacientů. Přístup k podrobným datům musí být pečlivě omezen. Lamna by ale také chtěla bezpečně používat některou verzi těchto dat k informování svých obchodních postupů. Potřebují mechanismus pro sdílení dat s analytiky, kteří neporušují důvěru pacientů nebo zákony na ochranu dat.

Aktuální situace

Lamna dnes ukládá všechna data místně. Data pacientů jsou uložená v tradičním databázovém systému. Jak se ale firma rozrůstala a objem dat se zvýšil, musí společnost migrovat své pacientské aplikace do cloudu. V rámci tohoto přechodu by chtěli zkopírovat data z aplikace na cloudovou analytickou platformu, která umožní analytikům lépe využívat data bez nutnosti dalšího zatížení aplikační databáze.

Zásadním zájmem o Lamna je zabezpečení dat pacientů. Jako zdravotnická společnost podléhá několika různým zákonům na ochranu dat.

Architektonické řešení

Lamna implementuje analýzy v cloudovém měřítku jako své řešení pro cloudovou analytickou platformu. Spoléhají na několik cílových zón, a to jak kvůli větší škálovatelnosti, tak k jasnému oddělení citlivých datových produktů.

Cílová zóna správy dat

Důležitým konceptem každé implementace analýzy v cloudovém měřítku je jedna cílová zóna správy dat. Toto předplatné obsahuje prostředky, které se budou sdílet napříč všemi cílovými zónami. To zahrnuje sdílené síťové komponenty, jako je brána firewall a privátní zóny DNS. Zahrnuje také prostředky pro data a zásady správného řízení v cloudu. Katalog Microsoft Purview a Databricks Unity byly nasazeny jako služby na úrovni tenanta.

Úložná plocha pro data pacientů

V organizačním diagramu Lamna je skupina pro správu pacientů součástí skupiny operací. Vzhledem k extrémní citlivosti dat, která používají, ale mají vlastní cílovou zónu dat v architektuře analýzy na úrovni cloudu.

Tato cílová zóna hostuje kopii podrobných údajů o pacientech a zdravotních záznamů z aplikace pro správu pacientů společnosti a souvisejících datových produktů. Tyto datové produkty jsou načteny do cílové zóny datovými aplikacemi, které data pravidelně načítají do cloudu a ukládají je do Azure Data Lake Storage.

Ukládací zóna provozních dat

Provozní skupina v Lamna zodpovídá za základní obchodní činnost společnosti, konkrétně za poskytování konzultačních služeb poskytovatelům zdravotní péče. V cílové zóně provozních dat ukládají data související s těmito poskytovateli zdravotní péče a službami, se kterými se zabývají.

Stejně jako u všech obchodních dat existuje prvek citlivosti na tyto datové produkty a Lamna chce chránit svůj seznam klientů. Vzhledem k tomu, že tato data neobsahují informace o zdraví jednotlivců, nepodléhá nejtěsnějším zákonům na ochranu dat.

Datové aplikace

Cílová zóna provozu má datovou aplikaci označenou a, která načítá data od poskytovatele zdravotní péče z vlastního provozního systému Lamna. Podobně jako u všech datových aplikací se data ukládají v cloudu as-is a nepoužívají se žádné transformace na datové produkty.

Datové produkty

Analytici po celé společnosti Lamna potřebují přístup k datům, aby mohli vytvářet zprávy pro firmu. Velká část dat je ale pro širokou cílovou skupinu příliš citlivá. Aby bylo možné bezpečně poskytnout přístup k vysoce citlivým datům pacientů, provozní tým vytvořil datovou sadu tokenizovaných pacientů produkt v cílové zóně. Pomocí služby Azure Data Factory kopírují data pacientů z cílové zóny pacientů. Tým ale opatrně odebral nebo tokenizoval všechny sloupce obsahující osobní údaje. Tento krok umožňuje analytikům používat data pro obchodní účely bez zveřejnění jakýchkoli osobních údajů o pacientech.

Cílová zóna marketingových dat

Marketingová skupina se zaměřuje na získání nových klientů a správu pozice Lamny v rámci marketplace. Jejich marketingová cílová zóna se primárně používá k ukládání a analýze externích datových produktů na trzích, které obsluhují, a zdravotnictví.

Aby však podpořila nové marketingové nabízení, chce skupina provést studii zdravotních výsledků pro pacienty obsluhované klienty Lamny. Doufáme, že vytvoří zprávu založenou na faktech podporovanou silnými statistickými důkazy, které ukazují, že jejich přístup ke zdravotní péči vede k lepším výsledkům.

Aby se tato nová snaha podpořila, musí výzkumní pracovníci v marketingové skupině přistupovat k vysoce citlivým datům pacientů zabezpečeným a vyhovujícím způsobem, a přitom stále potřebují získat potřebné informace.

Pro splnění této potřeby marketingový tým vytvoří agregované datové produkty z datové sady tokenizovaných pacientů vytvořené provozním týmem. Tyto datové produkty neobsahují jednotlivé zdravotní záznamy. Místo toho seskupují záznamy napříč různými osami. To pomáhá výzkumníkům provádět studie populace jako celku, aniž by riskovali přístup ke zdravotním informacím jednotlivce.

diagram architektury Lamna

Obrázek 1: Diagram architektury Lamna V diagramu se nezobrazují všechny služby Azure. Je to zjednodušené, aby byly zvýrazněny základní koncepty, jak jsou prostředky uspořádány v rámci architektury.

Odůvodnění

Měla by se všem citlivým datům vždy dát vlastní cílová zóna dat?

Ne. Pouze nejpřísněji omezená data, která vyžadují konkrétní ochranu, jako je například přístup právě včas nebo klíče spravované zákazníkem, vyžadují vlastní přistávací zónu. V jiných scénářích poskytují další funkce ochrany dat v Azure vysoce zabezpečené prostředí pro vaše data. To zahrnuje zabezpečení na úrovni řádků, zabezpečení na úrovni sloupců a šifrované sloupce.

Další kroky