Čištění a analýza dat ve více stranách

Článek
10/26/2023

Důvěrné výpočetní prostředí Azure (ACC) poskytuje základ pro řešení, která umožňují více stranám spolupracovat na datech. Existují různé přístupy k řešením a rostoucí ekosystém partnerů, kteří pomáhají zákazníkům Azure, výzkumníkům, datovým vědcům a poskytovatelům dat spolupracovat na datech a přitom zachovat ochranu osobních údajů. Tento přehled se zabývá některými přístupy a existujícími řešeními, která je možné použít, a to vše spuštěné na ACC.

Jaká jsou ochrana dat a modelů?

Řešení čištění dat obvykle nabízejí prostředky pro jednoho nebo více poskytovatelů dat ke kombinování dat ke zpracování. Obvykle se dohodly na kódu, dotazech nebo modelech vytvořených jedním z poskytovatelů nebo jiným účastníkem, jako je výzkumný pracovník nebo poskytovatel řešení. V mnoha případech se data dají považovat za citlivá a nepotřebná přímo sdílet s ostatními účastníky – ať už se jedná o jiného poskytovatele dat, výzkumného pracovníka nebo dodavatele řešení. Aby bylo možné zajistit zabezpečení a ochranu osobních údajů u dat i modelů používaných v čistých místnostech dat, je možné důvěrné výpočty použít k kryptografickému ověření, že účastníci nemají přístup k datům nebo modelům, včetně během zpracování. Pomocí acc mohou řešení přinést ochranu na data a model IP adresy od operátora cloudu, poskytovatele řešení a účastníků spolupráce na datech.

Jaké jsou příklady případů použití v odvětví?

S acc, zákazníci a partneři vytvářejí ochranu osobních údajů zachování ochrany osobních údajů v řešeních pro analýzu dat více stran, někdy označované jako "důvěrné čisté prostory" – net net new new uniquely confidential, and existing cleanroom solutions made confidential with ACC.

Royal Bank of Canada - Virtual clean room solution combining merchant data with bank data in to provide personald offers, using Azure confidential computing VMs and Azure SQL AE in secure enklávy.
Scotiabank – Ukázalo se použití umělé inteligence na finančních tocích mezi bankami k identifikaci praní peněz k označení instancí obchodování s lidmi, používání důvěrných výpočetních prostředků Azure a partnera pro řešení, Neprůhlásky.
Novartis Biome – použil partnerské řešení od BeeKeeperAI běžící na ACC, aby našel kandidáty na klinické studie pro vzácné nemoci.
Přední poskytovatelé platebních služeb připojující data napříč bankami kvůli podvodům a detekci anomálií.
Analytické služby dat a řešení čistých místností využívající ACC ke zvýšení ochrany dat a splnění požadavků na dodržování předpisů zákazníků EU a nařízení o ochraně osobních údajů.

Proč důvěrné výpočty?

Čištění dat není úplně nový koncept, ale s pokroky v důvěrných výpočetních prostředích existuje více příležitostí využít cloudové škálování s širšími datovými sadami, zabezpečením IP adres modelů AI a schopností lépe splňovat předpisy týkající se ochrany osobních údajů dat. V předchozích případech můžou být určitá data nepřístupná z důvodů, jako je například

Konkurenční nevýhody nebo regulace brání sdílení dat napříč průmyslovými společnostmi.
Anonymizace snižuje kvalitu přehledů dat nebo je příliš nákladná a časově náročná.
Data jsou svázaná s určitými umístěními a kvůli obavám zabezpečení se nezpracovávají v cloudu.
Nákladné nebo zdlouhavé právní procesy zahrnují odpovědnost v případě, že jsou data vystavená nebo zneužívané

Tyto reality můžou vést k neúplným nebo neefektivním datovým sadám, které vedou ke slabším přehledům nebo více času potřebným při trénování a používání modelů AI.

Co je potřeba vzít v úvahu při vytváření řešení čisté místnosti?

Dávkové analýzy vs. datové kanály v reálném čase: Velikost datových sad a rychlost přehledů by se měla zvážit při návrhu nebo použití řešení čištění. Pokud jsou data dostupná "offline", je možné je načíst do ověřeného a zabezpečeného výpočetního prostředí pro zpracování dat ve velkých částech dat, pokud ne v celé datové sadě. Tato dávková analýza umožňuje vyhodnotit velké datové sady pomocí modelů a algoritmů, u které se neočekává, že by poskytovaly okamžitý výsledek. Dávkové analýzy například fungují dobře při odvozování ML napříč miliony zdravotních záznamů, aby našli nejlepší kandidáty pro klinickou studii. Jiná řešení vyžadují přehledy dat v reálném čase, jako jsou algoritmy a modely, jejichž cílem je identifikovat podvody na transakcích téměř v reálném čase mezi více entitami.

Účast na nulové důvěryhodnosti: Zásadním rozdílem v důvěrných čistých místnostech je schopnost mít žádnou stranu, která není důvěryhodná – od všech poskytovatelů dat, vývojářů kódu a modelů, poskytovatelů řešení a správců operátorů infrastruktury. Řešení je možné poskytnout tam, kde je možné ip adresu dat i modelu chránit před všemi stranami. Při onboardingu nebo vytváření řešení by účastníci měli zvážit, co je žádoucí chránit, a před kým chránit každý kód, modely a data.

Federované učení: Federované učení zahrnuje vytvoření nebo použití řešení, zatímco procesy modelů v tenantovi vlastníka dat a přehledy se agregují v centrálním tenantovi. V některých případech se modely dají spustit i na datech mimo Azure s agregací modelů, ke kterým stále dochází v Azure. Federované učení se často iteruje na datech mnohokrát, protože se parametry modelu vylepšují po agregaci přehledů. Náklady na iteraci a kvalitu modelu by se měly zohlednit do řešení a očekávaných výsledků.

Rezidence a zdroje dat: Zákazníci mají data uložená v několika cloudech a místně. Spolupráce může zahrnovat data a modely z různých zdrojů. Řešení čištění můžou usnadnit data a modely přicházející do Azure z těchto dalších umístění. Když se data nemůžou přesunout do Azure z místního úložiště dat, můžou některá řešení čištění běžet na webu, kde se data nacházejí. Správa a zásady můžou být založené na běžném poskytovateli řešení, pokud je k dispozici.

Integrita kódu a důvěrné registru: Díky technologii distribuovaného registru (DLT) běžící na důvěrných výpočetních operacích Azure je možné vytvořit řešení, která běží v síti napříč organizacemi. Logiku kódu a analytická pravidla je možné přidat pouze v případech, kdy existuje shoda mezi různými účastníky. Všechny aktualizace kódu se zaznamenávají pro auditování prostřednictvím protokolování proti manipulaci s povoleným důvěrným výpočetním prostředím Azure.

Jaké jsou možnosti, jak začít?

Nabídky platforem ACC, které pomáhají povolit důvěrné čisté prostory

Zahrnujte rukávy a vytvořte řešení pro čištění dat přímo na těchto nabídkách důvěrných výpočetních služeb.

Důvěrné kontejnery na virtuálních počítačích Azure Container Instances (ACI) a Intel SGX s enklávami aplikací poskytují řešení kontejnerů pro vytváření důvěrných řešení čištění.

Důvěrné virtuální počítače poskytují platformu virtuálního počítače pro důvěrná řešení čištění.

Azure SQL AE v zabezpečených enklávách poskytuje službu platformy pro šifrování dat a dotazů v SQL, které je možné použít v analýzách dat více stran a důvěrných čištění.

Důvěrné konsorcium Framework je opensourcová architektura pro vytváření vysoce dostupných stavových služeb, které používají centralizované výpočetní prostředky pro snadné použití a výkon a zároveň poskytují decentralizovanou důvěru. Umožňuje více stranám provádět auditovatelné výpočetní prostředky nad důvěrnými daty, aniž by si vzájemně důvěřovaly nebo privilegovanému operátoru.

Partnerová řešení ACC, která umožňují důvěrné čisté prostory

Použijte partnera, který vytvořil řešení pro analýzu dat ve více stranách nad platformou důvěrného výpočetního prostředí Azure.

Anjuna poskytuje důvěrnou výpočetní platformu, která umožňuje různé případy použití, včetně zabezpečených čistých místností, aby organizace sdílely data pro společnou analýzu, jako je výpočet skóre úvěrového rizika nebo vývoj modelů strojového učení, aniž by museli vystavit citlivé informace.
BeeKeeperAI umožňuje zdravotní AI prostřednictvím zabezpečené platformy pro spolupráci pro vlastníky algoritmů a správce dat. BeeKeeperAI™ využívá analýzu zachování ochrany osobních údajů u více institucionálních zdrojů chráněných dat v důvěrném výpočetním prostředí. Řešení podporuje komplexní šifrování, zabezpečené výpočetní enklávy a nejnovější procesory s podporou SGX společnosti Intel, které chrání data a IP algoritmus.
Decentriq poskytuje čištění dat SaaS založené na důvěrných výpočetních prostředích, které umožňují zabezpečenou spolupráci s daty bez sdílení dat. Čištění datových věd umožňuje flexibilní analýzu více stran a čisté prostory pro média a reklamu bez kódu umožňují aktivaci a analýzu vyhovující cílové skupině na základě uživatelských dat první strany. Důvěrné čištění jsou podrobněji popsány v tomto článku na blogu Microsoftu.
Fortanix poskytuje důvěrnou výpočetní platformu, která umožňuje důvěrnou AI, včetně spolupráce více organizací na analýzách více stran.
Habu poskytuje interoperabilní platformu pro čištění dat, která umožňuje firmám odemknout inteligentní, zabezpečenou, škálovatelnou a jednoduchou inteligenci pro spolupráci. Habu propojuje decentralizovaná data napříč odděleními, partnery, zákazníky a poskytovateli pro lepší spolupráci, rozhodování a výsledky.
Mithril Security poskytuje nástroje, které pomáhají dodavatelům SaaS obsluhovat modely AI uvnitř zabezpečených enkláv a poskytuje místní úroveň zabezpečení a řízení vlastníkům dat. Vlastníci dat můžou používat svá řešení SaaS AI a přitom zůstat v souladu se svými daty a řídit je.
Neprůžnost poskytuje důvěrnou výpočetní platformu pro spolupráci a AI, která poskytuje možnost provádět škálovatelné analýzy založené na spolupráci a současně chránit komplexní data a organizacím umožnit dodržování právních a regulačních mandátů.

Sdílet prostřednictvím