Cleanroom- und Multi-Party Data Analytics
Azure Confidential Computing (ACC) bietet eine Grundlage für Lösungen, mit denen mehrere Parteien an Daten zusammenarbeiten können. Es gibt verschiedene Ansätze für Lösungen und ein wachsendes Ökosystem von Partnern, um Azure-Kunden, Forscher, Data Scientists und Datenanbietern zu ermöglichen, an Daten zusammenzuarbeiten und gleichzeitig den Datenschutz zu wahren. Diese Übersicht umfasst einige der Ansätze und vorhandenen Lösungen, die verwendet werden können, alle auf ACC ausgeführt werden.
Was sind die Daten- und Modellschutz?
Daten sauber roomlösungen bieten in der Regel eine Möglichkeit für einen oder mehrere Datenanbieter, Daten für die Verarbeitung zu kombinieren. In der Regel sind Code, Abfragen oder Modelle vereinbart, die von einem der Anbieter oder einem anderen Teilnehmer erstellt werden, z. B. einem Recherche- oder Lösungsanbieter. In vielen Fällen können die Daten als vertraulich betrachtet und nicht dazu aufgefordert werden, direkt an andere Teilnehmer zu teilen – unabhängig davon, ob ein anderer Datenanbieter, ein Forscher oder Lösungsanbieter. Um sicherheit und Datenschutz sowohl für die Daten als auch für Modelle zu gewährleisten, die in Daten sauber räumen verwendet werden, können vertrauliche Computer verwendet werden, um kryptografisch zu überprüfen, ob Teilnehmer keinen Zugriff auf die Daten oder Modelle haben, einschließlich während der Verarbeitung. Mit ACC können die Lösungen Schutz vor Daten und Modell-IP vom Cloudbetreiber, Lösungsanbieter und Datenzusammenarbeitsteilnehmern bereitstellen.
Was sind Beispiele für Anwendungsfälle in der Branche?
Mit ACC erstellen Kunden und Partner Datenschutz, um Lösungen für die Datenanalyse mit mehreren Parteien zu schützen, die manchmal als "vertraulich sauber rooms" bezeichnet werden – sowohl net new solutions uniquely vertraulich als auch vorhandene sauber room-Lösungen, die mit ACC vertraulich gemacht wurden.
- Royal Bank of Canada - Virtual sauber Raumlösung, die Händlerdaten mit Bankdaten kombiniert, um personalisierte Angebote bereitzustellen, indem Azure vertrauliche Computer-VMs und Azure SQL AE in sicheren Enklaven verwendet werden.
- Scotiabank – Bewiesen Sie die Verwendung von KI bei bankübergreifenden Geldflüssen, um Geldwäsche zu identifizieren, um Menschenhandelsinstanzen zu kennzeichnen, indem Sie Azure vertrauliches Computing und einen Lösungspartner, Opaque, verwenden.
- Noazol Biome – nutzte eine Partnerlösung von BeeKeeperAI , die auf ACC läuft, um Kandidaten für klinische Studien für seltene Krankheiten zu finden.
- Führende Zahlungsanbieter verbinden Daten über Banken hinweg für Betrug und Anomalieerkennung.
- Data analytic services and sauber room solutions using ACC to increase data protection and meet EU customer compliance needs and privacy regulation.
Warum vertrauliches Computing?
Daten sauber rooms sind kein brandneues Konzept, aber mit Fortschritten bei vertraulichen Datenverarbeitungen gibt es mehr Möglichkeiten, die Cloud-Skalierung mit breiteren Datasets zu nutzen, DIE IP-Adresse von KI-Modellen zu sichern und die Möglichkeit, Datenschutzbestimmungen besser zu erfüllen. In früheren Fällen kann aus Gründen wie z. B. auf bestimmte Daten nicht zugegriffen werden
- Wettbewerbsnachteile oder Regulierungen verhindern das Teilen von Daten über Branchenunternehmen hinweg.
- Anonymisierung reduziert die Qualität von Erkenntnissen zu Daten oder ist zu teuer und zeitaufwändig.
- Daten, die an bestimmte Standorte gebunden werden und aufgrund von Sicherheitsbedenken nicht in der Cloud verarbeitet werden.
- Kostspielige oder langwierige Rechtsprozesse decken Haftung ab, wenn Daten offengelegt oder missbraucht werden
Diese Realitäten könnten zu unvollständigen oder unwirksamen Datasets führen, die zu schwächeren Erkenntnissen oder mehr Zeit bei der Schulung und Verwendung von KI-Modellen führen.
Was sind Überlegungen beim Erstellen einer sauber roomlösung?
Batchanalyse im Vergleich zu Echtzeitdatenpipelinen: Die Größe der Datasets und die Geschwindigkeit der Einblicke sollten beim Entwerfen oder Verwenden einer sauber roomlösung berücksichtigt werden. Wenn Daten "offline" verfügbar sind, kann sie in eine überprüfte und gesicherte Computeumgebung für die Datenanalyseverarbeitung in großen Teilen von Daten geladen werden, wenn nicht in das gesamte Dataset. Diese Batchanalyse ermöglicht es, dass große Datasets mit Modellen und Algorithmen ausgewertet werden, die nicht erwartet werden, dass sie ein sofortiges Ergebnis liefern. Batchanalysen funktionieren z. B. gut, wenn ML-Inferencing über Millionen von Gesundheitsdatensätzen hinweg ausgeführt wird, um die besten Kandidaten für eine klinische Studie zu finden. Andere Lösungen erfordern Echtzeiteinblicke auf Daten, z. B. wenn Algorithmen und Modelle darauf abzielen, Betrug bei nahezu echtzeitbasierten Transaktionen zwischen mehreren Entitäten zu identifizieren.
Zero-Trust-Teilnahme: Ein wichtiger Unterschied in vertraulichen sauber rooms ist die Möglichkeit, keine vertrauenswürdigen Parteien zu haben – von allen Datenanbietern, Code- und Modellentwicklern, Lösungsanbietern und Infrastrukturbetreiberadministratoren. Lösungen können bereitgestellt werden, bei denen sowohl die Daten als auch die Modell-IP vor allen Parteien geschützt werden können. Beim Onboarding oder Erstellen einer Lösung sollten die Teilnehmer sowohl überlegen, was geschützt werden soll, als auch vor wem jeder Code, modelle und Daten geschützt werden soll.
Verbundlernen: Das Verbundlernen umfasst das Erstellen oder Verwenden einer Lösung, während modelle im Mandanten des Datenbesitzers und Erkenntnisse in einem zentralen Mandanten aggregiert werden. In einigen Fällen können die Modelle sogar auf Daten außerhalb von Azure ausgeführt werden, wobei die Modellaggregation in Azure noch auftritt. Oft durchläuft verbundiertes Lernen Daten mehrmals, da sich die Parameter des Modells verbessern, nachdem Erkenntnisse aggregiert wurden. Die Iterationskosten und die Qualität des Modells sollten in die Lösung und die erwarteten Ergebnisse eingegliedert werden.
Data Residency und Quellen: Kunden haben Daten in mehreren Clouds und lokal gespeichert. Die Zusammenarbeit kann Daten und Modelle aus verschiedenen Quellen enthalten. Cleanroom-Lösungen können Daten und Modelle erleichtern, die von diesen anderen Standorten an Azure kommen. Wenn Daten nicht aus einem lokalen Datenspeicher in Azure verschoben werden können, können einige sauber roomlösungen auf der Website ausgeführt werden, auf der sich die Daten befinden. Verwaltung und Richtlinien können von einem gemeinsamen Lösungsanbieter unterstützt werden, sofern verfügbar.
Codeintegrität und vertrauliche Hauptbücher: Mit verteilter Ledger-Technologie (DLT), die auf Azure vertraulichen Computing ausgeführt wird, können Lösungen erstellt werden, die in einem Netzwerk in allen Organisationen ausgeführt werden. Die Codelogik und Analyseregeln können nur hinzugefügt werden, wenn ein Konsens zwischen den verschiedenen Teilnehmern besteht. Alle Aktualisierungen des Codes werden für die Überwachung über manipulationssichere Protokollierung aufgezeichnet, die mit Azure Vertraulich Computing aktiviert ist.
Welche Optionen gibt es für die ersten Schritte?
ACC-Plattformangebote, die vertrauliche sauber rooms ermöglichen
Roll up your sleeves and build a data sauber room solution directly on these confidential computing service offerings.
Vertrauliche Container in Azure Container Instances (ACI) und Intel SGX-VMs mit Anwendungsenklaven bieten eine Containerlösung zum Erstellen vertraulicher sauber roomlösungen.
Vertrauliche virtuelle Computer (VMs) stellen eine VM-Plattform für vertrauliche sauber roomlösungen bereit.
Azure SQL AE in sicheren Enklaven bietet einen Plattformdienst zum Verschlüsseln von Daten und Abfragen in SQL, die in Datenanalysen mit mehreren Parteien und vertraulichen sauber rooms verwendet werden können.
Confidential Consortium Framework ist ein Open-Source-Framework zum Erstellen hochveröffentlichter zustandsbehafteter Dienste, die zentralisierte Berechnung für eine einfache Nutzung und Leistung verwenden und dabei dezentrales Vertrauen bieten. Sie ermöglicht es mehreren Parteien, eine auditierbare Berechnung über vertrauliche Daten auszuführen, ohne einander oder einem privilegierten Operator zu vertrauen.
ACC-Partnerlösungen, die vertrauliche sauber rooms ermöglichen
Verwenden Sie einen Partner, der eine Drittanbieter-Datenanalyselösung auf der vertraulichen Azure-Computerplattform erstellt hat.
- Anjuna bietet eine vertrauliche Computerplattform, um verschiedene Anwendungsfälle zu ermöglichen, einschließlich sicherer sauber Räume, damit Organisationen Daten für gemeinsame Analysen freigeben können, z. B. die Berechnung von Kreditrisikobewertungen oder die Entwicklung von Machine Learning-Modellen, ohne vertrauliche Informationen offen zu stellen.
- BeeKeeperAI ermöglicht ki im Gesundheitswesen über eine sichere Plattform für Die Zusammenarbeit für Algorithmusbesitzer und Data Stewards. BeeKeeperAI™ verwendet Datenschutz-Erhaltungsanalysen auf multi-institutionellen Quellen geschützter Daten in einer vertraulichen Computerumgebung. Die Lösung unterstützt End-to-End-Verschlüsselung, sichere Computerenklaven und die neuesten SGX-Prozessoren von Intel zum Schutz der Daten und der Algorithmus-IP.
- Decentriq stellt SaaS-Daten sauber rooms bereit, die auf vertraulichen Computern basieren, die eine sichere Datenzusammenarbeit ermöglichen, ohne Daten freigibt. Data Science sauber rooms ermöglichen flexible Multi-Party-Analysen, und no-code sauber rooms für Medien und Werbung ermöglichen eine kompatible Zielgruppenaktivierung und Analyse basierend auf Benutzerdaten von Erstanbietern. Vertrauliche sauber rooms werden in diesem Artikel im Microsoft-Blog ausführlicher beschrieben.
- Fortanix bietet eine vertrauliche Computerplattform, die vertrauliche KI ermöglichen kann, einschließlich mehrerer Organisationen, die gemeinsam für Analysen mit mehreren Parteien zusammenarbeiten.
- Habu bietet eine interoperable Daten-sauber Raumplattform, die es Unternehmen ermöglicht, kollaborative Intelligenz auf intelligente, sichere, skalierbare und einfache Weise freizuschalten. Habu verbindet dezentrale Daten über Abteilungen, Partner, Kunden und Anbieter für eine bessere Zusammenarbeit, Entscheidungsfindung und Ergebnisse.
- Mithril Security bietet Tools, mit denen SaaS-Anbieter KI-Modelle in sicheren Enklaven bedienen und den Datenbesitzern ein lokales Maß an Sicherheit und Kontrolle bieten. Datenbesitzer können ihre SaaS-KI-Lösungen Standard verwenden, während sie konform sind und die Kontrolle über ihre Daten behalten.
- Opaque bietet eine vertrauliche Computing-Plattform für kollaborative Analysen und KI, die die Möglichkeit bietet, skalierbare Analysen für die Zusammenarbeit durchzuführen und gleichzeitig Daten end-to-End zu schützen und Organisationen die Einhaltung gesetzlicher und behördlicher Mandate zu ermöglichen.
- Tresor LiShare stellt richtliniengesteuerte verschlüsselte Daten sauber Räumen bereit, in denen der Zugriff auf Daten überwacht, nachverfolgbar und sichtbar ist, während daten während der Datenfreigabe mit mehreren Teilnehmern geschützt bleiben.