潔淨室和多方資料分析
Azure 機密運算 (ACC) 可提供解決方案的基礎,讓多方共同協力處理資料。 市面上有各種方法的解決方案,以及日益成長的合作夥伴生態系統,可協助 Azure 客戶、研究人員、資料科學家和資料提供者合力處理資料並保留隱私。 本概觀涵蓋其中一些可供使用的方法和現有解決方案,而且全都是在 ACC 上執行。
什麼是資料和模型保護?
資料潔淨室解決方案通常會為一或多個資料提供者提供方法來結合資料以利進行處理。 且通常會由提供者之一或另一參與者 (例如研究人員或解決方案提供者) 建立議定的程式碼、查詢或模型。 在許多情況下,資料多半具有敏感性,因此無意與其他參與者分享 – 無論是另一個資料提供者、研究人員還是解決方案廠商。 為協助確保資料潔淨室中所用資料和模型的安全性和隱私,可藉機密運算以密碼編譯方式來驗證參與者是否無權存取資料或模型,即便處理期間亦復如此。 透過 ACC,解決方案可以保護雲端操作員、解決方案提供者和資料共同作業參與者的資料和模型 IP。
產業使用案例有哪些範例?
透過 ACC,客戶和合作夥伴會組建隱私保護多方資料分析解決方案,有時稱為「機密潔淨室」– 這兩種新解決方案都具有獨特的機密性,而現有的潔淨室解決方案則透過 ACC 實現機密性。
- 加拿大皇家銀行 - 虛擬潔淨室解決方案,會結合商家資料與銀行資料,據以在安全區域中使用 Azure 機密運算 VM 和 Azure SQL AE 來提供個人化項目。
- 加拿大豐業銀行:採用 Azure 機密運算和解決方案合作夥伴 Opaque,證明了可以在跨銀行資金流中使用 AI 來識別洗錢行為,從而標記人口販運事件。
- 諾華中國商業創新聯盟:採用 BeeKeeperAI 在 ACC 上執行的合作夥伴解決方案 ,據以尋找罕見疾病的臨床試驗候選項目。
- 頂級付款提供者會連結各家銀行的資料,來進行詐騙和異常偵測。
- 使用 ACC 來提升資料保護並符合歐盟客戶合規性需求和隱私權法規的資料分析服務和潔淨室解決方案。
為何使用機密運算?
資料潔淨室並非全新概念,但隨著機密運算的進步,於是便有更多機會用到具備更廣泛資料集的雲端規模、AI 模型的保護 IP 以及更能滿足資料隱私法規的能力。 在先前的案例中,某些資料可能會因為如下原因而無法存取
- 競爭劣勢或法規阻礙了行業公司之間共享資料。
- 匿名化降低了資料深入解析的品質,或是成本過高且耗時。
- 資料繫結至特定位置,並因安全考量而避免在雲端中處理。
- 如果外洩或濫用資料,會招致昂貴或冗長的法律程序
這些現實可能會導致資料集不完整或無效,從而進一步弱化深入解析,或需花費更多時間來訓練和使用 AI 模型。
組建潔淨室解決方案時需要考慮哪些事項?
批次分析與即時資料管線:設計或使用潔淨室解決方案時,應考慮資料集大小和深入解析的速度。 資料可供「離線」使用時,可加以載入至已驗證且受保護的計算環境,以便就大部分資料 (若非整個資料集) 進行資料分析處理。 此批次分析可讓大型資料集使用預期不會提供立即結果的模型和演算法進行評估。 例如,在對數百萬筆健康記錄進行 ML 推斷以找出臨床試驗的最佳候選者時,批次分析的效果頗佳。 其他解決方案則需要對資料進行即時深入解析,比方說,在演算法和模型的目標是要在多個實體之間近乎即時的交易上識別出詐騙行為的情況。
零信任參與:機密潔淨室的一個主要區別在於,能夠讓所有資料提供者、程式碼與模型開發人員、解決方案提供者和基礎結構運營商管理員都不會信任任何相關方。 您可以在資料與模型 IP 都能受到各方保護的情況下,提供解決方案。 進行解決方案上線或組建時,參與者應考慮需要保護的內容以及保護每個程式碼、模型和資料免受何方的侵害。
同盟學習:同盟學習牽涉到建立或使用解決方案,而模型會在資料擁有者的租用戶中處理,深入解析則在中央租用戶中彙總。 在某些情況下,模型甚至可在 Azure 外部的資料上執行,而模型彙總仍在 Azure 中進行。 很多時候,隨著深入解析彙總後改進模型參數,同盟學習會多次逐一查看資料。 模型的反覆運算成本和品質應納入解決方案和預期的結果中。
資料落地和來源:客戶的資料會儲存在多個雲端和內部部署中。 共同作業可以包含來自不同來源的資料和模型。 潔淨室解決方案可促進資料和模型從這些其他位置傳入 Azure。 資料無法從內部部署資料存放區移至 Azure 時,某些潔淨室解決方案可以在資料所在的網站上執行。 管理與原則可由通用解決方案提供者 (如果有) 提供。
程式碼完整性和機密總帳:透過在 Azure 機密運算上執行的分散式總帳技術 (DLT) ,即可組建在跨組織的網路上執行的解決方案。 只有各方參與者達成共識時,才能新增程式碼邏輯和分析規則。 系統會記錄程式碼的所有更新,以透過 Azure 機密運算啟用的防竄改記錄進行稽核。
有哪些選項可供開始使用?
協助啟用機密潔淨室的 ACC 平台供應項目
開始動手,直接在這些機密運算服務供應項目上組建資料潔淨室解決方案。
Azure 容器執行個體 (ACI) 上的機密容器和具有應用程式記憶體保護區的 Intel SGX VM,可提供案容器解決方案來組建機密潔淨室解決方。
機密虛擬機器 (VM),可為機密潔淨室解決方案提供 VM 平臺。
安全記憶體保護區中的 Azure SQL AE,會提供平台服務來加密 SQL 中的資料和查詢,可供多方資料分析和機密潔淨室使用。
機密聯盟架構為一種開放原始碼架構,可供組建高可用性具狀態服務,此類服務使用集中式運算來落實易用性和效能,同時提供分散式信任。 它可讓多方對機密資料執行可稽核的計算,而不需要彼此信任或擁有特權的操作員。
啟用機密潔淨室的 ACC 合作夥伴解決方案
使用已在 Azure 機密運算平台上組建多方資料分析解決方案的合作夥伴。
- Anjuna 會提供機密運算平台來支援包括安全潔淨室在內的各類使用案例,讓組織共用資料以進行聯合分析,例如計算信用風險分數或開發機器學習模型,而不公開敏感性資訊。
- BeeKeeperAI 可透過演算法擁有者和資料負責人的安全共同作業平台來啟用醫療保健 AI。 BeeKeeperAI™ 會在機密運算環境中對受保護資料的多重機構來源使用隱私權保留分析。 此解決方案支援端對端加密、安全運算記憶體保護區和 Intel 最新的 SGX 處理器,以保護資料和演算法 IP。
- Decentriq 提供以機密運算為基礎的 SaaS 資料潔淨室,可實現安全的資料共同作業,而無需共用資料。 資料科學潔淨室允許靈活的多方分析,而媒體和廣告的無程式碼潔淨室可根據第一方使用者資料實現符合規範的受眾啟用和分析。 Microsoft 部落格上的這篇文章將更詳細地說明機密潔淨室。
- Fortanix 提供可啟用機密 AI 的機密運算平台,包括聯合多重組織共同作業以進行多方分析。
- Habu 提供可互通的資料潔淨室平台,可讓企業以智慧、安全、可調整且簡單的方式解鎖共同作業情報。 Habu 會連結跨部門、合作夥伴、客戶和提供者的分散式資料,獲致更好的共同作業、決策和結果。
- Mithril Security 提供工具來協助 SaaS 廠商在安全記憶體保護區內提供 AI 模型,並提供內部部署層級的安全性和控制項給資料擁有者。 資料擁有者可以使用自己的 SaaS AI 解決方案,同時維持符合規範並控制其資料。
- Opaque 為共同作業分析和 AI 提供機密運算平臺,讓您能夠執行共同作業可調整分析,同時進行資料端對端保護,並讓組織遵守法律和法規授權。
- SafeLiShare 提供原則驅動加密的資料潔淨室,可稽核、追蹤和呈現資料存取權,同時在多方資料共用期間保護資料。