使用 Semarchy 的主要 資料管理
新式組織會產生大量數據,通常來自許多不同的來源。 Semarchy 數據平臺是數據整合、主要數據管理 (MDM) 、參考數據管理 (RDM) 、應用程式數據管理 (ADM) 、數據整合、品質和治理的智慧型數據中樞。 semarchy 資料管理 (xDM) 在定義和實作數據管理應用程式,並將其發行至生產環境時,會帶來極為靈活度。
此架構示範如何將主要 資料管理 (MDM) 包含在 Azure 生態系統中,以啟用重要數據資產的質量、驗證、比對、重複數據刪除、撰寫、策劃和共同作業。
架構
下列架構說明 Semarchy xDM 架構和數據流。
數據流
中繼資料與資料串流包含下列步驟:
來自已識別來源系統的源資料整合:
- 此整合會使用 Azure Data Factory、Semarchy xDI (Semarchy 的數據整合元件) ,或您的整合解決方案。
- semarchy xDM 會公開用於批次和即時整合的 SQL 或 REST 端點。
- 傳入數據可以使用 Semarchy xDM Discovery 進行分析並檢閱,以協助定義主要數據模型結構和規則。
- 在任何時候,REST 端點也可以由應用程式用來 (讀取/寫入) 與 xDM 中管理的主要數據互動,並使用 xDM 作為其主要數據後端。
自動數據認證
- 數據會透過規則、外掛程式、AI 模型的組合進行擴充、標準化和質量驗證, (包括 Azure Machine Learning 和 Azure OpenAI) ,以及第三方服務。 semarchy xDM 支援這些具有數據回收的自動化品質程式,並納入使用者更正以確保最佳的數據品質。
- 藉由結合複雜的自動化與明智的使用者決策,自動執行比對、合併和存活程式,以產生精確且可靠的合併黃金記錄。
- 認證程式功能所產生的黃金記錄會完整譜系至來源系統、使用者變更追蹤,以及選擇性的歷程記錄。 這可保證數據完整性、可追蹤性和完整的歷程記錄追蹤。
自訂 資料管理 應用程式可供使用者使用:
- 透過 Microsoft Entra ID 進行驗證、
- 透過每個認證階段,以及完整的歷程記錄,瀏覽及搜尋具有完整可追蹤性的認證數據,
- 管理和策劃資料:
- 用戶可以撰寫和匯入新數據,
- 檢閱並修正錯誤,
- 使用覆寫選項手動比對和合併記錄,
- 並視需要執行虛刪除或硬式刪除
- 與 Data-Driven 工作流程共同作業。
將黃金數據散發給取用者作業和分析應用程式,例如 Azure Synapse Analytics、Power BI、Azure Machine Learning 和 Azure OpenAI,可確保跨平臺的整合和使用方式不會中斷:
- 此整合會使用 Azure Data Factory、Semarchy xDI 或您的整合解決方案。
- Semarchy xDM 提供內建的 SQL 和 REST 端點,以及在 Azure 服務匯流排 中以事件為基礎的傳播數據通知。
將 xDM 元 數據與 Microsoft Purview 同步處理,以取得整個主要數據流的完整可見性和譜系。
元件
此架構包含下列元件。
核心元件
- Semarchy xDM 是一個無程式代碼平臺,可讓數據小組快速開發自定義的主要數據管理解決方案,為複雜的數據生態系統提供各種功能。
- 適用於 SQL Server 和 PostgreSQL 的 Azure 資料庫是完全受控的資料庫即服務,具有內建功能,例如高可用性和智慧。 它們會儲存在 xDM 中管理的 Semarchy 元數據和主要數據中樞。 數據處理是在資料庫層中執行,可保證最佳效能和延展性。
- Microsoft Entra ID,用於使用者驗證和單一登錄 Semarchy 平臺。
- Azure 金鑰保存庫 是一項雲端服務,可為秘密提供安全的記憶體。 您可以使用它來加密、解密和儲存密碼 (密碼,例如在 xDM 中使用的) 。
AI 元件
- Azure Machine Learning 是一項雲端服務,可用來加速和管理機器學習服務 (ML) 專案。 Semarchy xDM 可以在數據中樞認證程式中使用自定義的 Azure Machine Learning 模型。
- Azure OpenAI 是一套 AI 服務,可讓您存取 OpenAI 功能強大的語言模型。 Semarchy xDM 包含使用這些語言模型來擴充和認證數據的內建外掛程式,例如內容產生、摘要或翻譯。
治理元件
- Microsoft Purview 是一種數據控管解決方案,可讓您廣泛了解內部部署和雲端數據資產。 Semarchy xDM 與 Microsoft Purview 整合,以提供 Semarchy 數據中樞作為數據產品和端對端主要數據譜系的見解。
來源和取用者系統 此外,此架構包含下列系統,您會從這些系統收集要在 Semarchy xDM 中管理的主要數據,或將 Semarchy xDM 所產生的黃金數據傳送到其中。
- Azure Synapse 分析是快速、彈性且受信任的雲端數據倉儲,使用大量平行處理架構。 Semarchy 數據中樞會作為 Azure Synapse 認證元數據的提供者。
- Power BI 是一個商務分析套件,可提供整個組織的深入解析。 您可以使用 Power BI 在 Semarchy 探索計量和 Semarchy 數據中樞之上建置儀錶板和報表。
案例詳細數據
數據驅動計劃,例如數字轉型、商業智慧或 AI 專案,都需要精確且可信任的數據。 主要 資料管理 是傳遞這個乾淨、精確數據的重要步驟。
MDM 解決方案的常見使用案例是合併來自多個來源的主要數據,同時允許共同撰寫和管理此主要數據,以提供具有黃金數據的分析和操作應用程式。
設計資料應用程式
Semarchy xDM 資料管理 應用程式可為所有使用者提供自定義的存取和管理其數據的體驗。 透過這些應用程式,主要數據記錄會顯示在完全可自定義的介面中,支持資料管理、撰寫和管理作業。 具有不同角色和角色的使用者會在 Data-Driven 工作流程中共同作業來管理數據。 Semarchy xDM 的威力在於數據應用程式的設計彈性,讓它們能夠適應您的網域、組織和商務需求。
整合和認證主要數據
在外部來源系統中策劃的數據,例如客戶關係管理 (CRM) 、企業資源規劃 (ERP) ,或其他稱為發行者) 的 (系統,會透過整合層推送至 Semarchy xDM 的數據中樞,例如 Azure Data Factory 或 Semarchy xDI。
當數據變更出現在數據中樞時,透過數據載入或撰寫,它會通過整個認證程式,在這期間,數據會擴充、標準化、驗證數據品質,然後比對並合併記錄。
從中樞取用數據
您可以使用 REST API 端點,或透過 SQL,將數據推送至 Semarchy xDM 或從中取用數據。 透過數據中樞對數據所做的變更,也可以使用數據通知即時傳播至下游系統。
考量
Semarchy 數據平臺有數個功能可解決可靠性、安全性、成本優化、卓越營運和效能效率的問題。 如需有關架構卓越的進一步資訊,請參閱這篇文章中的** 架構完善的 Azure 架構的要件。**
可靠性
可靠性可確保您的應用程式履行您對客戶的承諾。 如需詳細資訊,請參閱可靠性要素概觀。
Semarchy xDM 會以原生方式在 Azure Kubernetes Service 和 Azure SQL Database 上執行,以提供現成可用的功能來支援高可用性。
安全性
安全性防護可防範刻意攻擊和濫用您寶貴的數據和系統。 如需詳細資訊,請參閱Microsoft學習頁面中的安全性概觀。
Semarchy xDM 會透過支援角色對應、查閱和配置檔同步處理的身分識別管理層來驗證使用者。 它提供多個IDP的原生支援,包括 Microsoft Entra ID。 它也包含進階安全性功能,例如更細緻的許可權,以保護存取和作業的安全。
效能效率
效能效率是系統調整規模並有效符合使用者需求的功能。 如需詳細資訊,請參閱 Microsoft Learn 中的效能效率學習頁面。
Semarchy xDM 會以原生方式在 Azure Kubernetes Service 和 Azure SQL Database 上執行。 您可以設定 Azure Kubernetes Service 來相應增加和放大。您可以部署和設定 Azure SQL 資料庫,以平衡效能、延展性和成本。
成本優化
成本優化牽涉到尋找方法來減少不必要的費用,並提升營運效率。 如需詳細資訊,請參閱 Microsoft learn 中的成本優化學習頁面。
執行成本包含 Semarchy 軟體訂用帳戶授權和 Azure 耗用量。 如需詳細資訊,請連絡 Semarchy。
部署此案例
若要部署此案例:
- 使用 Azure Kubernetes Services 部署 Semarchy xDM。
- 設定秘密管理以使用 Azure 金鑰保存庫。
- 使用 Microsoft Entra ID 設定驗證。
- 在 xDM 中設計和部署自定義的主要數據模型
- 使用 Azure Data Factory 將您的資料整合到 xDM。
本文件的參與者
- David Smith
- Cedric 一起
- François-Xavier (FX)