Microsoft Purview 和 Profisee 集成,用于主数据管理 (MDM)

企业系统可以有多个主数据源,即跨系统共享的通用数据。 编录数据源时,此事实可能会变得明显。 主数据的示例包括客户、产品、位置、资产和供应商数据。 使用 Profisee 合并、验证和更正主数据时,可以使该数据生效。 具体来说,可以使用它来构建一个通用的受信任平台,用于分析和操作改进。 通过使用 Microsoft Purview 中详述的治理定义、见解和专业知识,可以有效地构建平台。

此参考体系结构提供了一个治理和数据管理解决方案,该解决方案Microsoft Purview 和 Profisee 主数据管理 (MDM) 平台。 这些服务协同工作,提供高质量、受信任的数据的基础,从而在 Azure 中最大化数据的业务价值。 有关此解决方案的简短视频,请参阅 Azure 中完全集成的主数据管理的强大功能

体系结构

下图显示了开发和操作主数据解决方案时要执行的步骤。 将这些步骤视为高度迭代。 随着解决方案的发展,你可能会重复这些步骤和阶段,有时是自动的,有时是手动的。 是使用自动步骤还是手动步骤取决于主数据解决方案、元数据和数据所经历的更改。

在微服务设计体系结构中使用 Microsoft Purview 和 Profisee MDM 的数据治理和管理解决方案的体系结构图。

数据流

元数据和数据流包括以下步骤,如上图所示:

  1. 预生成的 Microsoft Purview 连接器用于从源业务应用程序生成统一目录。 连接器扫描数据源并填充统一目录。

  2. 主数据模型发布到 Microsoft Purview。 在 Profisee MDM 中创建的主数据实体将无缝发布到 Microsoft Purview。 此步骤进一步填充统一目录,并确保 Microsoft Purview 中存在此关键数据源的记录。

  3. 数据管理的治理标准和策略用于扩充主数据实体定义。 数据在 Microsoft Purview 中进行了扩充,其中包含数据字典和术语表信息、所有权数据和敏感数据分类。 Microsoft Purview 中提供的任何定义和元数据在 Profisee 中实时可见,作为 MDM 数据专员的指导。

  4. 源系统中的主数据将加载到 Profisee MDM 中。 数据集成工具集(如 Azure 数据工厂)使用 100 个以上的预生成连接器或 REST 网关中的任何一个从源系统中提取数据。 多个主数据流加载到 Profisee MDM 中。

  5. 根据治理规则对主数据进行标准化、匹配、合并、扩充和验证。 其他系统(如 Microsoft Purview)可能会定义数据质量和治理规则。 但是 Profisee MDM 是强制实施这些规则的系统。 源记录在源系统内部和跨源系统进行匹配和合并,以尽可能创建最完整、最正确的记录。 数据质量规则检查每个记录,以符合业务和技术要求。 任何未通过验证或返回低概率分数的记录都可能会进行修正。 为了修正失败的验证,工作流会将需要评审的记录分配给业务数据领域专家的数据专员。 记录经过验证或更正后,即可将其用作 黄金记录主控

  6. 事务数据将加载到下游分析解决方案中。 数据集成工具集(如数据工厂)使用 100 多个预生成连接器或 REST 网关中的任何一个从源系统提取事务数据。 工具集将数据直接加载到分析数据平台,例如 Azure Synapse Analytics。 由于数据重叠、不匹配和冲突尚未解决,因此在没有适当的主黄金数据的情况下,对此原始信息进行分析可能会不准确。

  7. Power BI 连接器提供对特选主数据的直接访问。 Power BI 用户可以直接在报表中使用主数据。 专用 Power BI 连接器识别并强制实施基于角色的安全性。 它还隐藏各种系统字段以简化使用。

  8. 高质量的特选主数据将发布到下游分析解决方案。 如果主数据记录已合并到单个黄金记录中,则会保留指向原始记录的父子链接。

  9. 分析平台具有一组经过认证的数据,其完整、一致和准确。 该数据包括适当策展的主数据和关联的事务数据。 该组合构成了受信任数据的坚实基础,可用于进一步分析。

  10. 对高质量的主数据进行可视化和分析,并应用机器学习模型。 系统为推动业务提供良好的见解。

组件

  • Microsoft Purview 是一种数据治理解决方案,可提供对本地和云数据资产的广泛可见性。 Microsoft Purview 提供数据发现和分类、世系、元数据搜索和发现以及使用情况见解的组合。 所有这些功能都有助于管理和了解整个企业数据环境中的数据。

  • Profisee MDM 是一个快速直观的 MDM 平台,可与Microsoft技术和 Azure 数据管理生态系统无缝集成。

  • 数据工厂 是一种混合数据集成服务。 可以使用数据工厂创建、计划和协调 ETL (提取、转换和加载) ,以及提取、加载和转换 (ELT) 工作流。 数据工厂还提供 100 多个预生成连接器和 REST 网关,可用于从源系统中提取数据。

  • Azure Synapse Analytics 是一个快速、灵活且受信任的云数据仓库,它使用大规模并行处理体系结构。 可以使用 Azure Synapse Analytics 来弹性且独立地缩放、计算和存储数据。

  • Power BI 是一套业务分析工具,可在整个组织中提供见解。 可以使用 Power BI 连接到数百个数据源,简化数据准备,并推动即兴分析。 还可以生成精美的报表,然后发布报表供组织在 Web 和移动设备上使用。

选择

如果没有专用的 MDM 应用程序,可以在 Azure 中找到构建 MDM 解决方案所需的一些技术功能:

  • 数据质量。 将数据加载到分析平台时,可以将数据质量构建到集成过程中。 例如,可以使用硬编码脚本在数据工厂管道中应用 数据 质量转换。
  • 数据标准化和扩充。 Azure Maps可以为地址数据提供数据验证和标准化。 可以在Azure Functions和数据工厂中使用标准化数据。 若要标准化其他数据,可能需要开发硬编码脚本。
  • 重复数据管理。 如果有足够的标识符可用于完全匹配,则可以使用数据工厂删除 。 可能需要自定义硬编码脚本来实现合并匹配行所需的逻辑,同时应用适当的数据幸存技术。
  • 数据管理。 可以使用 Power Apps 快速开发基本的数据管理解决方案来管理 Azure 中的数据。 还可以为评审、工作流、警报和验证开发适当的用户界面。

在以Microsoft为中心的环境中,Azure Synapse Analytics 是首选分析服务。 但可以使用任何分析数据库。 Snowflake 和 Databricks 是常见的选择。

场景详细信息

随着加载到 Azure 中的数据量增加,需要跨所有数据源正确治理和管理该数据,并且数据使用者也随之增长。 在共享源系统中看似足够的数据时,通常会发现数据不足。 它可能缺少或不完整的信息,或者重复和冲突。 其整体质量可能很差。 需要的是完整、一致和准确的数据。

如果没有 Azure 数据资产中的高质量数据,Azure 的业务价值会受到损害,这也许会受到严重损害。 解决方案是为数据治理和管理打下基础,以便生成和提供高质量可信数据的真相来源。 Microsoft Purview 和 Profisee MDM 协同工作,形成此企业平台。

显示 Purview 和 Profisee MDM Microsoft如何将未管理的数据转换为高质量、受信任的数据的关系图。

Microsoft Purview 会对所有数据源进行目录,并识别任何敏感信息和世系。 它为数据架构师提供了一个考虑对所有数据施加的适当数据标准的位置。 Microsoft Purview 侧重于治理,以查找、分类和定义策略和标准。 实施策略和标准、编录数据源以及修正数据不足的任务落在 MDM 系统等技术上。

Profisee MDM 旨在接受来自任何源的主数据。 然后,Profisee MDM 会跨系统匹配、合并、标准化、验证、更正和同步数据。 此过程可确保数据可以正确集成,并满足下游系统(例如商业智能 (BI) 和机器学习应用程序)的需求。 集成的 Profisee 平台跨多个数据孤岛强制实施治理标准。

结合使用效果更佳

Microsoft Purview 和 Profisee MDM 协同工作更好。 集成后,它们可简化数据管理任务,并确保所有系统都能够强制实施相同的标准。 Profisee MDM 将其主数据模型发布到 Microsoft Purview,可在其中参与治理。 然后,Microsoft Purview 共享治理的输出,例如统一目录和术语表信息。 Profisee 可以查看输出并强制实施标准。 通过共同努力,Microsoft Purview 和 Profisee 创造了一种自然的、更好的协同效应,比每个独立产品更深入。

例如,编录企业数据源后,可以确定主数据存在于多个系统中。 主数据是定义域实体的数据。 主数据的示例包括客户、产品、资产、位置、供应商、患者、家庭、菜单项和成分数据。 解析不同的定义以及跨系统匹配和合并此数据对于以有意义的方式使用此数据的能力至关重要。 为了提高效率,应使用 Microsoft Purview 中详述的治理定义、见解和专业知识,在 Profisee MDM 中合并、验证和更正主数据。 通过这种方式,Microsoft Purview 和 Profisee MDM 为治理和数据管理奠定了基础,并在 Azure 中最大化数据的业务价值。

替代方法是使用你可以获取的任何信息。 但是,当你采用此方法时,可能会产生误导性结果,从而损害你的业务。 改用高质量主数据时,可以消除常见的数据质量问题。 然后,无论使用哪种工具来分析、机器学习和可视化,系统都能提供可用于推动业务的合理见解。 精心策划的主数据是构建坚实可靠的数据基础的关键方面。

将 Profisee MDM 与 Microsoft Purview 配合使用时,将体验到以下优势:

  • 通用技术基础。 Profisee 起源于Microsoft技术。 Profisee 和 Microsoft使用通用工具、数据库和基础结构,这使得任何使用Microsoft技术的人都熟悉 Profisee 解决方案。 事实上,多年来,Profisee MDM 建立在Microsoft Master Data Services之上。 现在,Master Data Services即将结束其生命周期,Profisee 是首屈一指的升级和替换解决方案
  • 开发人员协作和共同开发。 Profisee 和 Microsoft Purview 开发人员进行广泛协作,以确保其各自的解决方案之间具有良好的互补性。 这种协作提供了满足客户需求的无缝集成。
  • 联合销售和部署。 Profisee 在 Azure 上与 Microsoft Purview 联合部署的 MDM 部署比任何其他 MDM 供应商都多。 可以通过Azure 市场购买 Profisee。 在 2023 财年,Profisee 是唯一拥有顶级Microsoft合作伙伴认证的 MDM 供应商,该认证具有基础结构即服务 (IaaS) 、容器即服务 (CaaS) ,或软件即服务 (saaS) Azure 市场产品。
  • 快速可靠的部署。 所有企业软件的一个关键功能是快速可靠的部署。 根据 Gartner Peer Insights 平台,Profisee 的实现时间少于 90 天,比任何其他 MDM 供应商都多。
  • 多个域。 Profisee 提供了一种固有使用多个域的 MDM 方法。 可以创建的主数据域数量没有限制。 此设计与计划实现数据资产现代化的客户非常一致。 客户一开始的域数量可能有限,但他们最终会从最大化其整个数据资产的域覆盖范围中受益。 此域覆盖范围与其数据治理覆盖范围相匹配。
  • 专为 Azure 设计的工程。 Profisee 设计为云原生,提供用于 Azure 上的 SaaS 和托管 IaaS 或 CaaS 部署的选项。

潜在用例

有关此解决方案的 MDM 用例的详细列表,请参阅本文后面的 MDM 用例 。 主要 MDM 用例包括以下零售和制造示例:

  • 合并用于分析的客户数据。
  • 以一致且易于访问的形式提供产品数据的 360 度视图,例如每个产品的名称、说明和特征。
  • 建立引用数据以始终如一地扩充主数据的说明。 例如,参考数据包括国家/地区、货币、颜色、大小和度量单位的列表。

这些 MDM 解决方案还帮助严重依赖数据进行关键活动(如及时报告)的金融机构。

MDM 与 Microsoft Purview 集成

下图详细说明了 Profisee MDM 在 Microsoft Purview 中的集成。 为了支持这种集成,Profisee 治理子系统提供了与 Microsoft Purview 的双向集成,该集成由两个不同的流组成:

  • 当数据建模者对主数据模型、匹配策略及其相关子主题进行更改时,将发生解决方案元数据发布。 这些更改会在发生时无缝发布到 Microsoft Purview。 发布这些更改会同步与主数据模型和解决方案相关的元数据。 因此,统一目录会进一步填充,并且 Purview Microsoft 具有此关键数据源的记录。
  • 治理详细信息将返回并提供给数据专员和业务用户。 当用户使用 Profisee FastApp 门户查看数据、扩充数据和修正数据质量问题时,可以使用这些详细信息。

显示 Profisee MDM 如何与 Microsoft Purview 集成以引入、建模和管理数据的关系图。

Microsoft Purview 集成功能

Microsoft Purview 目录和术语表可以帮助你最大程度地实现集成。

主数据模型设计

准备 MDM 解决方案的一个难题是确定在填充主数据模型时构成主数据以及要使用的数据源。 可以使用 Microsoft Purview 来帮助完成这项工作。 可以利用扫描关键数据源的功能,并让数据专员和主题专家 (中小企业) 。 这样,便可以使用专员随后可以访问的信息扩充统一目录,以便更好地使主数据模型与业务线系统保持一致。 可以协调冲突的术语。 此过程生成一个主数据模型,该模型以最佳方式反映了要为业务标准化的术语和定义。 它还避免过时和误导性的措辞。

下图的以下摘录说明了此集成用例。 首先,使用 Microsoft Purview 系统扫描函数从业务线系统引入元数据。 接下来,数据专员和中小企业准备可靠的目录和联系人。 然后,使用 Profisee MDM 建模服务的数据建模人员可以准备和发展主数据模型。 这项工作与你在 Microsoft Purview 中定义的标准一致。

此图显示了 Profisee MDM 与 Microsoft Purview 集成以引入、建模和管理数据的用例。

随着数据专员改进模型,Profisee MDM 平台中的建模服务会发布 Profisee MDM 治理服务收到的更改。 反过来,Profisee MDM 准备这些更改并将其转发到 Microsoft Purview,以包含在其更新的统一目录中。 这些对目录的添加可确保主数据定义包含在更广泛的数据资产中,并且能够以与业务线系统元数据相同的方式对这些定义进行治理和控制。 通过确保这些信息一起编目,可以更好地管理主数据和业务线系统数据之间的关系。

数据管理

具有相应复杂和广泛的数据资产的大型企业可能会给数据专员带来挑战,数据专员负责在出现问题时管理和修正问题。 关键数据域可能很复杂,其许多模糊的属性只有具有重要机构知识的终身员工才能理解。 通过 Profisee MDM 与 Microsoft Purview 集成,可以在 Microsoft Purview 中捕获此机构知识,并将其用于 Profisee MDM。 因此,在管理关键和时间敏感型信息时,可以缓解对公司数据知识的极大需求。

下图演示了从 Microsoft Purview 到在 Profisee FastApp 门户中工作的数据专员的信息流。 治理数据服务与 Microsoft Purview 和 Microsoft Entra ID 集成。 此服务提供查找功能。 FastApp 门户用户可以使用此功能来检索有关实体及其使用的属性的扩充治理数据。

此图显示了数据专员如何使用 Profisee 门户来处理Microsoft Purview 和 Profisee MDM 管理的数据。

治理服务还会将从 Microsoft Purview 收到的联系人解析为其完整配置文件详细信息,Microsoft Entra ID中提供了这些详细信息。 通过完整的配置文件详细信息,专员可以有效地与数据所有者和专家协作,因为他们致力于提高主数据的质量。

Profisee MDM 治理对话框是数据专员和用户与治理级别详细信息交互的界面。 此 UI 向用户呈现从 Microsoft Purview 获取的信息。 通过使用此信息,用户可以查看启动对话框的数据背后的详细信息。 如果“治理”对话框中提供的信息不足,用户可以直接转到 Microsoft Purview 用户体验。

数据专员和业务用户可以通过 FastApp 门户访问三种 Profisee MDM 数据资产类型:

  • Profisee 实例,它提供用户正在查看的 Profisee MDM 平台的特定实例的基础结构属性
  • Profisee 实体,它提供主数据实体的属性 (表) 管理员或用户当前正在查看
  • Profisee 属性,它提供属性 (的属性,例如用户感兴趣的字段或列)

下图演示了在 FastApp 门户中工作的用户可以在哪里查看这些资产类型的治理详细信息。 可以在 “帮助 ”菜单上找到实例级的详细信息。 可以从包含实体网格的页面区域标头访问实体详细信息。 有关属性详细信息,请转到与实体网格关联的窗体。 从与 属性关联的标签中访问详细信息。

Profisee 门户的屏幕截图。有关客户的信息是可见的。在“帮助”菜单上,突出显示了“治理”实例。

若要查看摘要信息,请将鼠标悬停在治理图标上,例如 Microsoft Purview。 选择图标以显示完整的治理对话框:

Profisee 门户的屏幕截图。在“客户”页上,对话框提供有关出生日期属性的详细信息。

若要转到完整的 Microsoft Purview 用户体验,请选择对话框标题中的治理图标。 选择图标后,即可在当前正在查看的资产的上下文中Microsoft Purview。 然后,可以根据发现需求在 Microsoft Purview 中轻松移动。

MDM 处理

MDM 解决方案的强大功能在于详细信息。

数据建模

MDM 解决方案的核心是基础数据模型。 它表示公司内部 主数据 的定义。 开发主数据模型涉及以下任务:

  • 识别来自整个系统环境的源数据的元素,这些元素对公司运营至关重要,并且对分析性能至关重要。
  • 使用从其他第三方源获取的元素来丰富模型,这些元素使数据更有用、更准确和更可信。
  • 建立与数据模型元素相关的明确所有权和权限。 这种做法有助于确保将可见性和变更管理纳入模型的设计。

数据治理提供了关键支持基础:

  • 治理统一目录、字典、术语表和支持资源是治理数据专员的宝贵信息来源。 这些资源可帮助专员确定主数据模型中要包含的内容。 它们还有助于确定 Microsoft Purview 中的所有权和敏感数据分类。 可以在模型中强化术语。 通过这种做法,你可以为企业建立官方词典。 通过集成术语,主数据模型还可以将各种源系统中使用的任何深奥术语转换为经批准的业务语言。
  • 第三方系统通常是独立于业务线系统的主数据源。 必须向模型添加元素,以捕获这些系统添加到数据的信息,并将这些信息源反映回统一目录。
  • 可以使用治理目录中标识的所有权和数据访问,在 MDM 解决方案中强制实施访问和更改管理权限。 因此,可将公司策略和需求与用于管理和管理主数据的工具保持一致。

源数据加载

理想情况下,不同的业务线系统将数据加载到主数据模型中,几乎无需更改或转换。 目标是在源系统中拥有数据的集中式版本。 源系统和主数据存储库之间的保真度损失应尽可能少。 通过限制加载过程的复杂性,可以简化世系。 使用数据工厂管道等技术时,治理解决方案可以检查流。 然后,解决方案可以识别源系统和主数据模型之间的关系。 具体而言,解决方案可以使用 100 个以上的预生成连接器和 REST 网关中的任何一个从源系统中提取数据。

数据扩充和标准化

将源数据加载到模型中后,可以通过利用第三方数据源的丰富源对其进行扩展。 可以使用这些系统来改进从业务线系统获取的数据。 还可以使用这些系统通过增强其他下游使用者使用的信息来扩充源数据。 例如:

  • 可以使用必应等地址验证服务来更正和改进源系统地址。 这些服务可以标准化并添加对地理位置和邮件传递至关重要的缺失信息。
  • 第三方信息服务(如 Dun & Bradstreet)可以提供常规用途或行业特定的数据。 可以使用此数据来扩展黄金主记录的值。 具体而言,可以在不同的业务线系统中添加不可用或有冲突的信息。

Profisee 的发布/订阅基础结构可以轻松地根据需要将自己的第三方源集成到解决方案中。

了解此数据背后的源和含义对于第三方数据以及内部业务线系统而言都至关重要。 通过将主数据模型集成到治理统一目录,可以管理内部和外部数据源之间的关系,同时使用治理详细信息丰富模型。

数据质量验证和管理

加载和扩充数据后,请务必检查数据,以确保质量和遵守通过治理流程建立的标准。 Microsoft Purview 可以再次成为丰富的标准信息来源。 可以使用 Microsoft Purview 来驱动 MDM 解决方案强制实施的数据质量规则。 Profisee MDM 还可以将数据质量规则作为资产发布到治理目录。 这些规则可以接受评审和批准,这有助于对与主数据关联的质量标准提供自上而下的监督。 规则与主数据实体和属性相关联,这些属性可追溯到源系统。 出于这些原因,可以确定源自业务线系统的数据质量不佳的根本原因。

数据专员是其治理领域的专家。 当管理员解决主数据解决方案揭示的问题时,他们可以使用 Microsoft Purview 数据治理目录。 目录可帮助管理人员了解并解决出现质量问题。 在数据所有者和专家的支持下,管理人员已准备好快速准确地解决数据质量问题。

匹配和幸存者

借助丰富的高质量源数据,可以生成一个黄金记录主数据,该主记录代表跨不同的业务线系统最准确的信息。 下图演示了所有步骤如何最终生成可供业务分析使用的高质量数据。 可以随时跨数据资产同步此数据。

显示幸存者和数据世系如何分解成黄金记录以及如何扩充数据的示意图。

Profisee MDM 匹配引擎生成黄金记录主控作为幸存者过程的一部分。 幸存者规则选择性地使用你在所有源系统中选择的信息填充黄金记录。

Profisee MDM 历史记录和审核跟踪子系统跟踪用户所做的更改。 此子系统还跟踪系统进程(如幸存者)所做的更改。 通过匹配和幸存者,可以跟踪从源记录到主节点的信息流。 Profisee MDM 具有负责特定源记录的源系统的记录。 你还了解不同的源记录如何填充黄金记录。 因此,可以实现从分析到报表引用的源数据的数据世系。

MDM 用例

尽管 MDM 有许多用例,但少数用例涵盖了大多数实际 MDM 实现。 这些用例侧重于单个域,但它们不太可能仅从该域生成。 即使是这些重点用例,也很可能涉及多个域。 在每个用例中,MDM 都满足提供基本数据类型的 360 度或统一视图的目标。

客户数据

合并和标准化用于 BI 分析的客户数据是最常见的 MDM 用例。 组织跨越来越多的系统和应用程序捕获客户数据。 重复的客户数据记录结果。 这些重复项位于 应用程序内和跨应用程序,并且包含不一致和差异。 客户数据质量差限制了新式分析解决方案的价值。 症状包括以下挑战:

  • 很难回答基本业务问题,例如“谁是我们的顶级客户?” 和“我们有多少新客户?”回答这些问题需要大量的手动工作。
  • 客户信息缺失且不准确,因此难以汇总或向下钻取数据。
  • 无法跨组织和系统边界唯一标识或验证客户。 因此,无法跨系统或业务部门分析客户数据。
  • 由于输入数据质量差,你从 AI 和机器学习中获得质量不佳的见解。

产品数据

产品数据通常分布在多个企业应用程序中,例如企业资源规划 (ERP) 、产品生命周期管理 (PLM) 或电子商务应用程序。 因此,很难理解属性定义不一致的产品目录,例如产品名称、说明和特征。 引用数据的不同定义使这种情况复杂化。 症状包括以下挑战:

  • 无法支持用于产品分析的不同替代分层汇总和向下钻取路径。
  • 对于成品或材料库存,您很难评估产品库存和已建立的供应商。 你还有重复的产品,这会导致库存过剩。
  • 由于定义冲突,很难使产品合理化。 这种情况会导致分析中缺少或不准确的信息。

引用数据

在分析上下文中,引用数据作为许多数据列表存在。 这些列表通常用于进一步描述其他主数据集。 例如,参考数据包括国家/地区、货币、颜色、大小和度量单位的列表。 不一致的引用数据会导致下游分析中出现明显的错误。 症状包括:

  • 同一值的多个表示形式。 例如,佐治亚州被列为 GA佐治亚州,这使得难以一致地聚合和向下钻取数据。
  • 由于无法跨系统 交叉或映射系统之间的引用数据值,难以简化数据。 例如,红色在 ERP 系统中由 R 表示,在 PLM 系统中由 红色 表示。
  • 由于用于数据分类的既定参考数据值存在差异,难以跨组织划分数字。

财务数据

财务组织严重依赖关键活动的数据,例如月度、季度和年度报告。 具有多个财务和会计系统的组织通常跨多个总帐的财务数据,这些总账需要合并以生成财务报告。 MDM 可以提供集中式中心来映射和管理帐户、成本中心、业务实体和其他财务数据集。 通过集中式中心,MDM 提供这些数据集的合并视图。 症状包括以下挑战:

  • 难以跨多个系统将财务数据聚合到合并视图中
  • 缺乏在财务系统中添加和映射新数据元素的过程
  • 在生成期末财务报告时出现延迟

注意事项

这些注意事项实现了 Azure Well-Architected 框架的支柱,该框架是一组可用于提高工作负荷质量的指导原则。 有关详细信息,请参阅 Microsoft Azure Well-Architected Framework

为组织选择数据管理解决方案时,请考虑这些因素。

可靠性

可靠性可确保应用程序能够履行对客户做出的承诺。 有关详细信息,请参阅 可靠性支柱概述

Profisee 在 Azure Kubernetes 服务 (AKS) 和 Azure SQL Database 上本机运行。 这两种服务都提供现用的功能来支持高可用性。

安全性

安全性提供针对故意攻击和滥用宝贵数据和系统的保证。 有关详细信息,请参阅 安全支柱概述

Profisee 使用 OpenID Connect 对用户进行身份验证,该连接实现 OAuth 2.0 身份验证流。 大多数组织将 Profisee MDM 配置为针对Microsoft Entra ID对用户进行身份验证,从而确保可以应用并强制实施企业策略进行身份验证。

成本优化

成本优化是关于寻找减少不必要的费用和提高运营效率的方法。 有关详细信息,请参阅 成本优化支柱概述

运行成本包括软件许可证和 Azure 消耗。 有关详细信息,请联系 Profisee

性能效率

性能效率是工作负载的缩放能力,以有效的方式满足用户对它的需求。 有关详细信息,请参阅 性能效率支柱概述

Profisee MDM 在 AKS 和 SQL 数据库 本机运行。 可以将 AKS 配置为纵向扩展、缩减和跨业务功能扩展 Profisee MDM。 可以在多种配置中部署SQL 数据库,以平衡性能、可伸缩性和成本。

动态缩放是 Profisee 的云原生体系结构中固有的,它使用微服务和容器。 如果通过 Kubernetes 在云租户中运行 Profisee,则可以根据负载动态纵向扩展和横向扩展。 借助在 AKS 上运行的 Profisee SaaS 服务 ,可以为 Pod 配置大型节点池。 这些池根据跨多租户基础结构的系统负载动态缩放。

有关如何在 AKS 上部署 Profisee 和 Microsoft Purview 的详细信息,请参阅 Microsoft Purview - Profisee MDM 集成

部署此方案

Profisee MDM 是打包的 Kubernetes 服务。 可以将 Profisee MDM 部署为 Azure 租户、任何其他云租户或本地的 PaaS。 还可以将 Profisee MDM 部署为 Profisee 托管和管理的 SaaS

  1. 通过在 上 https://support.profisee.com/提交支持票证,从 Profisee 获取许可证文件。 此步骤的唯一先决条件是需要预先确定在 Azure 上设置 Profisee 的 DNS 解析 URL。 换句话说,保留部署中使用的负载均衡器的 DNS 主机名。 它将类似于“[profisee_name]。[region].cloudapp.azure.com”。 例如,DNSHOSTNAME=“purviewprofisee.southcentralus.cloudapp.azure.com”。 提交支持票证时,请向 Profisee 支持提供此 DNSHOSTNAME,Profisee 将与许可证文件一起还原。 需要在下面的后续配置步骤中提供此文件。

  2. 在 Azure 中创建用户分配的托管标识。 必须创建托管标识才能运行部署。 部署完成后,可以删除托管标识。 根据 ARM 模板选择,需要为托管标识分配以下部分或全部角色和权限:

    • 将部署 AKS 的资源组的参与者角色。 可以直接将其分配给资源组, 也可以在 订阅级别或向下分配。
    • 要在其中创建条目的特定 DNS 区域的 DNS 区域参与者角色 ,或 DNS 区域资源组的参与者角色。 仅当更新 Azure 中托管的 DNS 时,才需要此 DNS 角色。
    • Microsoft Entra ID中的应用程序管理员角色,以便可以分配应用程序注册所需的权限。
    • 订阅级别的托管标识参与者和用户访问管理员。 为了使 ARM 模板托管标识能够创建一个密钥保管库特定的托管标识,Profisee 将使用该托管标识来拉取存储在 密钥保管库 中的值,这一点是必需的。

    Profisee 托管标识 Azure 角色分配的屏幕截图。

  3. 创建应用程序注册 ,在安装 Profisee 后将充当登录标识。 它必须是用于登录 Profisee 的Microsoft Entra ID的一部分。 保存 应用程序 (客户端) ID 以供以后使用。

    • 设置身份验证以匹配以下设置:
      • 用于隐式流和混合流 (的支持 ID 令牌)
      • 将重定向 URL 设置为:https://< your-deployment-url>/profisee/auth/signin-microsoft
        • 部署 URL 是在步骤 1 中提供 Profisee 的 URL
  4. 创建一个服务主体 ,Microsoft Purview 在此 Profisee 部署期间将用于对自身执行一些操作。 若要创建服务主体,请像在上一步中一样创建应用程序,然后 创建应用程序机密。 保存应用程序 的对象 ID ,以及创建的机密 的值 以供以后使用。

    • 使用名称或对象 ID 授予此服务主体 (,以) 数据策展人 权限对 Microsoft Purview 帐户的根集合进行定位。
  5. 转到 https://github.com/Profisee/kubernetes 并选择“Microsoft Purview Azure ARM”。

    • ARM 模板将使用入口控制器在负载均衡的 AKS (Azure Kubernetes 服务) 基础结构上部署 Profisee。
    • 自述文件包括故障排除步骤。
    • 仔细阅读所有步骤和排查 wiki 问题页面。
  6. 选择“部署到 Azure”

    部署到 Azure

    • 配置器向导将请求输入,如下文所述 - 使用 ARM 模板部署 AKS 群集
    • 请确保在部署中为托管标识提供完全相同的 RG (资源组) ,这与在步骤 1 中授予托管标识的权限完全相同。
  7. 部署完成后,选择“Microsoft Purview”转到资源组“并打开 Profisee AKS 群集。

典型Microsoft Purview - Profisee 部署运行的阶段

  1. 在“基本信息”页上,选择 之前为部署资源而创建的用户分配的托管标识

  2. 对于 Profisee 配置,可以将信息存储在 密钥保管库 中,或者在部署期间提供详细信息。

    1. 选择 Profisee 版本,并提供管理员用户帐户和许可证。
    2. 选择以使用 Microsoft Purview 进行配置。
    3. 对于应用程序注册客户端 ID,请提供前面创建的应用程序注册的应用程序 (客户端) ID
    4. 选择Microsoft Purview 帐户。
    5. 添加前面创建的服务主体的对象 ID
    6. 添加为该服务主体创建的机密的值。
    7. 为 Web 应用程序命名。

    Azure ARM 向导的“Profisee”页的屏幕截图,其中填写了所有值。

  3. 在“Kubernetes”页上,可以选择较旧版本的 Kubernetes(如果需要),但将字段留 以部署 最新版本

    ARM 部署向导中 Kubernetes 配置页的屏幕截图,其中配置了最小的标准大小和默认网络设置。

    提示

    在大多数情况下,将版本字段留空就足够了,除非有理由专门使用旧版 Kubernetes AKS 进行部署。

  4. 在“SQL 配置”页上,可以选择部署新的Azure SQL服务器,或使用现有的 Azure SQL 服务器。 你将提供登录详细信息和用于此部署的数据库名称。

    ARM 部署向导中 SQL 配置页的屏幕截图,其中“是,创建新SQL Server选中并提供了详细信息。

  5. 在存储配置页上,可以选择创建新的存储帐户或使用现有存储帐户。 如果选择现有帐户,则需要提供访问密钥和现有文件共享的名称。

    ARM 部署向导存储帐户页的屏幕截图,其中提供了详细信息。

  6. 在网络配置页上,你将选择使用默认的 Azure DNS 或提供自己的 DNS 主机名。

    提示

    是的,建议使用默认的 Azure DNS 配置。 选择“是”,部署程序会自动为 HTTP/TLS 创建 Let's Encrypt 证书。 如果选择“ ”,则需要提供各种网络配置参数和自己的 HTTPS/TLS 证书。

    ARM 部署“网络”页的屏幕截图,其中选择了“是使用默认 Azure DNS”。

    警告

    默认 Azure DNS URL (例如 URL=“https://purviewprofisee.southcentralus.cloudapp.azure.com/profisee") 将由 Profisee 提供的许可证文件中的 ARM 模板部署向导选取。 如果打算进行更改而不使用默认的 Azure DNS,请确保将 Profisee DNS 的完整 DNS 和完全限定的 URL 传达给 Profisee 支持团队,以便他们可以重新生成并提供更新后的许可证文件。 否则将导致 Profisee 安装失败。

  7. 在“审阅 + 创建”页上,查看详细信息,确保在向导验证配置时它们正确无误。 验证通过后,选择“ 创建”。

    ARM 部署向导的“审阅和创建”页的屏幕截图,其中显示了页面顶部带有通过验证标志的所有详细信息。

  8. 部署大约需要 45-50 分钟才能完成 Profisee 的安装。 在部署期间,你将看到正在进行的方面,并且可以刷新页面以查看进度。 完成所有操作后,部署将显示为已完成。 完成“InstallProfiseePlatform”阶段也表示部署已完成!

    Profisee Azure ARM 向导部署进度的屏幕截图,其中显示了中间进度。

    Profisee Azure ARM 向导部署进度的屏幕截图,其中显示了已完成的进度。

  9. 部署完成后,打开部署集成的资源组。

    部署 Profisee 资源的资源组的屏幕截图,其中突出显示了部署脚本。

  10. 在“输出”下,提取最终部署 URL。 最后一个 WEBURL 是你需要粘贴到浏览器地址栏上并开始享受 Profisee-Purview 集成的内容! 此 URL 将与获取许可证文件时提供给 Profisee 支持人员相同的 URL。 除非你选择更改 URL 格式,否则它将类似于 “https://[profisee_name]。[region].cloudapp.azure.com/profisee/

    部署脚本输出的屏幕截图,其中显示了输出中突出显示的部署 WEB URL。

  11. 通过安装 FastApp,向新安装的 Profisee 环境填充和冻结数据。 转到 Profisee 部署 URL 并选择 /Profisee/api/client。 它应类似于 “https://[profisee_name]。[region].cloudapp.azure.com/profisee/api/client”。 为“Profisee FastApp Studio”实用工具和“Profisee 平台工具”选择“下载”。 在本地客户端计算机上安装这两种工具。

    Profisee 客户端工具下载的屏幕截图,其中突出显示了下载链接。

  12. 登录到 FastApp Studio 并执行 Profisee 的 MDM 管理和配置管理的其余部分。 使用设置期间提供的管理员电子邮件地址登录后;你应该能够在 Profisee FastApp Studio 的左窗格中看到管理菜单。 导航到这些菜单,并使用 FastApp 工具执行 MDM 之旅的其余部分。 能够看到如下图所示的管理菜单,确认在 Azure 平台上成功安装 Profisee。

    登录后 Profisee FastApp Studio 的屏幕截图,其中显示了“帐户和 Teams”菜单已选中,并突出显示了 FastApps 链接。

  13. 为确保成功安装以及检查 Profisee 是否已成功连接到 Microsoft Purview 实例,最后一步是验证步骤,请转到 /Profisee/api/governance/health 它应类似于 “https://[profisee_name]。[region].cloudapp.azure.com//Profisee/api/governance/health”。 输出响应将指示所有 Microsoft Purview 子系统上的“ 状态”:“正常” 一词。

{
  "OverallStatus": "Healthy",
  "TotalCheckDuration": "0:XXXXXXX",
  "DependencyHealthChecks": {
    "purview_service_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": "Successfully connected to Purview."
    },
    "governance_service_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": "Purview cache loaded successfully. 
      Total assets: NNN; Instances: 1; Entities: NNN; Attributes: NNN; Relationships: NNN; Hierarchies: NNN"
    },
    "messaging_db_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": null
    },
    "logging_db_health_check": {
      "Status": "Healthy",
      "Duration": "00:00:NNNN",
      "Description": null
    }
  }
}

与上述内容类似的输出响应确认安装成功,完成所有部署步骤;和 验证 Profisee 是否已成功连接到 Microsoft Purview,并指示这两个系统能够正常通信。

后续步骤