Поделиться через


Выберите правильную конфигурацию среды выполнения интеграции для своего сценария.

Среда выполнения интеграции (IR) — это вычислительная инфраструктура, которую Microsoft Purview использует для проверки данных в разных сетевых средах. В этой статье представлены различные типы среды выполнения интеграции, доступные в Microsoft Purview, и приведены рекомендации по выбору правильной конфигурации среды выполнения интеграции для вашего сценария.

Типы сред выполнения интеграции

Microsoft Purview предоставляет следующие типы сред выполнения интеграции:

  • Среда выполнения интеграции Azure. Среда выполнения интеграции Azure — это полностью управляемые и эластичные вычисления, которые можно использовать для сканирования источников данных Azure или других источников данных. Azure IR поддерживает подключения к хранилищам данных и службам вычислений с общедоступными конечными точками. Это среда выполнения интеграции по умолчанию, которую не нужно создавать для начала работы.
  • Управляемая среда выполнения интеграции виртуальная сеть (виртуальная сеть). Вы можете создать среду выполнения интеграции управляемой виртуальной сети, которая находится в управляемом виртуальная сеть Microsoft Purview. Он может использовать частные конечные точки для безопасного подключения и сканирования поддерживаемых источников данных. Дополнительные сведения см. в разделе Управляемые виртуальная сеть и управляемые частные конечные точки.
  • Локальная среда выполнения интеграции. Локальная среда выполнения интеграции может использоваться для сканирования источников данных в локальной или виртуальной сети. Его можно установить на локальном компьютере или виртуальной машине в частной сети. Дополнительные сведения см. в статье Создание локальных сред выполнения интеграции и управление ими.
  • Поддерживаемая kubernetes локальная среда выполнения интеграции (предварительная версия). Эта среда выполнения интеграции размещена в кластере Kubernetes и может использоваться для сканирования источников данных в локальной или виртуальной сети. Поддержка Kubernetes повышает общую производительность и позволяет среде выполнения интеграции масштабироваться вместе с заданием. Дополнительные сведения см. в статье Создание поддерживаемых kubernetes локальных сред выполнения интеграции и управление ими
  • Среда выполнения интеграции AWS. Среда выполнения интеграции AWS — это полностью управляемая и эластичная среда вычислений, размещенная Microsoft Purview в AWS. Это применимо при сканировании источников данных Amazon, таких как S3, RDS.

Выбор правильной среды выполнения интеграции

Важно выбрать подходящий тип среды выполнения интеграции. Он не только должен соответствовать существующей архитектуре и требованиям для интеграции данных, но также необходимо рассмотреть вопрос о том, как в дальнейшем удовлетворить растущие бизнес-потребности и любое будущее увеличение рабочей нагрузки.

Следующие рекомендации помогут вам принять решение.

  1. Какие типы источников данных нужно сканировать?

    Ознакомьтесь с разделом Поддерживаемые источники данных , чтобы узнать о поддерживаемых типах IR для источников данных, которые требуется сканировать.

  2. Что такое управление доступом к сети в источнике данных?

    Разные источники данных могут иметь разные параметры сетевого брандмауэра, чтобы защитить его от случайного доступа через Интернет, может быть локальным или облачным хранилищем данных или хранилищем данных SaaS. В следующей таблице перечислены некоторые распространенные параметры брандмауэра. Поддерживаемый тип IR можно выбрать в соответствии с вашим сценарием.

    Брандмауэр источника данных Azure IR Среда IR управляемой виртуальной сети СБОРКИ Поддерживаемый Kubernetes SHIR
    Разрешить общий доступ
    Разрешение службы Azure или доверенной службы
    Разрешение доступа из определенной виртуальной сети Azure ✓ (с поддержкой управляемой частной конечной точки)
    Разрешить определенный IP-адрес или диапазон IP-адресов
    Доступ к другим локальным или частным сетям
  3. Какой параметр брандмауэра в Microsoft Purview?

    Microsoft Purview предоставляет различные параметры брандмауэра сети. Дополнительные сведения см . в статье Настройка брандмауэра Microsoft Purview. Поддерживаемый тип IR можно выбрать в соответствии с вашим сценарием.

    Брандмауэр Purview Azure IR Среда IR управляемой виртуальной сети СБОРКИ Поддерживаемый Kubernetes SHIR
    Включена из всех сетей
    Отключено во всех сетях ✓ (требуется управляемая частная конечная точка) ✓ (необходимо создать частную конечную точку из сети) ✓ (необходимо создать частную конечную точку из сети)
  4. Какой уровень безопасности требуется во время передачи данных?

    Расположение среды выполнения интеграции определяет расположение внутренних вычислений и место выполнения операций сканирования. Чтобы рассмотреть вопрос о месте расположения данных:

    • При использовании Azure IR Microsoft Purview автоматически обнаруживает расположение источника данных и использует ir в этом регионе. Если Microsoft Purview не может определить регион, он использует регион учетной записи Purview.
    • При использовании среды IR управляемой виртуальной сети она выполняется в регионе, настроенном для управляемой виртуальной сети.
    • При использовании SHIR вы можете полностью выбрать расположение на локальных виртуальных машинах или виртуальных машинах Azure.

    Чтобы защититься от атак типа "злоумышленник в середине" во время передачи данных, можно использовать частную конечную точку и Приватный канал для обеспечения безопасности данных.

    • Управляемые частные конечные точки можно создавать в хранилищах данных при использовании среды IR управляемой виртуальной сети. Частные конечные точки поддерживаются службой Microsoft Purview в управляемой виртуальной сети.
    • Вы также можете создавать частные конечные точки в виртуальной сети, а SHIR может использовать их для доступа к хранилищам данных.
  5. Какой уровень обслуживания вы можете обеспечить?

    Обслуживание инфраструктуры, серверов и оборудования является одной из важных задач ИТ-отдела предприятия. Обычно это занимает много времени и усилий.

  6. Производительность и масштабируемость

    При необходимости рекомендуется использовать полностью управляемую и автомасштабируемую среду выполнения Azure IR, управляемой виртуальной сети IR или локальную среду выполнения интеграции с поддержкой Kubernetes. Благодаря эластичности они могут обеспечить лучшую производительность и масштабируемость, особенно при сканировании крупномасштабных систем данных.

Поддерживаемые источники данных

В таблице ниже показаны все источники данных, поддерживаемые проверкой Microsoft Purview, и поддерживаемые типы среды выполнения интеграции.

Категория Поддерживаемо хранилище данных Azure IR/AWS IR Среда IR управляемой виртуальной сети СБОРКИ Kubernetes SHIR
Azure Несколько источников
Хранилище BLOB-объектов Azure ✓ (включая управляемую частную конечную точку)
Azure Cosmos DB (API для NoSQL) ✓ (включая управляемую частную конечную точку)
Azure Data Explorer ✓ (только версия 2)
Azure Data Lake Storage 1-го поколения ✓ (только версия 2)
Azure Data Lake Storage 2-го поколения ✓ (включая управляемую частную конечную точку)
База данных Azure для MySQL ✓ (включая управляемую частную конечную точку)
База данных Azure для PostgreSQL ✓ (включая управляемую частную конечную точку)
Хранилище метаданных Hive в Azure Databricks
Каталог Unity Azure Databricks ✓ (только версия 2, включая управляемую частную конечную точку)
Выделенный пул SQL Azure (ранее — SQL DW) ✓ (включая управляемую частную конечную точку)
Файлы Azure ✓ (включая управляемую частную конечную точку)
База данных SQL Azure ✓ (включая управляемую частную конечную точку)
Управляемый экземпляр SQL Azure ✓ (включая управляемую частную конечную точку)
аналитика Azure Synapse (рабочая область) ✓ (включая управляемую частную конечную точку)
База данных Amazon RDS
Amazon Redshift
Cassandra ✓ (только версия 2)
Db2
Google BigQuery
База данных хранилища метаданных Hive
MongoDB
MySQL ✓ (только версия 2, включая управляемую частную конечную точку)
Oracle
PostgreSQL ✓ (только версия 2)
Хранилище SAP для бизнеса
SAP HANA
Снежинка ✓ (только версия 2)
Сервер SQL Server.
SQL Server в Azure-Arc
Teradata
File Amazon S3
HDFS
Службы и приложения Dataverse ✓ (только версия 2)
Erwin
Looker ✓ (только версия 2)
Ткань ✓ (только версия 2)
Power BI ✓ (только версия 2)
Qlik Sense ✓ (только версия 2)
Salesforce ✓ (только версия 2)
SAP ECC
SAP S/4HANA
Tableau ✓ (только версия 2)