Elija la configuración de Integration Runtime adecuada para el escenario.
Integration Runtime (IR) es la infraestructura de proceso que Microsoft Purview usa para impulsar el examen de datos en diferentes entornos de red. En este artículo se presentan los diferentes tipos de entorno de ejecución de integración disponibles en Microsoft Purview y se proporcionan instrucciones sobre cómo elegir la configuración de Integration Runtime adecuada para su escenario.
Tipos de entornos de ejecución de integración
Microsoft Purview proporciona los siguientes tipos de entornos de ejecución de integración:
- Entorno de ejecución de integración de Azure: El entorno de ejecución de integración de Azure es un proceso totalmente administrado y elástico que puede usar para examinar orígenes de datos de Azure o que no son de Azure. Azure IR admite conexiones a almacenes de datos y servicios de proceso con puntos de conexión accesibles públicamente. Es el entorno de ejecución de integración predeterminado el que no necesita crear nada para empezar.
- Entorno de ejecución de integración de Virtual Network administrada (VNet): puede crear un entorno de ejecución de integración de red virtual administrada, que reside en una Virtual Network administrada de Microsoft Purview. Puede usar puntos de conexión privados para conectarse de forma segura a los orígenes de datos admitidos y examinarlos. Obtenga más información en Managed Virtual Network and managed private endpoints (Puntos de conexión privados administrados y Virtual Network administrados).
- Entorno de ejecución de integración autohospedado: el entorno de ejecución de integración autohospedado se puede usar para examinar orígenes de datos en una red local o una red virtual. Puede instalarlo en una máquina local o en una máquina virtual dentro de la red privada. Obtenga más información en Creación y administración de entornos de ejecución de integración autohospedados.
- Runtime de integración autohospedado compatible con Kubernetes (versión preliminar): este entorno de ejecución de integración se hospeda en un clúster de Kubernetes y se puede usar para examinar orígenes de datos en una red local o en una red virtual. La compatibilidad con Kubernetes mejora el rendimiento general y permite que el entorno de ejecución de integración se escale con el trabajo. Obtenga más información en Creación y administración de entornos de ejecución de integración autohospedados compatibles con Kubernetes
- Entorno de ejecución de integración de AWS: el entorno de ejecución de integración de AWS es un proceso totalmente administrado y elástico hospedado por Microsoft Purview en AWS. Es aplicable al examen de orígenes de datos de Amazon como S3, RDS.
Elección del entorno de ejecución de integración correcto
Es importante elegir un tipo adecuado de entorno de ejecución de integración. No solo debe ser adecuado para la arquitectura y los requisitos existentes para la integración de datos, sino que también debe tener en cuenta cómo satisfacer aún más las crecientes necesidades empresariales y cualquier aumento futuro de la carga de trabajo.
La siguiente consideración puede ayudarle a navegar por la decisión:
¿Qué tipos de origen de datos desea examinar?
Consulte la sección Orígenes de datos admitidos para obtener información sobre los tipos de IR admitidos para los orígenes de datos que desea examinar.
¿Cuál es el control de acceso de red en el origen de datos?
Un origen de datos diferente puede tener diferentes configuraciones de firewall de red para protegerlo del acceso aleatorio a través de Internet, ya sea un almacén de datos local o de nube o SaaS. En la tabla siguiente se enumeran algunas opciones comunes de firewall. Puede elegir el tipo de IR compatible según su escenario.
Firewall de origen de datos Azure IR Ir de red virtual administrada SHIR SHIR compatible con Kubernetes Permitir el acceso público ✓ ✓ ✓ ✓ Permitir servicio de Azure o servicio de confianza ✓ ✓ ✓ ✓ Permitir el acceso desde una red virtual de Azure específica ✓ (con compatibilidad con puntos de conexión privados administrados) ✓ ✓ Permitir intervalo IP/IP específico ✓ ✓ Otro acceso a la red local o privada ✓ ✓ ¿Cuál es la configuración de firewall de Microsoft Purview?
Microsoft Purview proporciona diferentes opciones de firewall de red. Obtenga más información en Configuración del firewall de Microsoft Purview. Puede elegir el tipo de IR compatible según su escenario.
Firewall de Purview Azure IR Ir de red virtual administrada SHIR SHIR compatible con Kubernetes Habilitado desde todas las redes ✓ ✓ ✓ ✓ Deshabilitado de todas las redes ✓ (se requiere un punto de conexión privado administrado) ✓ (es necesario crear un punto de conexión privado desde la red) ✓ (es necesario crear un punto de conexión privado desde la red) ¿Qué nivel de seguridad necesita durante la transmisión de datos?
La ubicación del entorno de ejecución de integración define la ubicación de su proceso back-end y dónde se realizan las operaciones de examen. Para la consideración de residencia de datos:
- Cuando se usa Azure IR, Microsoft Purview detecta automáticamente la ubicación del origen de datos y usa ir en esa región. Si Microsoft Purview no puede detectar la región, usa la región de la cuenta de Purview.
- Cuando se usa Managed VNet IR, se ejecuta en la región que configure para la red virtual administrada.
- Al usar SHIR, puede decidir completamente la ubicación en las máquinas virtuales locales o de Azure.
Para defenderse, por ejemplo, de ataques man-in-the-middle durante la transmisión de datos, puede optar por usar un punto de conexión privado y Private Link para garantizar la seguridad de los datos.
- Puede crear puntos de conexión privados administrados en los almacenes de datos al usar Managed VNet IR. El servicio Microsoft Purview mantiene los puntos de conexión privados dentro de la red virtual administrada.
- También puede crear puntos de conexión privados en la red virtual y shir puede usarlos para acceder a almacenes de datos.
¿Qué nivel de mantenimiento puede proporcionar?
Mantener la infraestructura, los servidores y el equipo es una de las tareas importantes del departamento de TI de una empresa. Por lo general, se requiere mucho tiempo y esfuerzo.
- Al usar Azure IR y Managed VNet IR, no es necesario preocuparse por el mantenimiento, como la actualización, la revisión y la versión. El servicio Microsoft Purview se encarga de todos los esfuerzos de mantenimiento.
- Dado que SHIR está instalado en las máquinas y el SHIR compatible con Kubernetes se encuentra en los clústeres de Kubernetes, debe administrar el mantenimiento.
- SHIR admite la actualización automática para obtener automáticamente la versión más reciente siempre que haya una actualización. Obtenga más información sobre la actualización y expiración automáticas de Integration Runtime autohospedado.
- Actualmente, el entorno de ejecución de integración autohospedado compatible con Kubernetes solo admite actualizaciones manuales.
Rendimiento y escalabilidad
Se recomienda usar Azure IR totalmente administrado y escalado automático, Managed VNet IR o el entorno de ejecución de integración autohospedado compatible con Kubernetes siempre que corresponda. Con la elasticidad, pueden proporcionarle un mejor rendimiento y escalabilidad, especialmente al examinar sistemas de datos a gran escala.
Orígenes de datos admitidos
En la tabla siguiente se muestran todos los orígenes de datos admitidos por el examen de Microsoft Purview y los tipos de integration runtime admitidos.
Categoría | Almacén de datos admitido | Azure IR/AWS IR | Ir de red virtual administrada | SHIR | Kubernetes SHIR |
---|---|---|---|---|---|
Azure | Varios orígenes | ✓ | |||
Azure Blob Storage | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Cosmos DB (API for NoSQL) | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Data Explorer | ✓ | ✓ (solo v2) | ✓ | ✓ | |
Azure Data Lake Storage Gen1 | ✓ | ✓ (solo v2) | ✓ | ||
Azure Data Lake Storage Gen2 | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Database for MySQL | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Database for PostgreSQL | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Databricks Hive Metastore | ✓ | ✓ | |||
Unity Catalog para Azure Databricks | ✓ | ✓ (solo v2, incluido el punto de conexión privado administrado) | ✓ | ||
Grupo de Azure Dedicated SQL (anteriormente SQL DW) | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Files | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Base de datos SQL de Azure | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure SQL Managed Instance | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Azure Synapse Analytics (área de trabajo) | ✓ | ✓ (incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Base de datos | Amazon RDS | ✓ | ✓ | ||
Amazon Redshift | ✓ | ✓ | |||
Cassandra | ✓ | ✓ (solo v2) | ✓ | ✓ | |
Db2 | ✓ | ✓ | |||
Google BigQuery | ✓ | ✓ | |||
Base de datos de metastore de Hive | ✓ | ✓ | |||
MongoDB | ✓ | ✓ | |||
MySQL | ✓ | ✓ (solo v2, incluido el punto de conexión privado administrado) | ✓ | ✓ | |
Oracle | ✓ | ||||
PostgreSQL | ✓ | ✓ (solo v2) | ✓ | ✓ | |
Almacenamiento de datos empresarial SAP | ✓ | ✓ | |||
SAP HANA | ✓ | ✓ | |||
Copo de nieve | ✓ | ✓ (solo v2) | ✓ | ||
SQL Server | ✓ | ✓ | |||
SQL Server en Azure-Arc | ✓ | ✓ | |||
Teradata | ✓ | ||||
Archivo | Amazon S3 | ✓ | |||
HDFS | ✓ | ✓ | |||
Servicios y aplicaciones | Dataverse | ✓ | ✓ (solo v2) | ✓ | |
Erwin | ✓ | ||||
Looker | ✓ | ✓ (solo v2) | ✓ | ✓ | |
Tejido | ✓ | ✓ (solo v2) | ✓ | ||
Power BI | ✓ | ✓ (solo v2) | ✓ | ✓ | |
Sensor Qlik | ✓ | ✓ (solo v2) | ✓ | ||
Salesforce | ✓ | ✓ (solo v2) | ✓ | ✓ | |
SAP ECC | ✓ | ✓ | |||
SAP S/4HANA | ✓ | ✓ | |||
Tableau | ✓ | ✓ (solo v2) | ✓ |