Escolha a configuração do runtime de integração correta para o seu cenário
O runtime de integração (IR) é a infraestrutura de computação que o Microsoft Purview utiliza para ativar a análise de dados em diferentes ambientes de rede. Este artigo apresenta os diferentes tipos de runtime de integração disponíveis no Microsoft Purview e fornece orientações sobre como escolher a configuração de runtime de integração certa para o seu cenário.
Tipos de runtimes de integração
O Microsoft Purview fornece os seguintes tipos de runtimes de integração:
- Runtime de integração do Azure: o runtime de integração do Azure é uma computação elástica e totalmente gerida que pode utilizar para analisar origens de dados do Azure ou não Azure. O IR do Azure suporta ligações a arquivos de dados e serviços de computação com pontos finais acessíveis publicamente. É o runtime de integração predefinido que não precisa de criar nada para começar.
- Runtime de integração do Rede Virtual Gerido (VNet): pode criar um runtime de integração da VNet Gerida, que reside num Rede Virtual Gerido do Microsoft Purview. Pode utilizar pontos finais privados para ligar e analisar de forma segura as origens de dados suportadas. Saiba mais no Managed Rede Virtual e nos pontos finais privados geridos.
- Runtime de integração autoalojado: o runtime de integração autoalojado pode ser utilizado para analisar origens de dados numa rede no local ou numa rede virtual. Pode instalá-la num computador no local ou numa máquina virtual dentro da sua rede privada. Saiba mais em Criar e gerir Runtimes de Integração Autoalojados.
- Runtime de integração autoalojado (Pré-visualização) suportado pelo Kubernetes : este runtime de integração está alojado num cluster do Kubernetes e pode ser utilizado para analisar origens de dados numa rede no local ou numa rede virtual. O suporte do Kubernetes melhora o desempenho geral e permite que o runtime de integração seja dimensionado com a tarefa. Saiba mais em Criar e gerir runtimes de integração autoalojados suportados pelo Kubernetes
- Runtime de integração do AWS: o runtime de integração do AWS é uma computação totalmente gerida e elástica alojada pelo Microsoft Purview no AWS. É aplicável ao analisar origens de dados da Amazon, como S3, RDS.
Escolher o runtime de integração certo
É importante escolher um tipo adequado de runtime de integração. Não só deve ser adequado para a sua arquitetura e requisitos existentes para a integração de dados, como também tem de considerar como satisfazer ainda mais as necessidades empresariais crescentes e qualquer aumento futuro da carga de trabalho.
A seguinte consideração pode ajudá-lo a navegar na decisão:
Que tipos de origem de dados pretende analisar?
Consulte a secção origens de dados suportadas para saber mais sobre os tipos de IR suportados para as origens de dados que pretende analisar.
Qual é o controlo de acesso à rede na sua origem de dados?
Uma origem de dados diferente pode ter diferentes definições de firewall de rede para protegê-la contra acesso aleatório através da Internet, pode ser um arquivo de dados no local ou numa nuvem/SaaS. A tabela seguinte lista algumas opções comuns de firewall. Pode escolher o tipo de IR suportado de acordo com o seu cenário.
Firewall da origem de dados Azure IR IR da VNet Gerida SHIR SHIR suportado pelo Kubernetes Permitir acesso público ✓ ✓ ✓ ✓ Permitir o serviço do Azure ou o serviço fidedigno ✓ ✓ ✓ ✓ Permitir o acesso a partir de uma rede virtual específica do Azure ✓ (com suporte para pontos finais privados geridos) ✓ ✓ Permitir um intervalo ip/IP específico ✓ ✓ Outro acesso à rede no local ou privado ✓ ✓ Qual é a definição da firewall do Microsoft Purview?
O Microsoft Purview fornece diferentes opções de firewall de rede. Saiba mais em Configurar a firewall do Microsoft Purview. Pode escolher o tipo de IR suportado de acordo com o seu cenário.
Firewall do Purview Azure IR IR da VNet Gerida SHIR SHIR suportado pelo Kubernetes Ativado a partir de todas as redes ✓ ✓ ✓ ✓ Desativado a partir de todas as redes ✓ (ponto final privado gerido necessário) ✓ (é necessário criar um ponto final privado a partir da sua rede) ✓ (é necessário criar um ponto final privado a partir da sua rede) Que nível de segurança precisa durante a transmissão de dados?
A localização do runtime de integração define a localização da computação de back-end e onde as operações de análise são executadas. Para consideração sobre a residência dos dados:
- Quando utiliza o Azure IR, o Microsoft Purview deteta automaticamente a localização da origem de dados e utiliza o IR nessa região. Se o Microsoft Purview não conseguir detetar a região, utiliza a região da conta do Purview.
- Quando utiliza o IR da VNet Gerida, este é executado na região que configura para a rede virtual gerida.
- Quando utiliza o SHIR, pode decidir totalmente a localização nas suas máquinas virtuais no local ou no Azure.
Para se defender contra, por exemplo, ataques man-in-the-middle durante a transmissão de dados, pode optar por utilizar um Ponto Final Privado e Link Privado para garantir a segurança dos dados.
- Pode criar pontos finais privados geridos para os arquivos de dados ao utilizar o IR da VNet Gerida. Os pontos finais privados são mantidos pelo serviço Microsoft Purview na rede virtual gerida.
- Também pode criar pontos finais privados na sua rede virtual e o SHIR pode utilizá-los para aceder a arquivos de dados.
Que nível de manutenção consegue fornecer?
Manter a infraestrutura, os servidores e o equipamento é uma das tarefas importantes do departamento de TI de uma empresa. Normalmente, demora muito tempo e esforço.
- Ao utilizar o IR do Azure e o IR da VNet Gerida, não precisa de se preocupar com a manutenção, como a atualização, o patch e a versão. O serviço Microsoft Purview trata de todos os esforços de manutenção.
- Uma vez que o SHIR está instalado nos seus computadores e o SHIR suportado pelo Kubernetes está nos clusters do Kubernetes, tem de gerir a manutenção.
- O SHIR suporta a atualização automática para obter automaticamente a versão mais recente sempre que existir uma atualização. Saiba mais em Atualização automática e expiração do runtime de integração autoalojado.
- Atualmente, o runtime de integração autoalojado suportado pelo Kubernetes só suporta atualizações manuais.
Desempenho e escalabilidade
Recomendamos que utilize o Azure IR totalmente gerido e dimensionado automaticamente, o IR da VNet Gerida ou o runtime de integração autoalojado suportado pelo Kubernetes sempre que aplicável. Com a elasticidade, podem proporcionar-lhe um melhor desempenho e escalabilidade, especialmente ao analisar sistemas de dados em grande escala.
Origens de dados suportadas
A tabela abaixo mostra todas as origens de dados suportadas pela análise do Microsoft Purview e os tipos de runtime de integração suportados.
Categoria | Arquivo de dados suportado | IR do Azure/IR do AWS | IR da VNet Gerida | SHIR | Kubernetes SHIR |
---|---|---|---|---|---|
Azure | Várias origens | ✓ | |||
Azure Storage Blob | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Azure Cosmos DB (API para NoSQL) | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Azure Data Explorer | ✓ | ✓ (apenas v2) | ✓ | ✓ | |
Azure Data Lake Storage Gen1 | ✓ | ✓ (apenas v2) | ✓ | ||
Azure Data Lake Storage Gen2 | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Banco de Dados do Azure para MySQL | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Banco de dados do Azure para PostgreSQL | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Azure Databricks Hive Metastore | ✓ | ✓ | |||
Catálogo do Unity no Azure Databricks | ✓ | ✓ (apenas v2, incluindo o ponto final privado gerido) | ✓ | ||
Pool de SQL Dedicado do Azure (antigo SQL DW) | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Arquivos do Azure | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Banco de Dados SQL Azure | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Instância Gerenciada de SQL do Azure | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Azure Synapse Analytics (Área de Trabalho) | ✓ | ✓ (incluindo o ponto final privado gerido) | ✓ | ✓ | |
Banco de dados | Amazon RDS | ✓ | ✓ | ||
Amazon Redshift | ✓ | ✓ | |||
Cassandra | ✓ | ✓ (apenas v2) | ✓ | ✓ | |
DB2 | ✓ | ✓ | |||
BigQuery do Google | ✓ | ✓ | |||
Banco de Dados do Metastore do Hive | ✓ | ✓ | |||
Mongodb | ✓ | ✓ | |||
MySQL | ✓ | ✓ (apenas v2, incluindo o ponto final privado gerido) | ✓ | ✓ | |
Oracle | ✓ | ||||
PostgreSQL | ✓ | ✓ (apenas v2) | ✓ | ✓ | |
Warehouse de Negócios do SAP | ✓ | ✓ | |||
SAP HANA | ✓ | ✓ | |||
Snowflake | ✓ | ✓ (apenas v2) | ✓ | ||
SQL Server | ✓ | ✓ | |||
SQL Server no Azure-Arc | ✓ | ✓ | |||
Teradata | ✓ | ||||
Arquivo | Amazon S3 | ✓ | |||
HDFS | ✓ | ✓ | |||
Serviços e aplicações | Dataverse | ✓ | ✓ (apenas v2) | ✓ | |
Erwin | ✓ | ||||
Looker | ✓ | ✓ (apenas v2) | ✓ | ✓ | |
Recursos de Infraestrutura | ✓ | ✓ (apenas v2) | ✓ | ||
Power BI | ✓ | ✓ (apenas v2) | ✓ | ✓ | |
Qlik Sense | ✓ | ✓ (apenas v2) | ✓ | ||
Salesforce | ✓ | ✓ (apenas v2) | ✓ | ✓ | |
SAP ECC | ✓ | ✓ | |||
SAP S/4HANA | ✓ | ✓ | |||
Tableau | ✓ | ✓ (apenas v2) | ✓ |