Gerenciar runtimes de integração

Concluído

No Data Factory, uma atividade define a ação a ser realizada. Um serviço vinculado define um armazenamento de dados de destino ou um serviço de computação. Um runtime de integração fornece a infraestrutura para a atividade e os serviços vinculados.

O Integration Runtime é referenciado pelo serviço vinculado ou pela atividade e fornece o ambiente de computação no qual a atividade é executada ou de onde é expedida. Desse modo, a atividade pode ser executada na região mais próxima possível do serviço de computação ou armazenamento de dados de destino, da maneira que proporciona o mais alto desempenho e atendendo às necessidades de segurança e de conformidade.

Em suma, o Integration Runtime (IR) é a infraestrutura de computação usada pelo Azure Data Factory. Ele fornece os seguintes recursos de integração de dados em diferentes ambientes de rede, incluindo:

  • Fluxo de Dados: execute um fluxo de dados no ambiente de computação gerenciado do Azure.
  • Movimentação de dados: copie os dados entre os armazenamentos de dados na rede pública e armazenamentos de dados na rede privada (local ou na rede virtual privada). Ele fornece suporte para conectores internos, conversão de formato, mapeamento de coluna e transferência de dados de alto desempenho e escalonáveis.
  • Expedição de atividade: distribua e monitore atividades de transformação executadas em uma variedade de serviços de computação, como o Azure Databricks, Azure HDInsight, Azure Machine Learning, Banco de Dados SQL do Azure, SQL Server e muito mais.
  • Execução de pacote SSIS: execute nativamente pacotes do SSIS (SQL Server Integration Services) em um ambiente de computação gerenciada do Azure.

Sempre que uma instância de Azure Data Factory é criada, um ambiente do Integration Runtime padrão é criado e dá suporte a operações em armazenamento de dados de nuvem e serviços de computação na rede pública. Isso pode ser exibido quando o Integration Runtime está definido como Resolução Automática

Tipos de Integration Runtime

O Data Factory oferece três tipos de Integration Runtime e você deve escolher o tipo que melhor atende as funcionalidades de integração de dados e as necessidades de ambiente de rede pelas quais você está procurando. Esses três tipos são:

  • Azure
  • Auto-hospedado
  • Azure-SSIS

Você pode definir explicitamente a configuração do Integration Runtime na propriedade connectVia, se isso não estiver definido. Em seguida, o Integration Runtime padrão será usado com a propriedade definida como Resolução Automática.

A tabela a seguir descreve as funcionalidades e o suporte de rede para cada um dos tipos de Integration Runtime:

Tipo de IR Rede pública Rede privada
Azure Fluxo de Dados Fluxo de Dados
Movimentação de dados Movimentação de dados
Expedição de atividade Expedição de atividade
Auto-hospedado Movimentação de dados Movimentação de dados
Expedição de atividade Expedição de atividade
Azure-SSIS Execução do pacote SSIS Execução do pacote SSIS

Determinando qual tempo de execução de integração usar

Há uma série de fatores que afetam o Integration Runtime que você usará. Veja a seguir um guia que o ajudará a selecionar o IR certo

Atividade de cópia

Para a atividade Copy, ela requer que os serviços vinculados de origem e de coletor definam a direção do fluxo de dados. A lógica a seguir é usada para determinar qual instância do Integration Runtime é usada para realizar a cópia:

  • Copiando entre duas fontes de dados de nuvem: quando os serviços vinculados de origem e o de coletor estiverem usando o IR do Azure, o ADF usará o IR do Azure regional, se especificado, ou determinará automaticamente um local do IR do Azure se você escolher a resolução automática do IR (padrão), conforme descrito na seção Local de runtime de integração.

  • Copiando entre uma fonte de dados de nuvem e uma fonte de dados na rede privada: se o serviço vinculado de origem ou de coletor aponta para um IR auto-hospedado, a atividade de cópia é executada nesse Integration Runtime auto-hospedado.

  • Copiando entre duas fontes de dados na rede privada: o Serviço vinculado de origem e o de coletor devem apontar para a mesma instância do Integration Runtime e esse runtime de integração é usado para executar a atividade de Copy.

Atividade de pesquisa e GetMetadata

A atividade de pesquisa e GetMetadata é executada no runtime de integração associado ao serviço vinculado de armazenamento de dados.

Atividade de transformação

Cada atividade de transformação tem um serviço vinculado de computação de destino, que aponta para um Integration Runtime. É dessa instância do Integration Runtime que a atividade de transformação é expedida.

Atividade de Fluxo de Dados

A atividade do Fluxo de Dados é executada no Integration Runtime associado a ela.