Compartilhar via


Como configurar o Azure Cosmos DB for NoSQL em uma atividade de cópia

Este artigo descreve como usar a atividade de cópia em um pipeline de dados para copiar dados de e para o Azure Cosmos DB for NoSQL.

Configuração com suporte

Para a configuração de cada guia na atividade de cópia, vá para as seções a seguir, respectivamente.

Geral

Consulte as diretrizes de Configurações Geraispara definir a guia Configurações Gerais.

Origem

As propriedades a seguir têm suporte para Azure Cosmos DB for NoSQL na guia Origem de uma atividade de Cópia.

Screenshot showing source tab.

As seguintes propriedades são obrigatórias:

  • Tipo de armazenamento de dados: selecione Externo.
  • Conexão: selecione uma conexão Azure Cosmos DB for NoSQL na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB for NoSQL selecionando Novo.
  • Contêiner: selecione o contêiner que você deseja usar. Selecione Editar para inserir o nome do contêiner manualmente.

Em Avançado, você pode especificar os seguintes campos:

  • Usar consulta: você pode escolher Tabela ou Consulta como sua consulta de uso. A lista a seguir descreve a configuração de cada definição:

    • Tabela: lê dados da tabela especificada em Tabela.

    • Consulta: especifica a consulta do Azure Cosmos DB para ler dados.

      Screenshot showing query.

  • Tamanho da página: o número de documentos por página do resultado da consulta. O padrão é "-1", que significa usar o tamanho de página dinâmico do lado do serviço até 1.000.

  • Detectar datetime: se é para detectar datetime dos valores de cadeia de caracteres nos documentos. Os valores permitidos são: true (padrão), false.

  • Regiões preferenciais: a lista preferencial de regiões às quais se conectar ao recuperar dados do Azure Cosmos DB. Selecione uma região preferencial na lista suspensa depois de selecionar Novo.

    Screenshot showing preferred regions.

  • Colunas adicionais: adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão tem suporte para o último. Para obter mais informações, acesse Adicionar colunas adicionais durante a cópia.

    Screenshot showing additional columns.

Destino

As propriedades a seguir têm suporte para Azure Cosmos DB for NoSQL na guia Destino de uma atividade de Cópia.

Screenshot showing destination tab.

As seguintes propriedades são obrigatórias:

  • Tipo de armazenamento de dados: selecione Externo.
  • Conexão: selecione uma conexão Azure Cosmos DB for NoSQL na lista de conexões.
  • Caminho do arquivo: selecione Procurar para escolher o arquivo que você deseja copiar ou preencha o caminho manualmente.

Em Avançado, você pode especificar os seguintes campos:

  • Comportamento de gravação: define o comportamento de gravação quando a origem são arquivos de um armazenamento de dados baseado em arquivo. Você pode escolher Adicionar conteúdo dinâmico, Inserir ou Executar upsert na lista suspensa.

    • Adicionar conteúdo dinâmico: abra o painel Adicionar conteúdo dinâmico . Isso abre o construtor de expressões, em que você pode criar expressões de variáveis de sistema com suporte, saída de atividade, funções e variáveis ou parâmetros especificados pelo usuário. Para obter informações sobre a linguagem das expressões, confira Expressões e funções.

    • Inserir: escolha esta opção se os dados de origem tiverem inserções.

    • Executar upsert: O comportamento de executar upsert é substituir o documento se um documento com a mesma ID já existir; caso contrário, inserir o documento.

      Screenshot showing write behavior.

  • Tempo limite de gravação em lote: o tempo de espera para a operação de inserção em lotes ser concluída antes de atingir o tempo limite. Os valores permitidos são Timespan. Um exemplo é 00:30:00 (30 minutos).

  • Tamanho da gravação em lote: especifique o número de linhas a serem inseridas na tabela SQL por lote. O valor permitido é um inteiro (número de linhas). Por padrão, o serviço determina dinamicamente o tamanho do lote apropriado com base no tamanho da linha.

  • Máximo de conexões simultâneas: o limite superior de conexões simultâneas estabelecidas para o armazenamento de dados durante a execução da atividade. Especifique um valor somente quando desejar limitar as conexões simultâneas.

  • Desabilitar a análise de métricas de desempenho: essa configuração é usada para coletar métricas, como DTU, DWU, RU e assim por diante, para otimização e recomendações de desempenho de cópia. Se você estiver preocupado com esse comportamento, desative esse recurso.

Mapeamento

Para configuração da guia Mapeamento, acesse Configurar seus mapeamentos na guia Mapeamento.

Configurações

Para configuração da guia Configurações, acesse Definir suas outras configurações na guia configurações.

Resumo da tabela

As tabelas a seguir contêm mais informações sobre a atividade de cópia no Azure Cosmos DB for NoSQL.

Tabela de origem

Nome Descrição Valor Obrigatório Propriedade de script JSON
Tipo de armazenamento de dados Seu tipo de armazenamento de dados. Externo Yes /
Conexão Sua conexão com o armazenamento de dados de origem. <sua conexão> Yes connection
Contêiner O contêiner de seus dados de origem. <contêiner de seus dados de origem> Sim contêiner
fileName
Usar a consulta Você pode escolher Nome da lista ou Consulta como sua consulta de uso. Tabela
Consulta
Não tipo
Tamanho da página O número de documentos por página do resultado da consulta. O padrão é "-1", que significa usar o tamanho de página dinâmico do lado do serviço até 1.000. <o tamanho da sua Página> Não pageSize
Excluir datetime Os arquivos no armazenamento de dados de origem serão excluídos logo após serem movidos para o repositório de destino. A exclusão do arquivo é feita por arquivo, portanto, quando a atividade de Cópia falhar, você verá que alguns arquivos já foram copiados para o destino e excluídos da origem, enquanto outros ainda permanecem no repositório de origem. Selecionado ou desmarcado Não detectDatetime
Regiões preferenciais A lista preferencial de regiões às quais se conectar ao recuperar dados do Azure Cosmos DB. Selecione uma região preferencial na lista suspensa depois de selecionar Novo. <Suas regiões preferenciais> Não preferredRegions
Colunas adicionais Adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão tem suporte para o último. Para obter mais informações, acesse Adicionar colunas adicionais durante a cópia. <Máximo de conexões simultâneas> Não additionalColumns

Tabela de destino

Nome Descrição Valor Obrigatório Propriedade de script JSON
Tipo de armazenamento de dados Seu tipo de armazenamento de dados. Externo Yes /
Conexão Sua conexão com o armazenamento de dados de destino. <sua conexão> Yes connection
Contêiner O contêiner dos dados de destino. <contêiner da origem> Sim contêiner
fileName
Comportamento de gravação Descreve como gravar dados no Azure Cosmos DB. Valores permitidos são insert e upsert. O comportamento de upsert é substituir o documento se um documento com a mesma ID já existir; caso contrário, inserir o documento. Adicionar conteúdo dinâmico
Inserir
Executar upsert
Não writeBehavior
Tempo limite de gravação em lote O tempo de espera para a operação de inserção em lotes ser concluída antes de atingir o tempo limite.Os valores permitidos são Timespan. Um exemplo é 00:30:00 (30 minutos). TimeSpan No writeBatchTimeout
Tamanho do lote de gravação O número de linhas a serem inseridas na tabela SQL por lote. O valor permitido é inteiro (número de linhas). Por padrão, o serviço determina dinamicamente o tamanho do lote apropriado com base no tamanho da linha. <número de linhas >
(inteiro)
Não writeBatchSize
Máximo de conexões simultâneas O limite superior de conexões simultâneas estabelecidas com o armazenamento de dados durante a execução da atividade. Especifique um valor somente quando desejar limitar as conexões simultâneas. <Máximo de conexões simultâneas> Não maxConcurrentConnections
Desabilitar a análise de métricas de desempenho Essa configuração controla a coleta de métricas como DTU, DWU, RU e assim por diante para otimização e recomendações de desempenho de cópia. Se você estiver preocupado com esse comportamento, desative esse recurso. Selecionado ou desmarcado Não disableMetricsCollection