Como configurar o Azure Cosmos DB for NoSQL em uma atividade de cópia
Este artigo descreve como usar a atividade de cópia em um pipeline de dados para copiar dados de e para o Azure Cosmos DB for NoSQL.
Configuração com suporte
Para a configuração de cada guia na atividade de cópia, vá para as seções a seguir, respectivamente.
Geral
Consulte as diretrizes de Configurações Geraispara definir a guia Configurações Gerais.
Origem
As propriedades a seguir têm suporte para Azure Cosmos DB for NoSQL na guia Origem de uma atividade de Cópia.
As seguintes propriedades são obrigatórias:
- Tipo de armazenamento de dados: selecione Externo.
- Conexão: selecione uma conexão Azure Cosmos DB for NoSQL na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB for NoSQL selecionando Novo.
- Contêiner: selecione o contêiner que você deseja usar. Selecione Editar para inserir o nome do contêiner manualmente.
Em Avançado, você pode especificar os seguintes campos:
Usar consulta: você pode escolher Tabela ou Consulta como sua consulta de uso. A lista a seguir descreve a configuração de cada definição:
Tabela: lê dados da tabela especificada em Tabela.
Consulta: especifica a consulta do Azure Cosmos DB para ler dados.
Tamanho da página: o número de documentos por página do resultado da consulta. O padrão é "-1", que significa usar o tamanho de página dinâmico do lado do serviço até 1.000.
Detectar datetime: se é para detectar datetime dos valores de cadeia de caracteres nos documentos. Os valores permitidos são: true (padrão), false.
Regiões preferenciais: a lista preferencial de regiões às quais se conectar ao recuperar dados do Azure Cosmos DB. Selecione uma região preferencial na lista suspensa depois de selecionar Novo.
Colunas adicionais: adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão tem suporte para o último. Para obter mais informações, acesse Adicionar colunas adicionais durante a cópia.
Destino
As propriedades a seguir têm suporte para Azure Cosmos DB for NoSQL na guia Destino de uma atividade de Cópia.
As seguintes propriedades são obrigatórias:
- Tipo de armazenamento de dados: selecione Externo.
- Conexão: selecione uma conexão Azure Cosmos DB for NoSQL na lista de conexões.
- Caminho do arquivo: selecione Procurar para escolher o arquivo que você deseja copiar ou preencha o caminho manualmente.
Em Avançado, você pode especificar os seguintes campos:
Comportamento de gravação: define o comportamento de gravação quando a origem são arquivos de um armazenamento de dados baseado em arquivo. Você pode escolher Adicionar conteúdo dinâmico, Inserir ou Executar upsert na lista suspensa.
Adicionar conteúdo dinâmico: abra o painel Adicionar conteúdo dinâmico . Isso abre o construtor de expressões, em que você pode criar expressões de variáveis de sistema com suporte, saída de atividade, funções e variáveis ou parâmetros especificados pelo usuário. Para obter informações sobre a linguagem das expressões, confira Expressões e funções.
Inserir: escolha esta opção se os dados de origem tiverem inserções.
Executar upsert: O comportamento de executar upsert é substituir o documento se um documento com a mesma ID já existir; caso contrário, inserir o documento.
Tempo limite de gravação em lote: o tempo de espera para a operação de inserção em lotes ser concluída antes de atingir o tempo limite. Os valores permitidos são
Timespan
. Um exemplo é 00:30:00 (30 minutos).Tamanho da gravação em lote: especifique o número de linhas a serem inseridas na tabela SQL por lote. O valor permitido é um inteiro (número de linhas). Por padrão, o serviço determina dinamicamente o tamanho do lote apropriado com base no tamanho da linha.
Máximo de conexões simultâneas: o limite superior de conexões simultâneas estabelecidas para o armazenamento de dados durante a execução da atividade. Especifique um valor somente quando desejar limitar as conexões simultâneas.
Desabilitar a análise de métricas de desempenho: essa configuração é usada para coletar métricas, como DTU, DWU, RU e assim por diante, para otimização e recomendações de desempenho de cópia. Se você estiver preocupado com esse comportamento, desative esse recurso.
Mapeamento
Para configuração da guia Mapeamento, acesse Configurar seus mapeamentos na guia Mapeamento.
Configurações
Para configuração da guia Configurações, acesse Definir suas outras configurações na guia configurações.
Resumo da tabela
As tabelas a seguir contêm mais informações sobre a atividade de cópia no Azure Cosmos DB for NoSQL.
Tabela de origem
Nome | Descrição | Valor | Obrigatório | Propriedade de script JSON |
---|---|---|---|---|
Tipo de armazenamento de dados | Seu tipo de armazenamento de dados. | Externo | Yes | / |
Conexão | Sua conexão com o armazenamento de dados de origem. | <sua conexão> | Yes | connection |
Contêiner | O contêiner de seus dados de origem. | <contêiner de seus dados de origem> | Sim | contêiner fileName |
Usar a consulta | Você pode escolher Nome da lista ou Consulta como sua consulta de uso. | • Tabela • Consulta |
Não | tipo |
Tamanho da página | O número de documentos por página do resultado da consulta. O padrão é "-1", que significa usar o tamanho de página dinâmico do lado do serviço até 1.000. | <o tamanho da sua Página> | Não | pageSize |
Excluir datetime | Os arquivos no armazenamento de dados de origem serão excluídos logo após serem movidos para o repositório de destino. A exclusão do arquivo é feita por arquivo, portanto, quando a atividade de Cópia falhar, você verá que alguns arquivos já foram copiados para o destino e excluídos da origem, enquanto outros ainda permanecem no repositório de origem. | Selecionado ou desmarcado | Não | detectDatetime |
Regiões preferenciais | A lista preferencial de regiões às quais se conectar ao recuperar dados do Azure Cosmos DB. Selecione uma região preferencial na lista suspensa depois de selecionar Novo. | <Suas regiões preferenciais> | Não | preferredRegions |
Colunas adicionais | Adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão tem suporte para o último. Para obter mais informações, acesse Adicionar colunas adicionais durante a cópia. | <Máximo de conexões simultâneas> | Não | additionalColumns |
Tabela de destino
Nome | Descrição | Valor | Obrigatório | Propriedade de script JSON |
---|---|---|---|---|
Tipo de armazenamento de dados | Seu tipo de armazenamento de dados. | Externo | Yes | / |
Conexão | Sua conexão com o armazenamento de dados de destino. | <sua conexão> | Yes | connection |
Contêiner | O contêiner dos dados de destino. | <contêiner da origem> | Sim | contêiner fileName |
Comportamento de gravação | Descreve como gravar dados no Azure Cosmos DB. Valores permitidos são insert e upsert. O comportamento de upsert é substituir o documento se um documento com a mesma ID já existir; caso contrário, inserir o documento. | • Adicionar conteúdo dinâmico • Inserir • Executar upsert |
Não | writeBehavior |
Tempo limite de gravação em lote | O tempo de espera para a operação de inserção em lotes ser concluída antes de atingir o tempo limite.Os valores permitidos são Timespan. Um exemplo é 00:30:00 (30 minutos). | TimeSpan | No | writeBatchTimeout |
Tamanho do lote de gravação | O número de linhas a serem inseridas na tabela SQL por lote. O valor permitido é inteiro (número de linhas). Por padrão, o serviço determina dinamicamente o tamanho do lote apropriado com base no tamanho da linha. | <número de linhas > (inteiro) |
Não | writeBatchSize |
Máximo de conexões simultâneas | O limite superior de conexões simultâneas estabelecidas com o armazenamento de dados durante a execução da atividade. Especifique um valor somente quando desejar limitar as conexões simultâneas. | <Máximo de conexões simultâneas> | Não | maxConcurrentConnections |
Desabilitar a análise de métricas de desempenho | Essa configuração controla a coleta de métricas como DTU, DWU, RU e assim por diante para otimização e recomendações de desempenho de cópia. Se você estiver preocupado com esse comportamento, desative esse recurso. | Selecionado ou desmarcado | Não | disableMetricsCollection |