Partilhar via


Configurar o Azure Cosmos DB para MongoDB em uma atividade de cópia

Este artigo descreve como usar a atividade de cópia em pipelines de dados para copiar dados de e para o Azure Cosmos DB para MongoDB.

Configuração suportada

Para a configuração de cada guia em atividade de cópia, vá para as seções a seguir, respectivamente.

Geral

Consulte as orientações de configurações gerais para configurar a guia Configurações gerais.

Origem

Vá para a guia Origem para configurar sua fonte de atividade de cópia. Consulte o conteúdo a seguir para obter a configuração detalhada.

Captura de ecrã a mostrar o separador origem e a lista de propriedades.

As seguintes propriedades são necessárias:

  • Conexão: selecione uma conexão do Azure Cosmos DB para MongoDB na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB para MongoDB selecionando Mais na parte inferior da lista de conexões.
  • Banco de dados: Selecione seu banco de dados na lista suspensa.
  • Nome da coleção: especifique o nome da coleção do Azure Cosmos DB. Você pode selecionar a coleção na lista suspensa.

Em Avançado, você pode especificar os seguintes campos:

  • Filtro: especifica o filtro de seleção usando operadores de consulta. Para retornar todos os documentos de uma coleção, omita esse parâmetro ou passe um documento vazio ({}).
  • Métodos do cursor: Selecione + Novo para especificar a maneira como a consulta subjacente é executada. As maneiras de executar a consulta são:
    • project: Especifica os campos a serem retornados nos documentos para projeção. Para retornar todos os campos nos documentos correspondentes, omita esse parâmetro.
    • sort: especifica a ordem na qual a consulta retorna documentos correspondentes. Vá para cursor.sort() para obter mais informações.
    • limit: Especifica o número máximo de documentos retornados pelo servidor. Vá para cursor.limit() para obter mais informações.
    • skip: Especifica o número de documentos a serem ignorados e de onde o MongoDB começa a retornar resultados. Vá para cursor.skip() para obter mais informações.
  • Tamanho do lote: especifica o número de documentos a serem retornados em cada lote da resposta da instância do MongoDB. Na maioria dos casos, modificar o tamanho do lote não afetará o usuário ou o aplicativo. Os limites do Azure Cosmos DB para cada lote não podem exceder 40 MB de tamanho, que é a soma do número de tamanho de lote dos documentos, portanto, diminua esse valor se o tamanho do documento for grande. O valor predefinido é 100.
  • Colunas adicionais: adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão é suportada para este último.

Destino

Vá para a guia Destino para configurar o destino da atividade de cópia. Consulte o conteúdo a seguir para obter a configuração detalhada.

Captura de ecrã a mostrar o separador de destino e a lista de propriedades.

As seguintes propriedades são necessárias:

  • Conexão: selecione uma conexão do Azure Cosmos DB para MongoDB na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB para MongoDB selecionando Mais na parte inferior da lista de conexões.
  • Banco de dados: Selecione seu banco de dados na lista suspensa.
  • Nome da coleção: especifique o nome da coleção do Azure Cosmos DB. Você pode selecionar a coleção na lista suspensa.

Em Avançado, você pode especificar os seguintes campos:

  • Comportamento de gravação: descreve como gravar dados no Azure Cosmos DB para MongoDB. Valores permitidos: Inserir e Upsert.

    O comportamento do Upsert é substituir o documento se já existir um documento com o mesmo _id , caso contrário, insira o documento.

    Nota

    O serviço gera automaticamente um _id para um documento se um _id não for especificado no documento original ou por mapeamento de coluna. Isso significa que você deve garantir que, para que o Upsert funcione conforme o esperado, seu documento tenha uma identificação.

  • Tempo limite de gravação do lote: especifique o tempo de espera para que a operação de inserção do lote seja concluída antes que ela atinja o tempo limite. O valor permitido é timespan e o valor padrão é 00:30:00 (30 minutos).

  • Tamanho do lote de gravação: esta propriedade controla o tamanho dos documentos a serem gravados em cada lote. Você pode tentar aumentar o valor para melhorar o desempenho e diminuir o valor se o tamanho do documento for grande. O valor padrão é 10.000.

Mapeamento

Para a configuração da guia Mapeamento , consulte Configurar seus mapeamentos na guia mapeamento. O mapeamento não é suportado quando a origem e o destino são dados hierárquicos.

Definições

Para Configuração da guia Configurações , vá para Configurar suas outras configurações na guia Configurações.

Resumo da tabela

A tabela a seguir contém mais informações sobre a atividade de cópia no Azure Cosmos DB para MongoDB.

Fonte da informação

Nome Descrição valor Necessário Propriedade de script JSON
Ligação Sua conexão com o armazenamento de dados de origem. < sua conexão do Azure Cosmos DB para MongoDB > Sim ligação
Base de dados Seu banco de dados que você usa como fonte. < A sua base de dados > Sim base de dados
Nome da coleção O nome da coleção do Azure Cosmos DB. < A sua coleção > Sim Coleção
Filtro O filtro de seleção usando operadores de consulta. Para retornar todos os documentos de uma coleção, omita esse parâmetro ou passe um documento vazio ({}). < O seu filtro de seleção > Não filtrar
Métodos de cursor A maneira como a consulta subjacente é executada. • Projeto
• ordenar
• limite
• pular
Não cursorMethods:
• Projeto
• ordenar
• limite
• pular
Tamanho do lote O número de documentos a serem retornados em cada lote da resposta da instância do MongoDB. Na maioria dos casos, modificar o tamanho do lote não afetará o usuário ou o aplicativo. Os limites do Azure Cosmos DB para cada lote não podem exceder 40 MB de tamanho, que é a soma do número de tamanho de lote dos documentos, portanto, diminua esse valor se o tamanho do documento for grande. < o tamanho do lote de gravação >
(o padrão é 100)
Não batchSize
Colunas adicionais Adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão é suportada para este último. • Nome
• Valor
Não adicionaisColunas:
• nome
• valor

Informações sobre o destino

Nome Descrição valor Necessário Propriedade de script JSON
Ligação Sua conexão com o armazenamento de dados de destino. < sua conexão do Azure Cosmos DB para MongoDB > Sim ligação
Base de dados Seu banco de dados que você usa como destino. < A sua base de dados > Sim base de dados
Nome da coleção O nome da coleção do Azure Cosmos DB. < A sua coleção > Sim Coleção
Comportamento de escrita Descreve como gravar dados no Azure Cosmos DB para MongoDB. Valores permitidos: Inserir e Upsert.

O comportamento do Upsert é substituir o documento se já existir um documento com o mesmo _id , caso contrário, insira o documento.

Nota: O serviço gera automaticamente um _id para um documento se um _id não for especificado no documento original ou por mapeamento de coluna. Isso significa que você deve garantir que, para que o Upsert funcione conforme o esperado, seu documento tenha uma identificação.
• Inserir (padrão)
• Upsert
Não writeBehavior:
• inserir
• Upsert
Tempo limite de gravação em lote O tempo de espera para que a operação de inserção de lote termine antes que ela atinja o tempo limite. timespan
(o padrão é 00:30:00 - 30 minutos)
Não writeBatchTimeout
Tamanho do lote de gravação Controla o tamanho dos documentos a serem gravados em cada lote. Você pode tentar aumentar esse valor para melhorar o desempenho e diminuir o valor se o tamanho do documento for grande. < o tamanho do lote de gravação >
(o padrão é 10.000)
Não writeBatchSize