Usar a atividade Copiar dados

Concluído

A atividade Copiar dados é um dos usos mais comuns de um pipeline de dados. Muitos pipelines consistem em uma única atividade de cópia de dados que é usada para ingerir dados de uma fonte externa em um arquivo ou tabela lakehouse.

Você também pode combinar a atividade Copiar dados com outras atividades para criar um processo de ingestão de dados repetível - por exemplo, usando uma atividade Excluir dados para remover dados existentes, uma atividade Copiar dados para substituir os dados excluídos por um arquivo contendo dados de uma fonte externa e uma atividade do Bloco de Anotações para executar o código Spark que transforma os dados no arquivo e os carrega em uma tabela.

A ferramenta Copiar dados

Captura de ecrã da ferramenta Copiar Dados no Microsoft Fabric.

Quando você adiciona uma atividade Copiar Dados a um pipeline, uma ferramenta gráfica o conduz pelas etapas necessárias para configurar a fonte de dados e o destino para a operação de cópia. Uma ampla gama de conexões de origem é suportada, tornando possível a ingestão de dados das fontes mais comuns. No OneLake, isso inclui suporte para lakehouse, warehouse, Banco de dados SQL e outros.

Captura de ecrã da ferramenta Copiar Dados a mostrar o suporte da Base de Dados SQL no Microsoft Fabric.

Copiar configurações de atividade de dados

Depois de adicionar uma atividade Copiar Dados a um pipeline, você pode selecioná-la na tela do pipeline e editar suas configurações no painel abaixo.

Captura de ecrã de uma atividade Copiar Dados no Microsoft Fabric.

Quando usar a atividade Copiar dados

Use a atividade Copiar dados quando precisar copiar dados diretamente entre uma origem e um destino suportados sem aplicar transformações, ou quando quiser importar os dados brutos e aplicar transformações em atividades de pipeline posteriores.

Se você precisar aplicar transformações aos dados à medida que são ingeridos ou mesclar dados de várias fontes, considere usar uma atividade de Fluxo de Dados para executar um fluxo de dados (Gen2). Pode utilizar a interface de utilizador do Power Query para definir um fluxo de dados (Gen2) que inclua vários passos de transformação e incluí-lo num pipeline.

Gorjeta

Para saber mais sobre o Dataflow (Gen2) no Microsoft Fabric para ingerir dados, considere preencher o módulo Ingest Data with Dataflows Gen2 no Microsoft Fabric .