Partilhar via


Copiar do Armazenamento de Blobs do Azure para o Lakehouse

Neste tutorial, você cria um pipeline de dados para mover um arquivo CSV de uma pasta de entrada de uma fonte de Armazenamento de Blobs do Azure para um destino Lakehouse.

Pré-requisitos

Para começar, você deve preencher os seguintes pré-requisitos:

  • Verifique se você tem um espaço de trabalho habilitado para Project Microsoft Fabric: Criar um espaço de trabalho.

  • Selecione o botão Experimente agora! para preparar a fonte de dados do Armazenamento de Blobs do Azure da Cópia. Crie um novo grupo de recursos para este Armazenamento de Blobs do Azure e selecione Rever + Criar>Criar.

    Captura de ecrã do ecrã Detalhes do projeto.

    Em seguida, um Armazenamento de Blob do Azure é criado e moviesDB2.csv carregado na pasta de entrada do Armazenamento de Blob do Azure criado.

    Captura de tela mostrando onde o novo armazenamento aparece na pasta.

Criar um pipeline de dados

  1. Mude para Data factory na página app.powerbi.com.

  2. Crie um novo espaço de trabalho para esta demonstração.

    Captura de ecrã do ecrã Espaço de trabalho.

  3. Selecione Novo e, em seguida, selecione Pipeline de Dados.

    Captura de ecrã do menu Novo.

Copiar dados usando o Assistente de Cópia

Nesta sessão, você começa a criar um pipeline de dados usando as etapas a seguir. Estas etapas copiam um arquivo CSV de uma pasta de entrada de um Armazenamento de Blobs do Azure para um destino Lakehouse usando o assistente de cópia.

Passo 1: Comece com o assistente de cópia

  1. Selecione Copiar assistente de dados na tela para abrir a ferramenta assistente de cópia para começar. Ou selecione Usar assistente de cópia na lista suspensa Copiar dados na guia Atividades da faixa de opções.

    Captura de tela de duas opções para selecionar o assistente de cópia.

Etapa 2: Configurar a origem

  1. Digite blob no filtro de seleção, selecione Blobs do Azure e selecione Avançar.

    Captura de tela mostrando onde escolher o Armazenamento de Blobs do Azure como fonte de dados.

  2. Forneça o nome ou URL da sua conta e crie uma conexão com sua fonte de dados selecionando Criar nova conexão na lista suspensa Conexão.

    Captura de ecrã a mostrar onde selecionar Nova ligação.

    1. Depois de selecionar Criar nova conexão com sua conta de armazenamento especificada, você só precisa preencher Tipo de autenticação. Nesta demonstração, escolhemos a chave da conta, mas você pode escolher outro tipo de autenticação, dependendo da sua preferência.

      Captura de tela mostrando a tela Conectar à fonte de dados do assistente de cópia de dados.

    2. Depois que a conexão for criada com êxito, você só precisará selecionar Avançar para Conectar à fonte de dados.

  3. Escolha o arquivo moviesDB2.csv na configuração de origem para visualizar e selecione Avançar.

    Captura de tela mostrando como escolher a fonte de dados.

Etapa 3: Configurar seu destino

  1. Selecione Lakehouse.

    Captura de tela mostrando a caixa de diálogo Escolher destino de dados com Lakehouse selecionado.

  2. Forneça um nome para o novo Lakehouse. Em seguida, selecione Criar e conectar.

    Captura de tela mostrando a caixa de diálogo Escolher destino de dados com a nova opção lakehouse selecionada.

  3. Configure e mapeie os seus dados de origem para o seu destino; em seguida, selecione Avançar para concluir as configurações de destino.

    Captura de tela mostrando a caixa de diálogo Conectar ao destino dos dados no assistente de cópia de dados com o nome da tabela MoviesDB preenchido.

Etapa 4: revisar e criar sua atividade de cópia

  1. Revise as configurações de atividade de cópia nas etapas anteriores e selecione Salvar + executar para concluir. Ou você pode voltar às etapas anteriores para editar suas configurações, se necessário, na ferramenta.

    Captura de ecrã a mostrar o ecrã Rever + criar na caixa de diálogo Copiar assistente de dados.

  2. Depois de concluída, a atividade de cópia é adicionada à tela do pipeline de dados e executada diretamente se você deixar a caixa de seleção Iniciar transferência de dados imediatamente marcada.

    Captura de tela mostrando a atividade Copiar concluída.

Executar e agendar seu pipeline de dados

  1. Se não tiver deixado a caixa de verificação Iniciar transferência de dados imediatamente na página Rever + criar , mude para o separador Base e selecione Executar. Em seguida, selecione Salvar e executar.

    Captura de ecrã a mostrar o botão Executar da atividade Copiar no separador Base.

    Captura de tela mostrando a caixa de diálogo Salvar e executar para a atividade Copiar.

  2. Na guia Saída, selecione o link com o nome da sua atividade Copiar para monitorar o progresso e verificar os resultados da execução.

    Captura de tela mostrando o botão Detalhes da execução.

  3. A caixa de diálogo Copiar detalhes de dados exibe os resultados da execução, incluindo status, volume de dados lidos e gravados, horários de início e parada e duração.

    Captura de tela mostrando a caixa de diálogo Copiar detalhes de dados.

  4. Você também pode agendar o pipeline para ser executado com uma frequência específica, conforme necessário. O exemplo a seguir mostra como agendar o pipeline para ser executado a cada 15 minutos.

    Captura de tela mostrando a caixa de diálogo de configuração de agendamento.

    Captura de tela mostrando um pipeline com uma programação configurada para ser executado a cada 15 minutos.

O pipeline neste exemplo mostra como copiar dados do Armazenamento de Blobs do Azure para o Lakehouse. Aprendeu a:

  • Crie um pipeline de dados.
  • Copie dados com o Assistente de cópia.
  • Execute e agende seu pipeline de dados.

Em seguida, avance para saber mais sobre como monitorar suas execuções de pipeline.