Partilhar via


Tutorial: Ingerir dados num armazém de dados

Aplica-se a:✅ Armazém no Microsoft Fabric

Neste tutorial, saiba como ingerir dados do Armazenamento do Microsoft Azure em um Depósito para criar tabelas.

Observação

Este tutorial faz parte de um cenário completo . Para concluir este tutorial, você deve primeiro concluir estes tutoriais:

  1. Criar um espaço de trabalho
  2. Criar um Armazém

Ingerir dados

Nesta tarefa, saiba como ingerir dados no armazém para criar tabelas.

  1. Verifique se o espaço de trabalho criado no primeiro tutorial está aberto.

  2. No painel inicial do espaço de trabalho, selecione + Novo Item para exibir a lista completa de tipos de itens disponíveis.

  3. Na lista, na secção Obter dados, selecione o item do tipo Pipeline de dados.

  4. Na janela Novo pipeline, na caixa Nome, introduza Load Customer Data.

    Captura de tela da caixa de diálogo Novo pipeline, realçando o nome inserido.

  5. Para provisionar o pipeline, selecione Criar. O provisionamento é concluído quando a página de entrada Criar um pipeline de dados é exibida.

  6. Na página de destino do pipeline de dados, selecione Atividade do pipeline.

    Captura de tela da página inicial Criar um pipeline de dados, destacando a opção Atividade do pipeline.

  7. No menu, de dentro da seção Mover e transformar, selecione Copiar dados.

    Captura de tela da seção Mover e transformar, mostrando onde selecionar Copiar dados.

  8. Na canvas de design do pipeline, selecione a atividade Copiar dados.

    Captura de ecrã da cópia de dados localizada no ecrã de design.

  9. Para configurar a atividade, na página Geral, na caixa Nome, substitua o texto padrão por CD Load dimension_customer.

    Captura de ecrã do separador Geral, mostrando onde introduzir o nome da atividade de cópia.

  10. Na página de origem, na lista suspensa de conexão, selecione Mais para revelar todas as fontes de dados que pode escolher, incluindo as que estão no catálogo do OneLake.

  11. Selecione + Novo para criar uma nova fonte de dados.

  12. Procure e selecione Blobs do Azure.

  13. Na página da fonte de dados do Connect, na caixa Nome da conta ou URL, digite .

  14. Observe que a lista suspensa de Nomes de Conexão é preenchida automaticamente e que o método de autenticação está definido para Anónimo.

    Captura de tela da janela Conectar à fonte de dados mostrando todas as configurações feitas.

  15. Selecione Ligar.

  16. Na página de origem, para aceder aos ficheiros Parquet na fonte de dados, efetue as seguintes configurações.

    1. Nas caixas Caminho do arquivo, digite:

      1. Caminho do arquivo - Contêiner:sampledata

      2. Caminho do arquivo - Diretório:WideWorldImportersDW/tables

      3. Caminho do arquivo - Nome do arquivo:dimension_customer.parquet

    2. Na lista suspensa Formato de arquivo , selecione Parquet.

  17. Para visualizar os dados e testar se não há erros, selecione Visualizar dados.

    Captura de tela da página Origem, destacando as alterações feitas nas etapas anteriores e a função Visualizar dados.

  18. Na página de Destino, na lista suspensa de Conexão , selecione o armazém Wide World Importers.

  19. Para a opção Tabela, selecione a opção de criação automática de tabela .

  20. Na primeira caixa da Tabela , digite dbo.

  21. Na segunda caixa, digite dimension_customer.

    Captura de tela da página de Destino, destacando a localização das alterações feitas nas etapas anteriores.

  22. No friso da faixa de opções Início, selecione Executar.

  23. Na caixa de diálogo Salvar e executar?, selecione Salvar e executar para que o pipeline carregue a tabela dimension_customer.

    Captura de ecrã da caixa de diálogo Guardar e executar, realçando o botão Guardar e executar.

  24. Para monitorizar o progresso da atividade de cópia, reveja as atividades de execução do pipeline na página de saída (aguarde até que o estado seja concluído com sucesso).

    Captura de tela da página Saída, destacando o status Bem-sucedido.

Próximo passo