Partilhar via


Combinar arquivos CSV

No Power Query, pode combinar vários ficheiros de uma determinada origem de dados. Este artigo descreve como a experiência funciona quando os arquivos que você deseja combinar são arquivos CSV. Para obter mais informações: Visão geral de combinar ficheiros

Dica

Pode seguir este exemplo baixando os arquivos de exemplo usados neste artigo a partir de este link de download. Você pode colocar esses arquivos na fonte de dados de sua escolha, como uma pasta local, pasta do SharePoint, armazenamento de Blob do Azure, Armazenamento do Azure Data Lake ou outra fonte de dados que forneça a exibição do sistema de arquivos.

Para simplificar, o exemplo neste artigo usa o conector de pasta. Para obter mais informações: Folder

Sobre os arquivos de exemplo usados

Para combinar arquivos, é imperativo que todos tenham a mesma estrutura e a mesma extensão. Todos os arquivos usados neste exemplo têm a mesma estrutura e extensão (.csv).

Existem 12 ficheiros CSV, um para cada mês do ano civil de 2019. A imagem a seguir mostra as primeiras 15 linhas do arquivo para o mês de janeiro.

Captura de tela do arquivo CSV de exemplo de janeiro de 2019 mostrando a seção de cabeçalho e o restante dos dados, todos separados por vírgulas.

O número de linhas varia de arquivo para arquivo, mas todos os arquivos têm uma seção de cabeçalho nas quatro primeiras linhas. Eles têm cabeçalhos de coluna na quinta linha, e os dados da tabela começam na sexta linha e continuam por todas as linhas subsequentes.

O objetivo é combinar todos os 12 arquivos em uma única tabela. Esta tabela combinada contém a linha de cabeçalho na parte superior da tabela e inclui o nome da fonte, data, país, unidades e dados de receita para todo o ano em colunas separadas após a linha de cabeçalho.

Captura de tela da tabela combinada final de exemplo.

Pré-visualização da tabela

Ao conectar-se à pasta que hospeda os arquivos que você deseja combinar — neste exemplo, o nome dessa pasta é Arquivos CSV—, é exibida a caixa de diálogo de visualização da tabela, que exibe o caminho da pasta no canto superior esquerdo. A pré-visualização mostra a vista do sistema de ficheiros.

Captura de ecrã da pré-visualização da tabela para a vista do sistema de ficheiros.

Para este exemplo, selecione Combinar. Para Excel ou Power Query Desktop, selecione Combinar & Transformar Dados.

Observação

Em uma situação diferente, você pode selecionar Transformar dados para filtrar e transformar ainda mais seus dados antes de combinar os arquivos. Selecionar Combinar só é recomendado quando tiver certeza de que a pasta contém apenas os arquivos que você deseja combinar.

Caixa de diálogo Combinar arquivos

Depois de selecionar Combinar na visualização da tabela, a caixa de diálogo Combinar arquivos é exibida.

Captura de ecrã da caixa de diálogo Combinar ficheiros com os dados do ficheiro apresentados.

Observação

O Power Query deteta automaticamente o conector a utilizar com base no primeiro ficheiro encontrado na lista. Para saber mais sobre o conector CSV, consulte Texto/CSV.

Neste exemplo, mantenha todas as configurações padrão (Arquivo de exemplo definidas como Primeiro arquivo, e os valores padrão para Origem do arquivo, Delimitador, e Deteção de tipo de dados).

Agora, selecione Transformar dados no canto inferior direito para ir para a consulta de saída.

Consulta de resultados

Depois de selecionar Transformar dados na caixa de diálogo Combinar ficheiros, será reencaminhado para o Editor do Power Query na consulta que criou inicialmente a partir da conexão à pasta local. A consulta de saída agora contém o nome do arquivo de origem na coluna mais à esquerda, juntamente com os dados de cada um dos arquivos de origem nas colunas restantes.

Captura de tela da consulta de saída para arquivos combinados sem transformações adicionais.

No entanto, os dados não estão na forma correta. Você precisa remover as quatro linhas superiores de cada arquivo antes de combiná-las. Para fazer esta alteração em cada ficheiro antes de os combinar, selecione a consulta do ficheiro de exemplo de transformação no painel de Consultas no lado esquerdo da sua tela.

Modificar a consulta de arquivo Transform Sample

Nesta consulta arquivo de exemplo de transformação, os valores na coluna Data indicam que os dados são referentes ao mês de abril, que tem o formato ano-mês-dia (AAAA-MM-DD). 2019.csv de abril é o primeiro ficheiro exibido na pré-visualização da tabela.

Captura de tela do arquivo de exemplo de transformação com as colunas de dados de abril de 2019 e a seção de cabeçalho.

Agora você precisa aplicar um novo conjunto de transformações para limpar os dados. Cada transformação é automaticamente convertida em uma função dentro do grupo de consultas Helper, que é aplicada a cada ficheiro na pasta antes de os combinar.

As transformações que precisam ser adicionadas à consulta no ficheiro Transform Sample são:

  1. Remover linhas superiores: Para executar esta operação, selecione o menu de ícones da tabela no canto superior esquerdo da tabela e, em seguida, selecione Remover linhas superiores.

    Captura de tela do menu de ícones da tabela com Remover linhas superiores enfatizado.

    Na caixa de diálogo Remover linhas superiores, digite 4e selecione OK.

    Captura de ecrã da caixa de diálogo Remover linhas superiores com quatro linhas a remover.

    Depois de selecionar OK, a tabela não tem mais as quatro primeiras linhas.

    Captura de ecrã da consulta Exemplo com as quatro linhas superiores removidas.

  2. Usar a primeira linha como cabeçalhos: Selecione o ícone da tabela novamente e depois selecione Usar a primeira linha como cabeçalhos.

    Captura de tela do menu de ícones da tabela com a opção Usar primeira linha como cabeçalhos enfatizada.

    O resultado dessa operação promove a primeira linha da tabela para os novos cabeçalhos de coluna.

    Captura de tela da tabela de exemplo com os cabeçalhos promovidos.

Após a conclusão desta operação, o Power Query tenta, por predefinição, detetar automaticamente os tipos de dados das colunas e adicionar um novo tipo de coluna Alterado passo.

Revisão da consulta de saída

Quando regressa à consulta Ficheiros CSV no Power Query Desktop, o último passo é apresentar-lhe um erro que diz "A coluna 'Coluna1' da tabela não foi encontrada". Quando regressa à consulta Ficheiros CSV no Power Query Online, as alterações efetuadas anteriormente para remover as primeiras quatro linhas e utilizar a primeira linha como cabeçalhos não são aplicadas à tabela. No Power Query Online, selecione Atualizar no separador Base. Depois de o ecrã ser atualizado, a mesma mensagem de erro é exibida.

A razão por trás deste erro é que o estado anterior da query estava realizando uma operação numa coluna chamada Column1. Mas, devido às alterações feitas na consulta do arquivo Transform Sample, essa coluna não existe mais. Para obter mais informações: Lidando com erros no Power Query

Captura de tela da consulta Saída com o erro de nível de etapa.

Você pode remover esta última etapa da consulta do painel Etapas aplicadas selecionando o ícone X delete no lado esquerdo do nome da etapa. Depois de excluir esta etapa, sua consulta mostra os resultados corretos.

Captura de tela dos arquivos combinados sem a etapa de erro.

No entanto, observe que nenhuma das colunas derivadas dos arquivos (Data, País, Unidades, Receita) tem um tipo de dados específico atribuído a elas. Atribua o tipo de dados correto a cada coluna usando a tabela a seguir.

Nome da coluna Tipo de dados
Data Data
País Texto
Unidades Número inteiro
Receitas Moeda

Depois de definir os tipos de dados para cada coluna, você estará pronto para carregar a tabela.

Captura de ecrã da tabela final da amostra combinada.

Observação

Para saber como definir ou alterar tipos de dados de coluna, vá para Tipos de dados.

Verificação

Para validar que todos os arquivos estão combinados, você pode selecionar o ícone de filtro no título da coluna Source.Name, que exibe todos os nomes dos arquivos combinados. Se receber o aviso "A lista pode estar incompleta", selecione Carregar mais na parte inferior do menu para exibir mais valores disponíveis na coluna.

Captura de tela da caixa de diálogo de filtro com uma lista incompleta dos arquivos combinados.

Depois de selecionar Carregar mais, todos os nomes de arquivo disponíveis são exibidos.

Captura de tela da caixa de diálogo de filtro com a lista completa dos arquivos combinados.