Compartilhar via


Carregar na tabela do Delta Lake

O Lakehouse no Microsoft Fabric fornece um recurso para carregar com eficiência os tipos de arquivos comuns em uma tabela Delta otimizada pronta para análise. O recurso Carregar na Tabela permite que os usuários carreguem um único arquivo ou uma pasta de arquivos em uma tabela. Esse recurso aumenta a produtividade dos engenheiros de dados, permitindo que eles usem rapidamente uma ação de clique com o botão direito do mouse para habilitar o carregamento de tabela em arquivos e pastas. Carregar na tabela também é uma experiência sem código, que reduz a barra de entrada para todas as personas.

Visão geral dos recursos de Carregamento na Tabela

Aqui está uma lista de recursos que habilitamos na experiência de Carregar na Tabela integrada para fornecer flexibilidade aos nossos usuários, aumentando sua produtividade:

  • Tipos de arquivo com suporte: atualmente, esse recurso só dá suporte ao carregamento de tipos de arquivo PARQUET ou CSV. O caso de extensão de arquivo não importa.

  • Carga de arquivo único: os usuários podem carregar um único arquivo de sua escolha em um dos formatos com suporte selecionando "Carregar na Tabela Delta" na ação de menu de contexto do arquivo.

  • Carga no nível da pasta: você pode carregar todos os arquivos em uma pasta e suas subpastas ao mesmo tempo selecionando "Carregar na Tabela Delta" depois de clicar em uma pasta. Esse recurso percorre automaticamente todos os arquivos e os carrega em uma Tabela Delta. É importante observar que somente arquivos do mesmo tipo podem ser carregados ao mesmo tempo em uma tabela.

  • Carregar para uma tabela nova e existente: o usuário pode optar por carregar seus arquivos e pastas em uma nova tabela ou em uma tabela existente à sua escolha. Se decidirem carregar em uma tabela existente, eles podem acrescentar ou substituir os dados na tabela.

  • Opção de arquivo de origem CSV: para arquivos CSV, permitimos que o usuário especifique se o arquivo de origem inclui cabeçalhos que deseja usar como nomes de coluna. Os usuários também podem especificar um separador de sua escolha para substituir o separador de vírgula padrão em vigor.

  • Carregadas como Tabelas Delta: as tabelas são sempre carregadas usando o formato de tabela Delta Lake com a otimização de V-Order habilitada.

    Gif da pasta de carregamento geral para a experiência da tabela.

Observação

Atualmente, você não pode especificar o esquema de tabela por meio da interface do usuário do Lakehouse; é necessário usar um notebook para essa finalidade.

Diretrizes e regras de validação

O seguinte padrão se aplica à experiência Carregar na tabela:

  • O nome pode conter somente caracteres alfanuméricos e sublinhados. Ela também permite qualquer letra em inglês, maiúsculas ou minúsculas e sublinhado (_), com um comprimento máximo de 256 caracteres. Não permitidos traço (-) ou caracteres de espaço.

  • Os arquivos de texto sem cabeçalhos de coluna são substituídos pela notação padrão col# como os nomes das colunas de tabela.

  • Os nomes de coluna permitem qualquer letra em inglês, maiúscula ou minúscula, sublinhado (_) e caracteres em outro idioma, como chinês em UTF, tamanho de até 128 caracteres. Os nomes de coluna são validados durante a ação de carregamento. O algoritmo Carregar no Delta substitui os valores proibidos pela barra inferior (_). Se nenhum nome de coluna apropriado for obtido durante a validação, a ação de carga falhará.

  • Para arquivos CSV, o separador não pode estar vazio, ter mais de 8 caracteres nem usar qualquer um dos seguintes caracteres: (, ), [, ],{, }, aspas simples ('), aspas duplas (") e espaço em branco.