Partilhar via


Ingerir dados em uma casa de lago Databricks

O Azure Databricks oferece várias maneiras de ingerir dados de várias fontes em uma casa de lago apoiada pelo Delta Lake. Este artigo lista fontes de dados e fornece links para etapas para a ingestão de dados de cada tipo de fonte.

Armazenamento de objetos na cloud

Para saber mais sobre como configurar a ingestão incremental a partir do armazenamento de objetos na nuvem, consulte Ingerir dados do armazenamento de objetos na nuvem.

Conexão LakeFlow

O Databricks LakeFlow Connect oferece conectores nativos para ingestão de aplicativos corporativos e bancos de dados. O pipeline de ingestão resultante é governado pelo Unity Catalog e é alimentado por computação sem servidor e Delta Live Tables.

O LakeFlow Connect aproveita leituras e gravações incrementais eficientes para tornar a ingestão de dados mais rápida, escalável e econômica, enquanto seus dados permanecem atualizados para consumo downstream.

Fontes de streaming

O Azure Databricks pode integrar-se com serviços de mensagens de fluxo para ingestão de dados quase em tempo real em uma casa de lago. Consulte Streaming e ingestão incremental.

Arquivos de dados locais

Você pode carregar arquivos de dados locais com segurança ou baixar arquivos de uma URL pública. Consulte Carregar ficheiros para o Azure Databricks.

Migrar dados para o Delta Lake

Para saber como migrar dados existentes para o Delta Lake, consulte Migrar dados para o Delta Lake.