Conectar a fontes de dados do Azure Databricks
Este artigo fornece links para todas as diferentes fontes de dados no Azure que podem ser conectadas ao Azure Databricks. Siga os exemplos nesses links para extrair dados das fontes de dados do Azure (por exemplo, Armazenamento de Blobs, Hubs de Eventos do Azure e etc.) em um cluster do Azure Databricks e executar trabalhos analíticos neles.
Pré-requisitos
- É necessário ter um workspace do Azure Databricks e um cluster do Spark. Siga as instruções em Introdução.
Fontes de dados para Azure Databricks
A lista a seguir fornece as fontes de dados no Azure que podem ser utilizadas com Azure Databricks. Para obter uma lista completa de fontes de dados que podem ser utilizadas com Azure Databricks, consulte Fontes de dados para Azure Databricks.
-
Esse link fornece a API de DataFrame para conexão com bancos de dados SQL usando JDBC e como controlar o paralelismo de leituras por meio da interface JDBC. Este tópico fornece exemplos detalhados usando a API do Scala, com exemplos abreviados de Python e Spark SQL no final.
Armazenamento do Azure Data Lake
Esse link fornece exemplos sobre como usar a entidade de serviço do Microsoft Entra ID (antigo Azure Active Directory) para autenticação junto ao Azure Data Lake Storage. Ele também fornece instruções sobre como acessar os dados no Azure Data Lake Storage no Azure Databricks.
Armazenamento de Blobs do Azure
Esse link fornece exemplos de como acessar diretamente o Armazenamento de Blobs a partir do Azure Databricks usando a chave de acesso ou a SAS para um determinado contêiner. O link também fornece informações sobre como acessar o Armazenamento de Blobs a partir do Azure Databricks usando a API de RDD.
-
Este link fornece instruções sobre como usar o conector Kafka do Azure Databricks para acessar dados nos Hubs de Eventos do Azure.
-
Este link fornece instruções sobre como consultar dados no Azure Synapse.
Próximas etapas
Para saber mais sobre fontes, a partir das quais é possível importar dados para o Azure Databricks, consulte Fontes de dados para Azure Databricks.