Nawiązywanie połączenia ze źródłami danych z usługi Azure Databricks
Ten artykuł zawiera linki do wszystkich różnych źródeł danych na platformie Azure, które można połączyć z usługą Azure Databricks. Postępuj zgodnie z przykładami podanymi w tych linkach, aby wyodrębnić dane ze źródeł danych platformy Azure (na przykład Azure Blob Storage, Azure Event Hubs itp.) do klastra usługi Azure Databricks i uruchamiać na nich zadania analityczne.
Wymagania wstępne
- Musisz mieć obszar roboczy usługi Azure Databricks i klaster Spark. Postępuj zgodnie z instrukcjami w Get, aby uruchomić.
Źródła danych dla usługi Azure Databricks
Poniższe list udostępnia źródła danych na platformie Azure, których można używać z usługą Azure Databricks. Aby uzyskać pełną listę list źródeł danych, których można używać z Azure Databricks, zobacz Źródła danych dla Azure Databricks.
-
Ten link udostępnia interfejs API ramki danych do nawiązywania połączenia z bazami danych SQL przy użyciu protokołu JDBC oraz sposobu kontrolowania równoległości odczytów za pośrednictwem interfejsu JDBC. Ten temat zawiera szczegółowe przykłady użycia interfejsu API języka Scala ze skróconymi przykładami języka Python i spark SQL na końcu.
-
Ten link zawiera przykłady użycia jednostki usługi Microsoft Entra ID (dawniej Azure Active Directory) do uwierzytelniania w usłudze Azure Data Lake Storage. Zawiera również instrukcje dotyczące uzyskiwania dostępu do danych w usłudze Azure Data Lake Storage z usługi Azure Databricks.
-
Ten link zawiera przykłady dotyczące bezpośredniego uzyskiwania dostępu do usługi Azure Blob Storage z usługi Azure Databricks przy użyciu klucza dostępu lub sygnatury dostępu współdzielonego dla danego kontenera. Link zawiera również informacje na temat uzyskiwania dostępu do usługi Azure Blob Storage z usługi Azure Databricks przy użyciu interfejsu API RDD.
-
Ten link zawiera instrukcje dotyczące używania łącznika platformy Kafka z usługi Azure Databricks do uzyskiwania dostępu do danych w usłudze Azure Event Hubs.
-
Ten link zawiera instrukcje dotyczące wykonywania zapytań dotyczących danych w usłudze Azure Synapse.
Następne kroki
Aby dowiedzieć się więcej o źródłach z where, można zaimportować dane do Azure Databricks. Zobacz Źródła danych dla Azure Databricks.