Udostępnij za pośrednictwem


Pozyskiwanie danych do magazynu lakehouse usługi Databricks

Usługa Azure Databricks oferuje różne sposoby pozyskiwania danych z różnych źródeł do magazynu lakehouse wspieranego przez usługę Delta Lake. W tym artykule wymieniono źródła danych i podano linki do kroków pozyskiwania danych z każdego typu źródła.

Magazyn obiektów w chmurze

Aby dowiedzieć się, jak skonfigurować pozyskiwanie przyrostowe z magazynu obiektów w chmurze, zobacz Pozyskiwanie danych z magazynu obiektów w chmurze.

LakeFlow Connect

Usługa Databricks LakeFlow Connect oferuje natywne łączniki do pozyskiwania z aplikacji i baz danych dla przedsiębiorstw. Wynikowy pipeline przyjmowania danych jest zarządzany przez Unity Catalog i korzysta z bezserwerowych obliczeń oraz Delta Live Tables.

Usługa LakeFlow Connect wykorzystuje wydajne operacje odczytu przyrostowego i zapisu w celu szybszego pozyskiwania danych, bardziej skalowalnego i bardziej ekonomicznego, podczas gdy dane pozostają świeże do użycia podrzędnego.

Źródła przesyłania strumieniowego

Usługa Azure Databricks może integrować się z usługami przesyłania komunikatów strumieniowych na potrzeby pozyskiwania danych niemal w czasie rzeczywistym w usłudze Lakehouse. Zobacz Przesyłanie strumieniowe i pozyskiwanie przyrostowe.

Pliki danych lokalnych

Możesz bezpiecznie przekazać pliki danych lokalnych lub pobrać pliki z publicznego adresu URL. Zobacz Przekazywanie plików do usługi Azure Databricks.

Migrowanie danych do usługi Delta Lake

Aby dowiedzieć się, jak migrować istniejące dane do usługi Delta Lake, zobacz Migrowanie danych do usługi Delta Lake.