Udostępnij za pośrednictwem


Inżynieria danych w usłudze Databricks

Usługa Databricks udostępnia bogaty zestaw funkcji inżynierii danych, które obejmują niezawodne środowisko współpracy między analitykami danych, inżynierami i analitykami. W środku znajdują się potoki, które pozyskują i przekształcają dane. Aby umożliwić łatwą inżynierię najbardziej wydajnych potoków, usługa Databricks oferuje tabele przesyłania strumieniowego ze strukturą i delta live. Zobacz Przesyłanie strumieniowe w usłudze Azure Databricks i Co to jest delta live tables?.

Aby zapoznać się z omówieniem, dlaczego przyrostowe przetwarzanie strumienia danych dostarczanych przez strukturę przesyłania strumieniowego i tabel delta live tables jest najlepszą opcją dla potoków danych, zobacz Dlaczego przetwarzanie strumieni przyrostowych?.

Dodatkowe zasoby inżynieryjne danych

Usługa Databricks udostępnia funkcje zadań inżynierii danych w wielu dodatkowych scenariuszach:

Uwaga

Jeśli pracujesz głównie z zapytaniami SQL i narzędziami analizy biznesowej, zobacz Databricks SQL.

Aby uzyskać samouczki wprowadzające i informacje wprowadzające, zobacz Rozpoczynanie pracy z usługą Azure Databricks i Co to jest usługa Azure Databricks?.

Nazwisko Użyj tej opcji, gdy chcesz...
Tabele na żywo delty Dowiedz się, jak tworzyć potoki danych na potrzeby pozyskiwania i przekształcania przy użyciu tabel delta live usługi Databricks.
Przesyłanie strumieniowe ze strukturą Dowiedz się więcej na temat przesyłania strumieniowego, przyrostowych i obciążeń w czasie rzeczywistym obsługiwanych przez przesyłanie strumieniowe ze strukturą w usłudze Databricks.