Inżynieria danych w usłudze Databricks
Usługa Databricks udostępnia bogaty zestaw funkcji inżynierii danych, które obejmują niezawodne środowisko współpracy między analitykami danych, inżynierami i analitykami. W środku znajdują się potoki, które pozyskują i przekształcają dane. Aby ułatwić projektowanie najbardziej wydajnych potoków, usługa Databricks oferuje Strukturalne przesyłanie strumieniowe i Delta Live Tables. Zobacz Streaming w usłudze Azure Databricks i Co to są Delta Live Tables?.
Aby zapoznać się z omówieniem, dlaczego przyrostowe przetwarzanie strumieniowe danych zapewniane przez Structured Streaming i Delta Live Tables jest najlepszą opcją dla potoków danych, zobacz Dlaczego przetwarzanie strumieni przyrostowych?.
Dodatkowe zasoby inżynieryjne danych
Usługa Databricks udostępnia funkcje zadań inżynierii danych w wielu dodatkowych scenariuszach:
- Notesy usługi Databricks to popularne narzędzie do współpracy.
- Planowanie i organizowanie przepływów pracy przy użyciu zadań usługi Databricks.
- Zobacz Sztuczna inteligencja mozaiki usługi Databricks, jeśli tworzysz rozwiązania do uczenia maszynowego.
Uwaga
Jeśli pracujesz głównie z zapytaniami SQL i narzędziami analizy biznesowej, zobacz Databricks SQL.
Aby uzyskać samouczki wprowadzające i informacje wprowadzające, zobacz Rozpoczynanie pracy z usługą Azure Databricks i Co to jest usługa Azure Databricks?.
Nazwisko | Użyj tej opcji, gdy chcesz... |
---|---|
Delta Live Tables | Dowiedz się, jak tworzyć potoki danych dla pozyskiwania i przekształcania przy użyciu Databricks Delta Live Tables. |
Przesyłanie strumieniowe ze strukturą | Dowiedz się więcej na temat przesyłania strumieniowego, przyrostowych i obciążeń w czasie rzeczywistym obsługiwanych przez przesyłanie strumieniowe ze strukturą w usłudze Databricks. |