Identyfikowanie obciążeń usługi Azure Databricks

Ukończone

Usługa Azure Databricks oferuje możliwości dla różnych obciążeń, w tym uczenia maszynowego i dużych modeli językowych (LLM), Nauka o danych, inżynierowie danych, analizy biznesowej i Magazyn danych oraz przetwarzania strumieniowego.

Inżynieria danych

Usługa Azure Databricks zapewnia możliwości analitykom danych i inżynierom, którzy muszą współpracować nad złożonymi zadaniami przetwarzania danych. Zapewnia zintegrowane środowisko z platformą Apache Spark na potrzeby przetwarzania danych big data w usłudze Data Lakehouse i obsługuje wiele języków, w tym Python, R, Scala i SQL. Platforma ułatwia eksplorację danych, wizualizację i opracowywanie potoków danych.

Diagram przedstawiający ekran pozyskiwania danych i źródeł danych usługi Databricks.

Usługa Machine Learning

Usługa Azure Databricks obsługuje tworzenie, trenowanie i wdrażanie modeli uczenia maszynowego na dużą skalę. Obejmuje ona platformę MLflow, platformę typu open source do zarządzania cyklem życia uczenia maszynowego, w tym eksperymentowanie, powtarzalność i wdrażanie. Obsługuje również różne struktury uczenia maszynowego, takie jak TensorFlow, PyTorch i Scikit-learn, dzięki czemu jest wszechstronny dla różnych zadań uczenia maszynowego.

Diagram ekranu usługi Databricks Machine Learning.

SQL

Analitycy danych, którzy korzystają głównie z danych za pośrednictwem usługi SQL, mogą używać magazynów SQL w usłudze Azure Databricks. Portal usługi Azure Databricks udostępnia znany edytor SQL, pulpity nawigacyjne i narzędzia do automatycznej wizualizacji do analizowania i wizualizowania danych bezpośrednio w usłudze Azure Databricks. To obciążenie jest idealne do uruchamiania szybkich zapytań ad hoc i tworzenia raportów z dużych zestawów danych.

Diagram ekranu edytora DatabricksSQL.