Eksplorowanie i przekształcanie danych w lakehouse

Ukończone

Przekształcanie i ładowanie danych

Większość danych wymaga przekształceń przed załadowaniem do tabel. Możesz pozyskiwać nieprzetworzone dane bezpośrednio w lakehouse, a następnie przekształcać i ładować je do tabel. Niezależnie od projektu ETL można przekształcać i ładować dane, używając tych samych narzędzi do pozyskiwania danych. Przekształcone dane można następnie załadować jako plik lub tabelę delty.

  • Notesy są preferowane przez inżynierów danych zaznajomionych z różnymi językami programowania, w tym PySpark, SQL i Scala.
  • Przepływy danych Gen2 doskonale nadają się deweloperom zaznajomieni z usługą Power BI lub programem Excel, ponieważ korzystają z interfejsu usługi PowerQuery.
  • Potoki zapewniają interfejs wizualny do wykonywania i organizowania procesów ETL. Potoki mogą być tak proste, jak i tak złożone, jak potrzebujesz.

Analizowanie i wizualizowanie danych w usłudze Lakehouse

Gdy dane są pozyskiwane, przekształcane i ładowane, są gotowe do użycia przez inne osoby. Elementy sieci szkieletowej zapewniają elastyczność potrzebną dla każdej organizacji, dzięki czemu można używać narzędzi, które działają dla Ciebie.

  • Analitycy danych mogą używać notesów lub wrangler danych do eksplorowania i trenowania modeli uczenia maszynowego na potrzeby sztucznej inteligencji.
  • Deweloperzy raportów mogą używać modelu semantycznego do tworzenia raportów usługi Power BI.
  • Analitycy mogą używać punktu końcowego analizy SQL do wykonywania zapytań, filtrowania, agregowania i eksplorowania danych w tabelach lakehouse.

Łącząc możliwości wizualizacji danych usługi Power BI ze scentralizowanym magazynem i schematem tabelarycznym magazynu typu data lakehouse, można zaimplementować kompleksowe rozwiązanie analityczne na jednej platformie.