Eksplorowanie i przekształcanie danych w lakehouse
Przekształcanie i ładowanie danych
Większość danych wymaga przekształceń przed załadowaniem do tabel. Możesz pozyskiwać nieprzetworzone dane bezpośrednio w lakehouse, a następnie przekształcać i ładować je do tabel. Niezależnie od projektu ETL można przekształcać i ładować dane, używając tych samych narzędzi do pozyskiwania danych. Przekształcone dane można następnie załadować jako plik lub tabelę delty.
- Notesy są preferowane przez inżynierów danych zaznajomionych z różnymi językami programowania, w tym PySpark, SQL i Scala.
- Przepływy danych Gen2 doskonale nadają się deweloperom zaznajomieni z usługą Power BI lub programem Excel, ponieważ korzystają z interfejsu usługi PowerQuery.
- Potoki zapewniają interfejs wizualny do wykonywania i organizowania procesów ETL. Potoki mogą być tak proste, jak i tak złożone, jak potrzebujesz.
Analizowanie i wizualizowanie danych w usłudze Lakehouse
Gdy dane są pozyskiwane, przekształcane i ładowane, są gotowe do użycia przez inne osoby. Elementy sieci szkieletowej zapewniają elastyczność potrzebną dla każdej organizacji, dzięki czemu można używać narzędzi, które działają dla Ciebie.
- Analitycy danych mogą używać notesów lub wrangler danych do eksplorowania i trenowania modeli uczenia maszynowego na potrzeby sztucznej inteligencji.
- Deweloperzy raportów mogą używać modelu semantycznego do tworzenia raportów usługi Power BI.
- Analitycy mogą używać punktu końcowego analizy SQL do wykonywania zapytań, filtrowania, agregowania i eksplorowania danych w tabelach lakehouse.
Łącząc możliwości wizualizacji danych usługi Power BI ze scentralizowanym magazynem i schematem tabelarycznym magazynu typu data lakehouse, można zaimplementować kompleksowe rozwiązanie analityczne na jednej platformie.