Utforska och transformera data i ett sjöhus

Slutförd

Transformera och läsa in data

De flesta data kräver transformeringar innan de läses in i tabeller. Du kan mata in rådata direkt i ett sjöhus och sedan transformera och läsa in dem ytterligare i tabeller. Oavsett din ETL-design kan du transformera och läsa in data med samma verktyg för att mata in data. Transformerade data kan sedan läsas in som en fil eller en Delta-tabell.

  • Notebook-filer gynnas av datatekniker som är bekanta med olika programmeringsspråk, inklusive PySpark, SQL och Scala.
  • Dataflöden Gen2 är utmärkta för utvecklare som är bekanta med Power BI eller Excel eftersom de använder PowerQuery-gränssnittet.
  • Pipelines tillhandahåller ett visuellt gränssnitt för att utföra och samordna ETL-processer. Pipelines kan vara så enkla eller komplexa som du behöver.

Analysera och visualisera data i ett sjöhus

När data matas in, transformeras och läses in är de redo för andra att använda dem. Infrastrukturobjekt ger den flexibilitet som krävs för varje organisation så att du kan använda de verktyg som fungerar åt dig.

  • Dataforskare kan använda notebook-filer eller Data wrangler för att utforska och träna maskininlärningsmodeller för AI.
  • Rapportutvecklare kan använda semantikmodellen för att skapa Power BI-rapporter.
  • Analytiker kan använda SQL-analysslutpunkten för att fråga, filtrera, aggregera och på annat sätt utforska data i Lakehouse-tabeller.

Genom att kombinera funktionerna för datavisualisering i Power BI med det centraliserade lagrings- och tabellschemat för ett datasjöhus kan du implementera en analyslösning från slutpunkt till slutpunkt på en enda plattform.