Co je to lakehouse v Microsoft Fabric?
Microsoft Fabric Lakehouse je platforma architektury dat pro ukládání, správu a analýzu strukturovaných a nestrukturovaných dat v jednom umístění. Jedná se o flexibilní a škálovatelné řešení, které organizacím umožňuje zpracovávat velké objemy dat pomocí různých nástrojů a architektur pro zpracování a analýzu těchto dat. Integruje se s dalšími nástroji pro správu a analýzu dat a poskytuje komplexní řešení pro přípravu a analýzu dat. Lakehouse kombinuje škálovatelnost datového jezera s výkonem a strukturou datového skladu a poskytuje jednotnou platformu pro ukládání dat, správu a analýzu.
Koncový bod analýzy SQL Lakehouse
Lakehouse vytvoří obslužnou vrstvu tak, že během vytváření automaticky vygeneruje koncový bod analýzy SQL a výchozí sémantický model. Tato nová průhledná funkce umožňuje uživateli pracovat přímo nad tabulkami Delta v datovém jezeře, aby poskytovala bezproblémovou a výkonově optimalizovanou zkušenost od příjmu dat až po generování sestav.
Je důležité si uvědomit, že koncový bod SQL Analytics je určen pouze pro čtení a nepodporuje plný rozsah funkcí T-SQL transakčního datového skladu.
Poznámka
V koncovém bodu analýzy SQL jsou k dispozici pouze tabulky ve formátu Delta. Parquet, CSV a další formáty nelze dotazovat pomocí koncového bodu analýzy SQL. Pokud tabulku nevidíte, budete ji muset převést na formát Delta.
Automatické zjišťování a registrace tabulek
Automatické zjišťování a registrace tabulek je funkce Lakehouse, která poskytuje plně spravovaný proces převodu souborů na tabulky pro datové inženýry a datové vědce. Soubor můžete umístit do spravované oblasti Lakehouse a systém ho automaticky ověří pro podporované strukturované formáty a zaregistruje ho do metastoru s potřebnými metadaty, jako jsou názvy sloupců, formáty, komprese a další. (Aktuálně je jediným podporovaným formátem tabulka Delta.) Pak můžete na soubor odkazovat jako na tabulku a použít syntaxi SparkSQL k interakci s daty.
Interakce s prvkem Lakehouse
Datový inženýr může interagovat s jezerem a daty v jezeře několika způsoby:
Průzkumník Lakehouse: Průzkumník je hlavní stránkou pro interakci s Lakehouse. Data můžete načíst do Lakehouse, prozkoumávat je zde pomocí Průzkumníka objektů, nastavit popisky MIP & a provádět různé další úkony. Zjistěte více o práci s průzkumníkem: navigace v průzkumníku Fabric Lakehouse.
Notebooks: Datoví inženýři mohou použít notebook k psaní kódu pro čtení, transformaci a zápis přímo do Lakehouse jako tabulky a/nebo složky. Zjistěte více o tom, jak používat poznámkové bloky pro Lakehouse: Prozkoumejte data ve vašem Lakehouse pomocí poznámkového bloku a Jak pomocí poznámkového bloku načíst data do vašeho Lakehouse.
Pipelines: Datoví inženýři mohou použít nástroje pro integraci dat, jako je nástroj pro kopírování pipeline, k načtení dat z jiných zdrojů a jejich uložení do Lakehouse. Další informace o tom, jak používat aktivitu kopírování: Jak kopírovat data pomocí aktivity kopírování.
definice úloh Apache Sparku: Datoví inženýři mohou vyvíjet robustní aplikace a orchestrovat spouštění kompilovaných úloh Sparku v Javě, Scala a Pythonu. Další informace o úlohách Sparku: Co je definice úlohy Apache Sparku?
toky dat Gen 2: Datoví inženýři můžou k ingestování a přípravě dat použít toky dat Gen2. Další informace o načítání dat pomocí toků dat: Vytvoření prvního toku dat pro získání a transformaci dat.
Přečtěte si další informace o různých způsobech načtení dat do vašeho lakehouse: Možnosti naládování dat do Fabric Lakehouse.
Multitasking s lakehousem
Zážitek z multitaskingu poskytuje návrh karty prohlížeče, který vám umožňuje bez problémů otevírat a přepínat mezi několika položkami, což vám umožní spravovat vaše datové jezero efektivněji než kdy dřív. Už žádné žonglování mezi různými okny nebo ztrácení přehledu o vašich úkolech. Lakehouse nabízí vylepšené možnosti multitaskingu, díky kterým bude vaše cesta ke správě dat co nejefektivnější a uživatelsky přívětivá s následujícími možnostmi:
Zachovat spuštěné operace: Můžete nahrát nebo spustit operaci načítání dat na jedné kartě a zkontrolovat jinou úlohu na jiné kartě. Díky vylepšené funkci vícenásobného zpracování se spuštěné operace při přepínání mezi kartami nezruší. Můžete se soustředit na práci bez přerušení.
Zachovat kontext: Vybrané objekty, tabulky dat nebo soubory zůstanou při přepínání mezi kartami otevřené a snadno dostupné. Kontext vašeho datového lakehouse je vždy na dosah ruky.
Nezablokující opětovné načtení seznamu: Nezablokující mechanismus pro opětovné načítání seznamu souborů a tabulek. Během aktualizace seznamu na pozadí můžete dál pracovat. Zajišťuje, že máte nejnovější data a současně vám poskytuje bezproblémové a nepřerušované prostředí.
Jasně definovaná oznámení: Informační zprávy určují, z jakého lakehouse pocházejí, což usnadňuje sledování změn a aktualizací ve vašem víceúlohovém prostředí.
Přístupný návrh domu u jezera
Přístupnost je vždy nejvyšší prioritou, aby se zajistilo, že Lakehouse je inkluzivní a uživatelsky přívětivý pro všechny uživatele. Tady jsou klíčové iniciativy, které jsme zatím implementovali pro podporu přístupnosti:
kompatibilita čtečky obrazovky: Můžete plynule pracovat s oblíbenými čtečkami obrazovky, což uživatelům se zrakovým postižením umožňuje efektivně procházet a pracovat s naší platformou.
přeformátování textu responzivní návrh, který se přizpůsobí různým velikostem a orientací obrazovky. Dynamické přizpůsobení textu a obsahu usnadňuje uživatelům prohlížení a interakci s naší aplikací na různých zařízeních.
Navigace pomocí klávesnice: Vylepšená navigace pomocí klávesnice, která umožňuje uživatelům pohybovat se v jezeře, aniž by se museli spoléhat na myš, což zlepšuje prostředí pro uživatele s motorovým postižením.
alternativní text pro obrázky: Všechny obrázky teď obsahují popisný alternativní text, aby čtečky obrazovky mohly předávat smysluplné informace.
pole formuláře a popisky: Všechna pole formuláře mají přidružené popisky, což zjednodušuje zadávání dat pro všechny uživatele, včetně těch, kteří používají čtečky obrazovky.
Související obsah
V tomto přehledu získáte základní porozumění konceptu lakehouse. V dalším článku se dozvíte, jak vytvořit a používat vlastní lakehouse:
- Chcete-li začít používat lakehouse, přečtěte si téma Vytvoření lakehousu v Microsoft Fabric.