Prozkoumání poznámkových bloků

Dokončeno

Poznámkové bloky poskytují interaktivní prostředí, ve kterém můžete kombinovat text a grafiku ve formátu Markdownu s buňkami obsahujícími kód, který spustíte interaktivně v relaci poznámkového bloku.

Jako datový vědec možná znáte psaní a spouštění kódu v poznámkových blocích. Microsoft Fabric nabízí známé prostředí poznámkového bloku, které využívá Apache Spark.

V Microsoft Fabricu pracují všichni datoví vědci, podnikoví uživatelé a analytici na stejné platformě a vylepšují sdílení dat a spolupráci ve velkém měřítku.

Použití poznámkových bloků v datových vědách

Poznámkové bloky jsou běžným nástrojem pro datové vědce, protože umožňují kombinovat kód, vysvětlující text a multimediální prostředky v jednom dokumentu. Tím se vytvoří příběh, který může podpořit průzkum tím, že usnadňuje sdílení kódů a rychlé vytváření prototypů.

Poznámkové bloky také umožňují datovým vědcům rychle experimentovat a sdílet přehledy prostřednictvím rychlého vytváření prostředí.

Poznámkové bloky v Microsoft Fabric

S poznámkovými bloky v Microsoft Fabric můžete začít s nulovým úsilím o nastavení. Můžete buď vytvořit nový poznámkový blok, nebo importovat existující poznámkový blok. Můžete také vybrat více poznámkových bloků a importovat je do dávky.

Screenshot of the actions available in a Data Science workspace in Microsoft Fabric.

Poznámkové bloky Microsoft Fabric v současné době podporují čtyři jazyky Apache Sparku:

  • PySpark (Python)
  • Spark (Scala)
  • Spark SQL
  • SparkR

Vytvoření poznámkového bloku

Pokud chcete vytvořit nový poznámkový blok, vyberte možnost Nový v domovské části pracovního prostoru s podporou prostředků infrastruktury.

Následující snímek obrazovky vás provede hlavními komponentami poznámkového bloku v prostředcích infrastruktury.

Screenshot of the options available in a Microsoft Fabric notebook.

  1. Řádek nabídek v poznámkovém bloku Microsoft Fabric nabízí různé funkce. Umožňuje ukládat a exportovat poznámkový blok, spravovat buňky, ukončit relaci, naplánovat spuštění poznámkového bloku, spustit transformaci dat, upravit rozložení mimo jiné. Pokud chcete získat přístup ke všem těmto funkcím, jednoduše přepněte mezi kartami Domů, Upravit, Spustit, Data a Zobrazení .

  2. Na kartě Lakehouses můžete přidat nový nebo existující lakehouse z průzkumníka jezera. Karta Prostředky poskytuje úložiště podobné systému Unix pro malé soubory, jako jsou kód, datové sady a obrázky, přístupné přímo z poznámkového bloku.

  3. Spusťte aktuální buňku. Můžete také stisknout Kombinaci kláves Ctrl+Enter nebo stisknutím alt +Enter spustit aktuální buňku a vložit novou buňku.

  4. Přidejte nový kód nebo buňku markdownu. Tato možnost je dostupná také v nabídce výběrem možnosti Upravit –> Přidat buňku kódu.

  5. Poskytuje různé možnosti pro správu konkrétní buňky, jako je změna umístění buňky v poznámkovém bloku, převod na buňku markdownu nebo kódu, vymazání výstupu, přidání komentářů a další.

Poznámka:

Pokud nemůžete najít možnost poznámkového bloku, může to být proto, že tenant nebo pracovní prostor nebyl pro prostředky infrastruktury povolený. Informace o povolení prostředků infrastruktury najdete v tématu Povolení Microsoft Fabric pro vaši organizaci.

Práce s daty v poznámkových blocích

Přetažením můžete snadno importovat data z Průzkumníka Lakehouse. Podporuje různé typy souborů, jako jsou textové soubory, tabulky, obrázky atd. Data můžete umístit do existující nebo nové buňky a poznámkový blok vygeneruje fragment kódu pro zobrazení náhledu dat.

Example of the drag-and-drop feature generating the necessary code to read a file.

Obrázky můžete také snadno vložit do buňky markdownu přetažením z prohlížeče nebo místního počítače.

Psaní kódu v poznámkových blocích

IntelliSense vylepšuje psaní kódu a identifikaci chyb pomocí funkcí, jako je zvýrazňování syntaxe, označení chyb a automatické dokončování kódu. Při psaní předpovídá, co se pokoušíte psát a nabízí návrhy. Tím se nejen urychlí psaní kódu, ale také se vyhnete překlepům a voláním rozhraní API.

Sledování proměnných v poznámkových blocích

Při práci v poznámkovém bloku není neobvyklé mít stovky proměnných, přičemž každá hraje zásadní roli při analýze dat nebo vývoji modelu. Sledování všech těchto proměnných může být náročný úkol. Tady přichází do hry integrovaný průzkumník proměnných v poznámkovém bloku Microsoft Fabric.

Při spouštění buněk kódu v poznámkovém bloku PySpark (Python) v Microsoft Fabric se proměnné, které definujete, automaticky sledují a uvádějí v Průzkumníku proměnných. To vám umožní zobrazit stav proměnných v libovolném bodě procesu kódování.

Screenshot of the variable explorer in a Microsoft Fabric notebook.

Pro každou proměnnou zobrazí průzkumník název, typ, délku a hodnotu. Díky tomu získáte rychlý přehled dat, aniž byste je museli tisknout nebo protokolovat ručně.

Správa knihoven a závislostí

V Microsoft Fabric můžete spravovat knihovny a závislosti dvěma způsoby: prostřednictvím nastavení pracovního prostoru nebo v rámci poznámkového bloku.

Nastavení pracovního prostoru

Knihovny nainstalované na úrovni pracovního prostoru můžou používat všechny poznámkové bloky a úlohy Sparku v daném pracovním prostoru a jsou přístupné napříč různými relacemi. Takže pokud potřebujete vytvořit společné prostředí pro všechny relace v pracovním prostoru, je nejlepší použít knihovny na úrovni pracovního prostoru.

  1. V levém navigačním podokně vyberte Pracovní prostory. Zobrazí se seznam pracovních prostorů. Vyberte pracovní prostor, se kterým chcete pracovat.

  2. Vyberte nastavení pracovního prostoru pro aktuální pracovní prostor a pak vyberte Datoví technici ing/Science.

    Screenshot of the library management option in a Data Science workspace in Microsoft Fabric.

  3. Výběrem možnosti Správa knihovny nainstalujte informační kanál Pythonu i vlastní knihovny.

In-line instalace

Příkaz %pip v Microsoft Fabric funguje stejně jako příkaz pip v mnoha poznámkových blocích pro datové vědy. K přímé instalaci knihoven informačních kanálů do poznámkového bloku použijte příkazy %pip.

Poznámka:

Všechny knihovny nainstalované pomocí %pip příkazu jsou k dispozici pouze pro aktuální relaci. Spuštěním %pip příkazu se restartuje interpret Pythonu, což znamená, že všechny proměnné definované před spuštěním příkazu budou ztraceny.

Příkaz %pip install slouží k instalaci nejnovějších verzí těchto knihoven. Příkaz importu se pak použije k importu těchto knihoven do aktuálního prostředí Pythonu.

%pip install seaborn
%pip install sklearn

import seaborn as sns
from sklearn import datasets

Tip

Na začátku poznámkového bloku je vhodné umístit všechny příkazy pro přidání, odstranění nebo aktualizaci balíčků Pythonu.

Spolupráce v poznámkových blocích

Sdíleníach Poznámkové bloky Microsoft Fabric nabízejí výkonnou funkci, ve které může stejný dokument upravovat více uživatelů současně. Tato funkce je užitečná ve scénářích, jako je párování programování, vzdálené řešení potíží a sdílení znalostí.

V našem scénáři si představte, že vy a váš kolega pracujete na projektu pomocí poznámkových bloků Microsoft Fabric. Zaseknete se na kus kódu a požádáte svého kolegu o pomoc. Váš kolega otevře stejný poznámkový blok a zobrazí se jeho profil. Když váš kolega zkontroluje a upraví kód, uvidíte pohyby kurzoru, výběry a změny v reálném čase. Tato okamžitá zpětná vazba vám pomůže rychle identifikovat a pochopit řešení.

Tato funkce spolupráce v reálném čase poznámkových bloků Microsoft Fabric vám pomůže nejen vyřešit váš problém s kódováním, ale také poskytuje skvělou příležitost k učení se od zkušených kolegů.

Další informace o všech dostupných funkcích poznámkových bloků Microsoft Fabric najdete v tématu Vývoj, spouštění a správa poznámkových bloků Microsoft Fabric.