Sdílet prostřednictvím


Prozkoumání dat v zrcadlené databázi pomocí poznámkových bloků

Data replikovaná z zrcadlené databáze můžete prozkoumat pomocí dotazů Sparku v poznámkových blocích.

Poznámkové bloky jsou výkonnou položkou kódu pro vývoj úloh Apache Sparku a experimentů strojového učení na vašich datech. Poznámkové bloky v Fabric Lakehouse můžete použít k prozkoumání zrcadlených tabulek.

Požadavky

Vytvoření zástupce

Nejdřív musíte vytvořit zástupce ze zrcadlených tabulek do Lakehouse a pak vytvořit poznámkové bloky s dotazy Sparku ve vašem Lakehouse.

  1. Na portálu Fabric otevřete Datoví technici ing.

  2. Pokud ještě nemáte vytvořený Lakehouse, vyberte Lakehouse a vytvořte nový Lakehouse tak, že ho pojmenujete.

  3. Vyberte Načíst data –> nová klávesová zkratka.

  4. Vyberte Microsoft OneLake.

  5. Všechny zrcadlené databáze můžete zobrazit v pracovním prostoru Prostředky infrastruktury.

  6. Vyberte zrcadlenou databázi, kterou chcete přidat do lakehouse, jako zástupce.

  7. Vyberte požadované tabulky ze zrcadlené databáze.

  8. Vyberte Další a pak Vytvořte.

  9. V Průzkumníku teď můžete ve svém Lakehouse zobrazit vybraná data tabulky. Snímek obrazovky z portálu Fabric s Průzkumníkem Lakehouse zobrazující zrcadlené databázové tabulky a data

    Tip

    Do Lakehouse můžete přidat další data přímo nebo můžete přidat zástupce, jako je S3, ADLS Gen2. Můžete přejít na koncový bod analýzy SQL lakehouse a spojit data napříč všemi těmito zdroji s bezproblémově zrcadlenými daty.

  10. Pokud chcete tato data prozkoumat ve Sparku, vyberte ... tečky vedle jakékoli tabulky. Vyberte Nový poznámkový blok nebo Existující poznámkový blok a začněte analyzovat. Snímek obrazovky z portálu Fabric s místní nabídkou pro otevření zrcadlené databázové tabulky v poznámkovém bloku

  11. Poznámkový blok se automaticky otevře a načte datový rámec pomocí SELECT ... LIMIT 1000 dotazu Spark SQL.

    • Úplné načtení nových poznámkových bloků může trvat až dvě minuty. Toto zpoždění se můžete vyhnout použitím existujícího poznámkového bloku s aktivní relací. Snímek obrazovky z portálu Fabric s daty ze zrcadlené databázové tabulky v novém poznámkovém bloku s dotazem Spark SQL