Delen via


Gegevens in uw gespiegelde database verkennen met notebooks

U kunt de gegevens verkennen die zijn gerepliceerd vanuit uw gespiegelde database met Spark-query's in notebooks.

Notebooks zijn een krachtig code-item voor het ontwikkelen van Apache Spark-taken en machine learning-experimenten op uw gegevens. U kunt notebooks in Fabric Lakehouse gebruiken om uw gespiegelde tabellen te verkennen.

Vereisten

Een snelkoppeling maken

U moet eerst een snelkoppeling maken op basis van uw gespiegelde tabellen in Lakehouse en vervolgens notebooks bouwen met Spark-query's in uw Lakehouse.

  1. Open Data-engineer ing in de Fabric-portal.

  2. Als u nog geen Lakehouse hebt gemaakt, selecteert u Lakehouse en maakt u een nieuw Lakehouse door deze een naam te geven.

  3. Selecteer Gegevens ophalen -> Nieuwe snelkoppeling.

  4. Selecteer Microsoft OneLake.

  5. U kunt al uw gespiegelde databases zien in de werkruimte Fabric.

  6. Selecteer de gespiegelde database die u als snelkoppeling wilt toevoegen aan uw Lakehouse.

  7. Selecteer de gewenste tabellen in de gespiegelde database.

  8. Selecteer Volgende en vervolgens Maken.

  9. In Explorer kunt u nu geselecteerde tabelgegevens in uw Lakehouse bekijken. Schermopname van de Fabric-portal, waarin Lakehouse Explorer de gespiegelde databasetabellen en -gegevens weergeeft.

    Tip

    U kunt andere gegevens rechtstreeks toevoegen in Lakehouse of snelkoppelingen zoals S3, ADLS Gen2 gebruiken. U kunt naar het SQL-analyse-eindpunt van Lakehouse navigeren en de gegevens naadloos samenvoegen in al deze bronnen met gespiegelde gegevens.

  10. Als u deze gegevens in Spark wilt verkennen, selecteert u de ... puntjes naast een tabel. Selecteer Nieuw notitieblok of bestaand notitieblok om de analyse te starten. Schermopname van de Fabric-portal met het contextmenu voor het openen van een gespiegelde databasetabel in een notebook.

  11. Het notebook wordt automatisch geopend en het gegevensframe wordt geladen met een SELECT ... LIMIT 1000 Spark SQL-query.

    • Het laden van nieuwe notebooks kan maximaal twee minuten duren. U kunt deze vertraging voorkomen door een bestaand notitieblok met een actieve sessie te gebruiken. Schermopname van de Fabric-portal met gegevens uit een gespiegelde databasetabel in een nieuw notebook met een Spark SQL-query.