Partager via


Explorer les données de votre base de données mise en miroir avec des notebooks

Vous pouvez explorer les données répliquées à partir de votre base de données mise en miroir avec des requêtes Spark dans des notebooks.

Les notebooks sont un élément de code puissant pour vous permettre de développer des travaux Apache Spark et des expériences d’apprentissage automatique sur vos données. Vous pouvez utiliser des notebooks dans Fabric Lakehouse pour explorer vos tables mise en miroir.

Prérequis

Créer un raccourci

Vous devez d’abord créer un raccourci à partir de vos tables mise en miroir dans Lakehouse, puis créer des notebooks avec des requêtes Spark dans votre Lakehouse.

  1. Dans le portail Fabric, ouvrez Ingénierie des données.

  2. Si vous n’avez pas encore créé de Lakehouse, sélectionnez Lakehouse et créez un lakehouse en lui donnant un nom.

  3. Sélectionnez Obtenir des données ->Nouveau raccourci.

  4. Sélectionnez OneLake Microsoft.

  5. Vous pouvez voir toutes vos bases de données mise en miroir dans l’espace de travail Fabric.

  6. Sélectionnez la base de données mise en miroir que vous souhaitez ajouter à votre Lakehouse en tant que raccourci.

  7. Sélectionnez les tables souhaitées dans la base de données mise en miroir.

  8. Sélectionnez Suivant, puis Créer.

  9. Dans l’Explorateur, vous pouvez maintenant voir les données de table sélectionnées dans votre Lakehouse. Capture d’écran du portail Fabric montrant l’explorateur Lakehouse affichant les tables et données de base de données mise en miroir.

    Conseil

    Vous pouvez ajouter d’autres données directement dans Lakehouse ou apporter des raccourcis tels que S3, ADLS Gen2. Vous pouvez accéder au point de terminaison d’analytique SQL du Lakehouse et joindre les données à toutes ces sources avec des données mise en miroir en toute transparence.

  10. Pour explorer ces données dans Spark, sélectionnez les points ... en regard de n’importe quelle table. Sélectionnez Nouveau notebook ou notebook existant pour commencer l’analyse. Capture d’écran du portail Fabric montrant le menu local pour ouvrir une table de base de données mise en miroir dans un notebook.

  11. Le notebook s’ouvre automatiquement et charge le dataframe avec une requête SQL Spark SELECT ... LIMIT 1000.

    • Les nouveaux notebooks peuvent prendre jusqu’à deux minutes pour charger complètement. Vous pouvez éviter ce délai à l’aide d’un notebook existant avec une session active. Capture d’écran du portail Fabric montrant les données d’une table de base de données mise en miroir dans un nouveau notebook avec une requête SQL Spark.