Condividi tramite


Esplorare i dati nel database con mirroring con Notebook

È possibile esplorare i dati replicati dal database con mirroring con le query Spark nei Notebook.

I Notebook sono un potente elemento di codice che consente di sviluppare processi Apache Spark ed esperimenti di Machine Learning sui dati. È possibile usare i Notebook in Fabric Lakehouse per esplorare le tabelle con mirroring.

Prerequisiti

Creare un collegamento

È prima necessario creare un collegamento dalle tabelle con mirroring in Lakehouse e quindi creare Notebook con query Spark in Lakehouse.

  1. Nel portale Fabric, aprire Ingegneria dei dati.

  2. Se non è già stato creato un Lakehouse, selezionare Lakehouse e creare un nuovo Lakehouse assegnandogli un nome.

  3. Selezionare Recupera dati ->Nuovo collegamento.

  4. Selezionare Microsoft OneLake.

  5. È possibile visualizzare tutti i database con mirroring nell'area di lavoro di Fabric.

  6. Selezionare il database con mirroring da aggiungere a Lakehouse come collegamento.

  7. Selezionare le tabelle desiderate dal database con mirroring.

  8. Selezionare Avanti e poi Crea.

  9. In Esplora risorse è ora possibile visualizzare i dati della tabella selezionati in Lakehouse. Screenshot del portale di Fabric, il quale mostra il Lakehouse Explorer con visualizzate le tabelle e i dati del database con mirroring.

    Suggerimento

    È possibile aggiungere altri dati direttamente in Lakehouse o usare collegamenti come S3, ADLS Gen2. È possibile passare all'endpoint di analisi SQL di Lakehouse e unire senza problemi i dati di tutte queste origini con i dati con mirroring.

  10. Per esplorare questi dati in Spark, selezionare i puntini ...accanto a qualsiasi tabella. Per iniziare l’analisi, selezionare Nuovo Notebook oppure Notebook esistente. Screenshot del portale di Fabric che mostra il menu di scelta rapida per aprire una tabella di database con mirroring in un notebook.

  11. Il notebook verrà aperto automaticamente e il dataframe verrà caricato con una SELECT ... LIMIT 1000 query Spark SQL.

    • Ci possono volere fino a due minuti per caricare completamente i nuovi notebook. È possibile evitare questo ritardo usando un notebook esistente con una sessione attiva. Screenshot del portale di Fabric che mostra i dati di una tabella di database con mirroring in un nuovo notebook con una query Spark SQL.