Condividi tramite


Qualità dei dati per i database di collegamento di Microsoft Fabric

I collegamenti sono oggetti in OneLake che puntano ad altre posizioni di archiviazione. La posizione può essere interna o esterna a OneLake. Il percorso a cui punta un collegamento è noto come percorso di destinazione del collegamento. Il percorso in cui viene visualizzato il collegamento è noto come percorso di collegamento. I collegamenti vengono visualizzati come cartelle in OneLake e qualsiasi carico di lavoro o servizio che ha accesso a OneLake può usarli.

I collegamenti in Microsoft OneLake consentono di unificare i dati tra domini, cloud e account creando un singolo data lake virtuale per l'intera azienda. Tutte le esperienze e i motori analitici di Microsoft Fabric possono connettersi direttamente alle origini dati esistenti, ad esempio Azure, Amazon Web Services (AWS) e OneLake tramite uno spazio dei nomi unificato. OneLake gestisce tutte le autorizzazioni e le credenziali in modo che non sia necessario configurare separatamente ogni carico di lavoro di Fabric per connettersi a ogni origine dati.

Per altre informazioni sui collegamenti a Microsoft Fabric, vedere la documentazione di Fabric.

Configurare la qualità dei dati per i database di collegamento di Fabric

Accedere all'area di lavoro di Microsoft Fabric. Selezionare il pulsante con i puntini di sospensione in Tabelle e selezionare Nuovo collegamento. Da qui è possibile creare:

Screenshot dell'area di lavoro Fabric con il nuovo pulsante di scelta rapida evidenziato.

Collegamento ad Azure Data Lake Gen2

  1. Selezionare il collegamento Azure Data Lake Storage Gen2 dall'area di lavoro Infrastruttura Pagina Nuovo collegamento.

    Screenshot della pagina Di nuovo collegamento di Fabric con ADLS Gen2 evidenziato.

  2. Selezionare Autenticazione sas di ADLS Gen2.

    Screenshot della nuova finestra di scelta rapida con l'autenticazione del token di firma di accesso condiviso selezionata.

  3. Generare una firma di accesso condiviso e stringa di connessione per la risorsa ADLS Gen2 nel portale di Azure.

  4. Copiare l'endpoint del data lake.

    Screenshot della copia del punto finale del data lake nel portale di Azure.

  5. Aggiungere i dettagli di archiviazione per l'archiviazione dei collegamenti.

    Screenshot per aggiungere i dettagli di archiviazione al collegamento a Fabric nella nuova finestra di scelta rapida.

  6. Passare a e scegliere la cartella delta corretta.

    Screenshot per scegliere la cartella delta corretta nella nuova finestra di scelta rapida.

  7. Visualizzare in anteprima la tabella differenziale dei collegamenti nell'area di lavoro Fabric.

    Screenshot dell'anteprima della tabella delta di OneLake.

  8. Avviare un'analisi della risorsa Azure Data Lake Gen2 nel Microsoft Purview Data Map usando l'autenticazione dell'entità servizio.

    Screenshot dell'analisi della mappa dati per ADLS Gen2.

  9. Al termine dell'analisi, l'asset di dati dovrebbe essere visualizzato in Unified Catalog come tabella lakehouse.

  10. Associare l'asset a un prodotto dati per la cura e la valutazione della qualità dei dati.

    Screenshot dell'asset di dati di collegamento nel catalogo.

  11. Aprire la soluzione Qualità dei dati di Microsoft Purview ed eseguire un'analisi della qualità dei dati o profilare i dati come di consueto.

Collegamento ad Amazon S3

  1. Selezionare Nuovo collegamento nell'area di lavoro di Microsoft Fabric.

  2. Selezionare AWS S3 e aggiungere l'URL, l'ID chiave di accesso e il tasto di scelta rapida.

    Screenshot della nuova pagina di collegamento di Amazon S3 con i dettagli aggiunti.

  3. Aggiungere l'URL di connessione e i dettagli di archiviazione.

    Screenshot della nuova pagina di collegamento di Amazon S3 con l'URL di connessione e i dettagli di archiviazione aggiunti.

  4. Visualizzare in anteprima il collegamento nell'area di lavoro Fabric.

  5. Avviare un'analisi della risorsa Amazon S3 nel Microsoft Purview Data Map usando l'autenticazione dell'entità servizio.

  6. Al termine dell'analisi, l'asset di dati dovrebbe essere visualizzato in Unified Catalog.

  7. Associare l'asset a un prodotto dati per la cura e la valutazione della qualità dei dati.

  8. Aprire la soluzione Qualità dei dati di Microsoft Purview ed eseguire un'analisi della qualità dei dati o profilare i dati come di consueto.

Collegamento a Google Cloud Storage (GCS)

  1. Selezionare Nuovo collegamento nell'area di lavoro di Microsoft Fabric.

  2. Selezionare Google Cloud Storage e aggiungere l'URL, l'ID chiave di accesso e il tasto di scelta rapida.

    Screenshot del tasto HMAC del collegamento GCS.

  3. Aggiungere l'URL di connessione e i dettagli di archiviazione,

    Screenshot dell'URL di connessione GCS.

  4. Visualizzare in anteprima il collegamento nell'area di lavoro Fabric.

  5. Avviare un'analisi della risorsa Amazon S3 nel Microsoft Purview Data Map usando l'autenticazione dell'entità servizio.

  6. Al termine dell'analisi, l'asset di dati dovrebbe essere visualizzato in Unified Catalog.

  7. Associare l'asset a un prodotto dati per la cura e la valutazione della qualità dei dati.

  8. Aprire la soluzione Qualità dei dati di Microsoft Purview ed eseguire un'analisi della qualità dei dati o profilare i dati come di consueto.

Importante

  • Usare un'entità servizio per le analisi della mappa dati e l'identità gestita per le analisi della qualità dei dati.
  • Tutti i dati originati tramite un collegamento verranno elaborati nella stessa area.
  • Esiste una dipendenza dal team di Fabric per distinguere gli elementi di collegamento dagli elementi nativi in OneLake SDK per i subartifact di Lakehouse. Per il momento tutti gli elementi di collegamento (tabelle e file) verranno considerati come elementi nativi nell'analisi.