Condividi tramite


Risoluzione dei problemi relativi alla qualità dei dati

Tutte le domande, i sintomi degli errori sono descritti con la possibile risoluzione seguente:

Perché viene visualizzato un errore di origine non valido durante l'analisi del processo.

  • Questo errore può essere visualizzato per due motivi:
    • La tabella delta non esiste nella posizione
    • I dati nel file non sono in un formato differenziale valido.

Si configurano analisi della qualità dei dati per le tabelle differenziali di Fabric. Tutti gli asset di dati vengono visualizzati nella visualizzazione qualità dei dati, è stato selezionato un asset e sono stati applicati regole per l'analisi della qualità dei dati, ma l'analisi ha esito negativo.

  • Esistono vari motivi per cui l'analisi della qualità dei dati non riesce:

Perché viene visualizzato questo messaggio di errore: non è possibile usare alcuna connessione. Provare a creare prima la connessione?

Screenshot della pagina di panoramica della qualità dei dati con errore di connessione.

  • Per profilare i dati o eseguire l'analisi della qualità dei dati, è prima necessario configurare la connessione all'origine dati. Questo avviso scompare dopo aver creato una connessione all'origine dati.

Perché il conteggio totale dei dati profilati è inferiore al conteggio totale nella tabella delta Azure Data Lake Storage Gen2?

  • Qualità dei dati di Microsoft Purview usa 1 milione di dimensioni del campione per la profilatura. Questo esempio viene acquisito in modo casuale. Se la tabella delta contiene più di un milione di record, il conteggio totale non corrisponderà.

Perché viene visualizzata un'azione sul punteggio di qualità dei dati mancante per un prodotto dati, il punteggio viene visualizzato nel prodotto dati quando si esplora la visualizzazione del prodotto dati.

  • Al momento della creazione dell'azione, non era presente alcun punteggio di qualità dei dati per il prodotto dati. L'analisi della qualità dei dati è stata eseguita dopo la creazione dell'azione e il punteggio pubblicato per il prodotto dati. È consigliabile chiudere l'azione dopo aver eseguito la correzione per evitare confusione.

La creazione di regole di qualità dei dati da "Suggerisci regole" genera un errore su una colonna "date" quando si tenta di aggiungere tutte le 30 regole suggerite

  • Questo avviene perché il tipo di dati dello schema non è supportato nella vista dello schema di qualità dei dati. È possibile modificare il tipo di dati fino alla data selezionando l'interruttore gestione schema e salvarlo. Dopo aver modificato il tipo di dati, dovrebbe essere possibile aggiungere la regola.

Quando si tenta di aggiungere tutte le regole suggerite, viene generato un errore su "ObserverId già esistente"

  • Molto probabilmente, la stessa regola/identica è già stata aggiunta a una colonna. Quando si tenta di aggiungere la stessa regola o la stessa regola a una colonna, l'applicazione genera questo messaggio di errore.

Perché il processo pianificato viene ignorato anziché eseguito? Viene visualizzato l'oggetto Ignorato per i processi di analisi della qualità dei dati

  • Il processo DQ ha una funzionalità per controllare ed eseguire DQ solo se sono state apportate modifiche dall'ultima esecuzione, che viene eseguita per controllare la cronologia differenziale. Ignorare significa semplicemente che non sono state apportate modifiche ai dati dall'ultima esecuzione e l'esecuzione spark per DQ non viene eseguita. Ignorato!= Non riuscito

Quando si seleziona la scheda dei dati del profilo, viene visualizzato il numero di colonne preselezionate. È possibile modificare le colonne selezionate?

  • Qualità dei dati di Microsoft Purview usa una soluzione di profilatura assistita da intelligenza artificiale. Le colonne preselezionate vengono selezionate usando l'intelligenza artificiale per la profilatura dei dati di Microsoft Purview. È possibile deselezionare le colonne preselezionate e riselezionare in base alla criticità delle colonne e selezionare Salva ed esegui per eseguire la profilatura.

Perché non è possibile selezionare alcuni asset di dati dalla pagina dell'elenco di asset di qualità dei dati alla profilatura e alla scansione?

  • I motivi possono essere pochi:
    • Tali asset di dati vengono pubblicati da origini dati non supportate
    • Il formato di file di tali asset di dati non è supportato

Perché il processo di profilatura non riesce per le origini dati supportate?

  • Controllare lo schema per assicurarsi che non sia presente alcun nome di colonna con spazi. La versione corrente non supporta il nome della colonna con spazi. I nostri tecnici stanno lavorando per rilasciare un hotfix.

Perché non è possibile eseguire l'analisi della qualità dei dati e la profilatura dei dati per file CSV, parquet e di testo?

  • Qualità dei dati di Microsoft Purview supporta attualmente solo il formato delta di parquet. Purview Data Quality non supporta CSV, testo e parquet (nessun delta).

Perché non viene visualizzata la regola di aggiornamento della qualità dei dati nell'elenco delle regole?

  • L'aggiornamento della qualità dei dati non è supportato per le tabelle Azure SQL. Se l'asset di dati è una tabella Azure SQL, la regola di aggiornamento non verrà elencata per selezionare e applicare l'asset di dati.

Il processo di analisi DQ non è riuscito. Viene visualizzato un messaggio di errore "Errore interno del servizio, riprovare o contattare il supporto tecnico Microsoft". Cosa è necessario fare per risolvere i problemi?

  • Esistono molti motivi per cui l'analisi ha esito negativo con questo messaggio di errore:
    • L'utente non è autorizzato a eseguire l'operazione corrente per l'area di lavoro a cui l'utente sta tentando di accedere per l'analisi della qualità dei dati.
    • Codice di errore 403, che indica che l'accesso alle origini dati è temporaneamente vietato.
    • L'accesso all'origine dati per l'identità gestita è scaduto.
    • L'identità gestita di Purview richiede l'accesso come collaboratore all'area di lavoro di Microsoft Fabric. Se l'accesso dei collaboratori per l'identità del servizio gestito di Microsoft Purview non è stato fornito all'area di lavoro di Microsoft Fabric, l'analisi della qualità dei dati ha esito negativo.

Perché viene visualizzato un errore di formato delta anche se si usa il formato delta?

  • Microsoft supporta Spark 3.4 Delta 2.4. Assicurarsi di usare Delta Lake versione 2.4.

Perché viene visualizzato l'errore quando è stato selezionato un asset di dati di riferimento per configurare la regola di ricerca tabelle

  • Il motivo è che è stato selezionato un asset di dati che non fa parte del collegamento o del riferimento a un prodotto dati nello stesso dominio di governance. Per selezionare l'asset di dati corretto:
    • Fare clic su Seleziona tabella di riferimento (vedere lo screenshot seguente)

      Screenshot dell'errore cerca asset di dati.

    • Annullare la selezione corrente (vedere lo screenshot seguente)

      Screenshot della selezione dell'asset di dati corretto.

    • Dopo aver annullato la selezione corrente, selezionare un altro asset.

Come è possibile configurare l'accesso all'origine dati per l'identità del servizio gestito di Microsoft Purview?

Tutte le origini dati si trovano dietro l'endpoint privato (nella rete virtuale), Può Purview accedere ai dati nella rete virtuale per l'analisi della qualità dei dati?

Dove è possibile trovare una buona documentazione sulla funzione di espressione per creare regole personalizzate?

Perché l'analisi DQ per la tabella Fabric Lakehouse ha esito negativo?

  • Il supporto della mappa dati di Purview per fabric Lakehouse è disponibile in anteprima privata. È necessario consentire l'elenco del tenant purview alla mappa dati di Purview e a Fabric One Lake per abilitare l'analisi DQ delle tabelle di Fabric Lakehouse con Purview DQ. Contattare il team dell'account Microsoft per consentire l'elenco dei tenant per il supporto di Fabric Lakehouse.