Disponibilità di OneLake di Eventhouse
È possibile creare una copia logica dei dati del database KQL in una eventhouse attivando la disponibilità di OneLake. L'attivazione della disponibilità di OneLake consente di eseguire query sui dati nel database KQL in formato Delta Lake tramite altri motori di Fabric, ad esempio la modalità Direct Lake in Power BI, Warehouse, Lakehouse, Notebook e altro ancora.
Delta Lake è un formato di tabella data lake unificato che consente di ottenere l'accesso ai dati senza problemi in tutti i motori di calcolo in Microsoft Fabric. Per maggiori informazioni su Delta Lake, vedere Che cos'è Delta Lake?.
In questo articolo si impara come attivare la disponibilità dei dati del database KQL in OneLake.
Funzionamento
La seguente tabella descrive il comportamento del database e delle tabelle KQL quando si attiva o si disattiva la disponibilità di OneLake.
Attivato | Spento | |
---|---|---|
Database KQL | - Le tabelle esistenti non sono interessate. Le nuove tabelle vengono rese disponibili in OneLake. - I Criteri di conservazione dei dati del database KQL vengono applicati anche ai dati in OneLake. I dati rimossi dal database KQL alla fine del periodo di conservazione vengono rimossi anche da OneLake. |
- Le tabelle esistenti non sono interessate. Le nuove tabelle non saranno disponibili in OneLake. |
Una tabella nel database KQL | - I nuovi dati vengono resi disponibili in OneLake. - I dati esistenti non vengono recuperati. - I dati non possono essere eliminati, troncati o rimossi definitivamente. - Non è possibile modificare lo schema della tabella e non è possibile rinominare la tabella. - La sicurezza a livello di riga non può essere applicata alla tabella. |
- I nuovi dati non vengono resi disponibili in OneLake. - I dati possono essere eliminati, troncati o rimossi definitivamente. - Lo schema della tabella può essere modificato e la tabella può essere rinominata. - I dati vengono eliminati temporaneamente da OneLake. |
Importante
La visualizzazione dei dati in OneLake può richiedere alcune ore. Per altre informazioni, vedere Comportamento adattivo.
Non sono previsti costi di archiviazione aggiuntivi per attivare la disponibilità di OneLake. Per maggiori informazioni, vedere Consumo di risorse.
Prerequisiti
- Un'area di lavoro con una capacità abilitata per Microsoft Fabric
- Un database KQL con autorizzazioni di modifica e dati
Attivare la disponibilità di OneLake
È possibile attivare la disponibilità di OneLake a livello di database KQL o di tabella.
Per attivare la disponibilità di OneLake, passare alla sezione OneLake nel riquadro dei dettagli del database o della tabella KQL.
Impostare Disponibilità su Sì.
Il database viene aggiornato automaticamente.
È stata attivata la disponibilità di OneLake nel database KQL. È ora possibile accedere a tutti i nuovi dati aggiunti al database nel percorso OneLake specificato in formato Delta Lake. È anche possibile scegliere di creare un collegamento OneLake da lakehouse, data warehouse o eseguire query sui dati direttamente tramite la modalità Direct Lake di Power BI.
Comportamento adattivo
Eventhouse offre un meccanismo affidabile che raggruppa in modo intelligente i flussi dei dati in ingresso in uno o più file Parquet, strutturati per l'analisi. L'invio in batch dei flussi dei dati è importante quando si gestiscono i dati con trucco. La scrittura di molti file Parquet di piccole dimensioni nel lake può risultare inefficiente con costi più elevati e prestazioni scarse.
Il meccanismo adattivo di Eventhouse può ritardare le operazioni di scrittura fino a poche ore se non sono presenti dati sufficienti per creare file Parquet ottimali. Ciò garantisce che i file Parquet siano di dimensioni ottimali e rispettino le procedure consigliate di Delta Lake. Il meccanismo adattivo Eventhouse garantisce che i file Parquet siano primi per l'analisi e bilanciano la necessità di richiedere la disponibilità dei dati con considerazioni sui costi e sulle prestazioni.
È possibile monitorare quanto tempo fa sono stati aggiunti nuovi dati nel lake controllando la latenza dei dati usando il comando .show per le operazioni di mirroring della tabella.
I risultati vengono misurati dall'ultima volta in cui sono stati aggiunti i dati. Quando la Latenza restituisce 00:00:00, tutti i dati nel database KQL sono disponibili in OneLake.
Visualizza file
Quando si attiva la disponibilità di OneLake in una tabella, viene creata una cartella di log delta insieme ai file JSON e Parquet corrispondenti. È possibile visualizzare i file resi disponibili in OneLake e le relative proprietà mentre rimangono all'interno di Intelligence in tempo reale.
Per visualizzare i file, passare il puntatore del mouse su una tabella nel riquadro Explorer e quindi selezionare il menu Altro [...]>Visualizza file.
Per visualizzare le proprietà della cartella del log delta o dei singoli file, passare il puntatore del mouse sulla cartella o sul file e quindi selezionare il menù Altro [...]>Proprietà.
Per visualizzare i file nella cartella di log delta:
- Selezionare la cartella _delta_log.
- Selezionare un file per visualizzare i metadati e lo schema della tabella. L'editor aperto è in formato di sola lettura.
Criteri di mirroring dell'accesso
Per impostazione predefinita, quando la disponibilità di OneLake è attivata, viene abilitato un criterio di mirroring. È possibile usare i criteri per monitorare la latenza dei dati o modificarla in tabelle delta di partizione.
Nota
Se si disattiva la disponibilità di OneLake, la proprietà del criterio di mirroring IsEnabled
è impostata su false (IsEnabled=false
).
Partizione delle tabelle delta
È possibile partizionare le tabelle delta per migliorare la velocità delle query. Per informazioni su quando partizionare i file OneLake, vedere Quando partizionare le tabelle. Ogni partizione è rappresentata come colonna separata usando PartitionName elencato nell'elenco Partizioni. Ciò significa che la copia di OneLake contiene più colonne rispetto alla tabella di origine.
Per partizionare le tabelle delta, usare il comando di mirroring dei criteri della tabella .alter-merge.
Contenuto correlato
- Per esporre i dati in OneLake, vedere Creare una scorciatoia in OneLake
- Per creare una scorciatoia OneLake in Lakehouse, vedere Che cosa sono le scorciatoie in lakehouse?
- Per eseguire query sui dati a cui si fa riferimento da OneLake nel database o nella tabella KQL, vedere Creare un collegamento a OneLake nel database KQL