Utilizzare Microsoft Fabric Lakehouses
Ora che si comprendono le funzionalità principali di Microsoft Fabric Lakehouse, si esaminerà come utilizzarne una.
Creare ed esplorare una lakehouse
È possibile creare e configurare una nuova Lakehouse nel carico di lavoro Ingegneria dei dati. Ogni lakehouse produce tre elementi denominati nell'area di lavoro abilitata per l'infrastruttura:
- Lakehouse consiste nell'archiviazione e nei metadati lakehouse, in cui si interagisce con file, cartelle e dati di tabella.
- Il modello semantico (impostazione predefinita) è un modello semantico creato automaticamente in base alle tabelle della lakehouse. I report di Power BI possono essere creati dal modello semantico.
- L'endpoint di analisi SQL è un endpoint SQL di sola lettura tramite il quale puoi connetterti ed eseguire query sui dati con Transact-SQL.
È possibile usare i dati nella lakehouse in due modalità:
- Lakehouse consente di aggiungere e interagire con tabelle, file e cartelle in Lakehouse.
- L'endpoint di analisi SQL consente di usare SQL per eseguire query sulle tabelle nella lakehouse e gestire il modello semantico relazionale.
Inserire dati in una lakehouse
Esistono molti modi per caricare i dati in un'infrastruttura lakehouse, tra cui:
Caricamento: caricare file o cartelle locali nella lakehouse. È quindi possibile esplorare ed elaborare i dati dei file e caricare i risultati in tabelle.
Flussi di dati (Gen2): importare e trasformare i dati da un intervallo di origini usando Power Query Online e caricarli direttamente in una tabella nella lakehouse.
Notebook: usare i notebook in Fabric per inserire e trasformare i dati e caricarli in tabelle o file nella lakehouse.
Pipeline di Data Factory: copiare i dati e orchestrare le attività di elaborazione dei dati, caricando i risultati in tabelle o file nella lakehouse.
Accedere ai dati usando i collegamenti
Un altro modo per accedere e usare i dati in Fabric consiste nell'usare i collegamenti. I collegamenti consentono di integrare i dati nella lakehouse mantenendoli archiviati nell’archiviazione esterna.
I collegamenti sono utili quando è necessario recuperare i dati che si trovano in un altro account di archiviazione o addirittura in un altro provider di servizi cloud. All'interno della propria Lakehouse è possibile creare collegamenti che puntano a diversi account di archiviazione e ad altri elementi del Fabric, come data warehouse, database KQL e altre Lakehouse.
Le autorizzazioni e le credenziali dei dati di origine sono tutte gestite da OneLake. Quando si accede ai dati tramite un collegamento a un'altra sede OneLake, l'identità dell'utente chiamante verrà utilizzata per autorizzare l'accesso ai dati nel percorso di destinazione del collegamento. L'utente deve disporre delle autorizzazioni nella posizione di destinazione per leggere i dati.
I collegamenti possono essere creati sia in Lakehouse che nei database KQL e vengono visualizzati come una cartella nel lake. Ciò consente a Spark, SQL, Real-Time intelligence e Analysis Services di usare collegamenti per l'esecuzione di query sui dati.
Nota
Per altre informazioni sull’uso dei collegamenti, vedere la documentazione dei collegamenti a OneLake nella documentazione di Microsoft Fabric.