Utilizzare Microsoft Fabric Lakehouses

Completato

Ora che si comprendono le funzionalità principali di Microsoft Fabric Lakehouse, si esaminerà come utilizzarne una.

Creare ed esplorare una lakehouse

È possibile creare e configurare una nuova Lakehouse nel carico di lavoro Ingegneria dei dati. Ogni lakehouse produce tre elementi denominati nell'area di lavoro abilitata per l'infrastruttura:

  • Lakehouse consiste nell'archiviazione e nei metadati lakehouse, in cui si interagisce con file, cartelle e dati di tabella.
  • Il modello semantico (impostazione predefinita) è un modello semantico creato automaticamente in base alle tabelle della lakehouse. I report di Power BI possono essere creati dal modello semantico.
  • L'endpoint di analisi SQL è un endpoint SQL di sola lettura tramite il quale puoi connetterti ed eseguire query sui dati con Transact-SQL.

Screenshot dei tre elementi di Lakehouse come descritto.

È possibile usare i dati nella lakehouse in due modalità:

  • Lakehouse consente di aggiungere e interagire con tabelle, file e cartelle in Lakehouse.
  • L'endpoint di analisi SQL consente di usare SQL per eseguire query sulle tabelle nella lakehouse e gestire il modello semantico relazionale.

Screenshot delle due modalità Lakehouse Explorer.

Inserire dati in una lakehouse

Esistono molti modi per caricare i dati in un'infrastruttura lakehouse, tra cui:

  • Caricamento: caricare file o cartelle locali nella lakehouse. È quindi possibile esplorare ed elaborare i dati dei file e caricare i risultati in tabelle.

  • Flussi di dati (Gen2): importare e trasformare i dati da un intervallo di origini usando Power Query Online e caricarli direttamente in una tabella nella lakehouse.

  • Notebook: usare i notebook in Fabric per inserire e trasformare i dati e caricarli in tabelle o file nella lakehouse.

  • Pipeline di Data Factory: copiare i dati e orchestrare le attività di elaborazione dei dati, caricando i risultati in tabelle o file nella lakehouse.

Accedere ai dati usando i collegamenti

Un altro modo per accedere e usare i dati in Fabric consiste nell'usare i collegamenti. I collegamenti consentono di integrare i dati nella lakehouse mantenendoli archiviati nell’archiviazione esterna.

I collegamenti sono utili quando è necessario recuperare i dati che si trovano in un altro account di archiviazione o addirittura in un altro provider di servizi cloud. All'interno della propria Lakehouse è possibile creare collegamenti che puntano a diversi account di archiviazione e ad altri elementi del Fabric, come data warehouse, database KQL e altre Lakehouse.

Le autorizzazioni e le credenziali dei dati di origine sono tutte gestite da OneLake. Quando si accede ai dati tramite un collegamento a un'altra sede OneLake, l'identità dell'utente chiamante verrà utilizzata per autorizzare l'accesso ai dati nel percorso di destinazione del collegamento. L'utente deve disporre delle autorizzazioni nella posizione di destinazione per leggere i dati.

I collegamenti possono essere creati sia in Lakehouse che nei database KQL e vengono visualizzati come una cartella nel lake. Ciò consente a Spark, SQL, Real-Time intelligence e Analysis Services di usare collegamenti per l'esecuzione di query sui dati.

Nota

Per altre informazioni sull’uso dei collegamenti, vedere la documentazione dei collegamenti a OneLake nella documentazione di Microsoft Fabric.