Considerazioni sulla gestione del lakehouse

Completato

Quando si gestisce un lakehouse, è consigliabile tenere presenti alcune considerazioni, ad esempio come proteggere il lakehouse e come gestire integrazione continua e recapito continuo (CI/CD).

Proteggere il lakehouse

Proteggere il lakehouse assicurandosi che solo gli utenti autorizzati possano accedere ai dati. In Fabric è possibile eseguire questa operazione impostando le autorizzazioni a livello di area di lavoro o di elemento.

Le autorizzazioni di un'area di lavoro controllano l'accesso a tutti gli elementi presenti nell'area di lavoro. Le autorizzazioni a livello di elemento controllano l'accesso a elementi specifici di un'area di lavoro e possono essere usate quando si collabora con colleghi che non si trovano nella stessa area di lavoro o devono poter accedere a un solo elemento specifico.

È possibile archiviare in modo strategico diversi livelli del lakehouse in aree di lavoro separate per migliorare la sicurezza e gestire con efficienza le capacità. Questo approccio non solo migliora la sicurezza, ma ottimizza anche i costi.

  • Considerazioni su sicurezza e accesso: Definire chi deve accedere a ogni livello, facendo in modo che solo il personale autorizzato possa interagire con i dati sensibili.
  • Controllo di accesso relativo al livello oro: Limitare l'accesso al livello oro per scopi di sola lettura, evidenziando l'importanza delle autorizzazioni minime.
  • Utilizzo relativo al livello argento: Decidere se agli utenti sarà consentito sviluppare il livello argento, trovando un equilibrio tra flessibilità e sicurezza.
  • Controllo di accesso relativo al livello bronzo: Limitare l'accesso al livello bronzo per scopi di sola lettura, evidenziando l'importanza delle autorizzazioni minime.

La condivisione del contenuto di Fabric deve essere discussa con il team di sicurezza dell'organizzazione per assicurarsi che sia in linea con i criteri di sicurezza dell'organizzazione.

Considerazioni su integrazione continua e recapito continuo (CI/CD)

La progettazione di un processo di integrazione continua e recapito continuo (CI/CD) per un'architettura di lakehouse prevede diverse considerazioni per garantire un processo di distribuzione fluido ed efficiente. Le considerazioni includono l'implementazione di controlli di qualità dei dati, controllo della versione, distribuzioni automatizzate, monitoraggio e misure di sicurezza. Le considerazioni devono includere anche scalabilità, ripristino di emergenza, collaborazione, conformità e miglioramento continuo per garantire distribuzioni di pipeline di dati affidabili ed efficienti. Anche se alcune di queste considerazioni sono correlate a processi e procedure, altre sono correlate agli strumenti e alle tecnologie usati per implementare CI/CD. Fabric include in modo nativo diversi strumenti e tecnologie per supportare i processi CI/CD.

L'integrazione con Git in Microsoft Fabric consente di integrare processi di sviluppo, strumenti e procedure consigliate direttamente nella piattaforma Fabric. L'integrazione con Git di Fabric consente ai team responsabili dei dati di eseguire il backup e il controllo della versione, di tornare a fasi precedenti all'occorrenza, di collaborare con altri utenti o lavorare da soli usando i rami Git e di sfruttare le funzionalità di strumenti di controllo del codice sorgente familiari per gestire gli elementi di Fabric.

Nota

Altre informazioni sull'integrazione con Git in Fabric sono disponibili in Introduzione all'integrazione con Git.

CI/CD è fondamentale al livello oro di un lakehouse perché garantisce che siano disponibili per l'utilizzo dati di alta qualità, convalidati e affidabili. I processi automatizzati consentono l'integrazione continua di nuovi dati, trasformazioni dei dati e aggiornamenti, riducendo gli errori manuali e fornendo informazioni dettagliate coerenti e aggiornate a utenti e applicazioni downstream. Ciò migliora l'accuratezza dei dati, accelera il processo decisionale e supporta in modo efficace le iniziative basate sui dati.