Condividi tramite


Scenari di utilizzo di Power BI: preparazione dei dati self-service

Nota

Questo articolo fa parte della serie di articoli sulla pianificazione dell'implementazione di Power BI. Questa serie è incentrata principalmente sull'esperienza Power BI in Microsoft Fabric. Per un'introduzione alla serie, vedere Pianificazione dell'implementazione di Power BI.

La preparazione dei dati (talvolta definita ETL, acronimo di Extract, Transform e Load) comporta spesso una notevole quantità di lavoro a seconda della qualità e della struttura dei dati di origine. Lo scenario di utilizzo preparazione dei dati self-service è incentrato sul riutilizzo delle attività di preparazione dei dati da parte degli analisti aziendali. Questo obiettivo è quello di riutilizzare rilocazione del lavoro di preparazione dei dati da Power Query (all'interno di singoli file di Power BI Desktop) a Power Query Online (usando un flusso di dati Power BI). La centralizzazione della logica consente di ottenere una singola fonte di verità e riduce il livello di sforzo richiesto da altri autori di contenuti.

I flussi di dati vengono creati usando Power Query Online in uno dei diversi strumenti: il servizio Power BI, Power Apps o Dynamics 365 Customer Insights. Un flusso di dati creato in Power BI viene definito flusso di dati analitico. I flussi di dati creati in Power Apps possono essere di due tipi: standard o analitico. Questo scenario riguarda solo l'uso di un flusso di dati di Power BI creato e gestito all'interno del servizio Power BI.

Nota

Lo scenario di preparazione dei dati self-service è uno degli scenari di BI self-service. Per un elenco completo degli scenari self-service, vedere l'articolo scenari di utilizzo di Power BI.

Per brevità, alcuni aspetti descritti nell'argomento scenari di collaborazione e distribuzione dei contenuti non sono trattati in questo articolo. Per una copertura completa, leggere prima questi articoli.

Diagramma dello scenario

Il diagramma seguente illustra una panoramica generale delle azioni utente più comuni e dei componenti di Power BI che supportano la preparazione dei dati self-service. L'obiettivo principale è la creazione di un flusso di dati in Power Query Online che diventa un'origine di dati per più modelli semantici. L'obiettivo è che molti modelli semantici sfruttino la preparazione dei dati eseguita una volta dal flusso di dati.

Il diagramma mostra la preparazione dei dati self-service, che riguarda i flussi di dati per centralizzare il lavoro di pulizia e trasformazione dei dati. Gli elementi nel diagramma sono descritti nella tabella seguente.

Suggerimento

È consigliabile scaricare il diagramma dello scenario se si vuole incorporarlo nella presentazione, nella documentazione o nel post di blog oppure stamparlo come poster a parete. Poiché si tratta di un'immagine SVG (Scalable Vector Graphics), è possibile aumentarla o ridurla senza perdita di qualità.

Il diagramma dello scenario illustra le azioni utente, gli strumenti e le funzionalità seguenti:

Articolo Descrizione
Elemento 1. L'autore del flusso di dati sviluppa una raccolta di tabelle all'interno di un flusso di dati di Power BI. Per un flusso di dati destinato al riutilizzo, è comune (ma non necessario) che l'autore appartenga a un team centralizzato che supporta gli utenti oltre i limiti dell'organizzazione (ad esempio IT, BI aziendale o Center of Excellence).
Elemento 2. Il flusso di dati si connette ai dati da una o più origini dati.
Elemento 3. Alcune origini dati possono richiedere un gateway dati locale o un gateway di rete virtuale per l'aggiornamento dei dati, ad esempio quelli che risiedono all'interno di una rete aziendale privata. Questi gateway vengono usati sia per la creazione del flusso di dati in Power Query Online, che è una versione basata sul Web di Power Query, sia per l'aggiornamento del flusso di dati.
Elemento 4. I flussi di dati vengono sviluppati usando Power Query Online. L'interfaccia familiare di Power Query in Power Query Online semplifica la transizione da Power BI Desktop.
Elemento 5. Il flusso di dati viene salvato come elemento in un'area di lavoro dedicata all'archiviazione e alla protezione dei flussi di dati. È necessaria una pianificazione dell'aggiornamento del flusso di dati per mantenere aggiornati i dati (non illustrati nel diagramma dello scenario).
Elemento 6. Il flusso di dati può essere riutilizzato come origine dati dagli autori di contenuti e da altri modelli semantici che potrebbero risiedere in aree di lavoro diverse.
Elemento 7. L'autore di modelli semantici sviluppa un nuovo modello di dati usando Power BI Desktop. L'autore di modelli semantici può usare le funzionalità complete di Power Query in Power BI Desktop. Facoltativamente, possono applicare altri passaggi di query per trasformare ulteriormente i dati del flusso di dati o unire l'output del flusso di dati.
Elemento 8. Quando è pronto, l'autore del modello semantico pubblica il file di Power BI Desktop (con estensione pbix) che contiene il modello di dati nel servizio Power BI. L'aggiornamento per il modello semantico viene gestito separatamente dal flusso di dati (non illustrato nel diagramma dello scenario).
Elemento 9. Altri creatori di modelli semantici self-service possono creare nuovi modelli di dati in Power BI Desktop usando il flusso di dati come origine dati.
Elemento 10. Nel portale di amministrazione gli amministratori di Power BI possono configurare connessioni di Azure per archiviare i dati del flusso di dati nell'account Azure Data Lake Storage Gen2 (ADLS Gen2). Le impostazioni includono l'assegnazione di un account di archiviazione a livello di tenant e l'abilitazione delle autorizzazioni di archiviazione a livello di area di lavoro.
Elemento 11. Gli amministratori di Power BI gestiscono le impostazioni nel portale di amministrazione.
Elemento 12. Per impostazione predefinita, i flussi di dati archiviano i dati usando l'archiviazione interna gestita dal servizio Power BI. Facoltativamente, l'output dei dati dal flusso di dati può essere archiviato nell'account ADLS Gen2 dell'organizzazione. Questo tipo di archiviazione viene talvolta chiamato Bring Your Own Data Lake. Un vantaggio dell'archiviazione dei dati del flusso di dati nel data lake è che è possibile accedervi e usarli da altri strumenti di business intelligence.
Elemento 13. I dati del flusso di dati in ADLS Gen2 vengono archiviati all'interno di un contenitore specifico di Power BI noto come file system. All'interno di questo contenitore esiste una cartella per ogni area di lavoro. Viene creata una sottocartella per ogni flusso di dati, nonché per ogni tabella. Power BI genera uno snapshot ogni volta che i dati del flusso di dati vengono aggiornati. Gli snapshot sono autodescrittivi e comprendono metadati e file di dati.
Elemento 14. Gli amministratori di Azure gestiscono le autorizzazioni per l'account ADLS Gen2 dell'organizzazione.
Elemento 15. Gli amministratori di Power BI sorvegliano e monitorano l'attività nel servizio Power BI.

Suggerimento

È consigliabile esaminare anche lo scenario di utilizzo con preparazione dei dati avanzata. Si basa sui concetti introdotti in questo scenario.

Punti chiave

Di seguito sono riportati alcuni punti chiave da sottolineare relativamente allo scenario di preparazione dei dati self-service.

Flussi di dati

Un flusso di dati comprende una raccolta di tabelle, note anche come entità. Tutto il lavoro per creare un flusso di dati viene eseguito in Power Query Online. È possibile creare flussi di dati in più prodotti, tra cui Power Apps, Dynamics 365 Customer Insights e Power BI.

Nota

Non è possibile creare flussi di dati in un'area di lavoro personale nel servizio Power BI.

Supportare autori di modelli semantici

Il diagramma dello scenario illustra l'uso di un flusso di dati di Power BI per fornire dati preparati ad altri creatori di modelli semantici self-service.

Nota

Il modello semantico usa il flusso di dati come origine dati. Un report non può connettersi direttamente a un flusso di dati.

Ecco alcuni vantaggi dell'uso dei flussi di dati di Power BI:

  • Gli autori di modelli semantici usano la stessa interfaccia familiare di Power Query disponibile in Power BI Desktop.
  • La preparazione dei dati e la logica di trasformazione dei dati definite da un flusso di dati possono essere riutilizzate molte volte perché sono centralizzate.
  • Quando vengono apportate modifiche alla logica di preparazione dei dati al flusso di dati, potrebbe non essere necessario aggiornare i modelli di dati dipendenti. La rimozione o la ridenominazione di colonne o la modifica dei tipi di dati delle colonne richiederanno l'aggiornamento di modelli di dati dipendenti.
  • I dati pre-preparati possono essere resi facilmente disponibili per gli autori di modelli semantici di Power BI. Il riutilizzo è particolarmente utile per le tabelle di uso comune, in particolare per le tabelle delle dimensioni, ad esempio data, cliente e prodotto.
  • Il livello di impegno richiesto dagli autori di modelli semantici è ridotto perché il lavoro di preparazione dei dati è stato separato dal lavoro di modellazione dei dati.
  • Un minor numero di creatori di modelli semantici richiede l'accesso diretto ai sistemi di origine. I sistemi di origine possono essere complessi a livello di esecuzione query e potrebbero richiedere autorizzazioni di accesso specializzate.
  • Il numero di aggiornamenti eseguiti nei sistemi di origine è ridotto perché gli aggiornamenti semantici del modello si connettono ai flussi di dati e non ai sistemi di origine da cui i flussi estraggono i dati.
  • I dati del flusso di dati rappresentano uno snapshot nel tempo e migliorano la coerenza quando vengono usati da molti modelli semantici.
  • Il disaccoppiamento della logica di preparazione dei dati nei flussi di dati può contribuire a migliorare il successo dell'aggiornamento semantico del modello. Se un aggiornamento del flusso di dati ha esito negativo, i modelli semantici verranno aggiornati usando l'ultimo aggiornamento del flusso di dati riuscito.

Suggerimento

Creare tabelle del flusso di dati applicando i principi di progettazione dello schema a stella. Una progettazione dello schema a stella è ideale per la creazione di modelli semantici di Power BI. Inoltre, perfezionare l'output del flusso di dati per applicare nomi descrittivi e usare tipi di dati specifici. Queste tecniche promuovono la coerenza nei modelli semantici dipendenti e consentono di ridurre la quantità di lavoro che gli autori di modelli semantici devono eseguire.

Flessibilità dell'autore di modelli semantici

Quando un autore di modelli semantici si connette a un flusso di dati in Power BI Desktop, non è limitato all'uso dell'output esatto del flusso di dati. Sono ancora disponibili le funzionalità complete di Power Query. Questa funzionalità è utile se sono necessarie operazioni aggiuntive di preparazione dei dati o se i dati richiedono un'ulteriore trasformazione.

Funzionalità avanzate del flusso di dati

Esistono molte tecniche di progettazione, modelli e procedure consigliate per i flussi di dati che possono portarli da self-service a essere enterprise-ready. I flussi di dati in un'area di lavoro con la relativa modalità di licenza impostata su Premium per utente, capacità Premiumo capacità Fabric possono trarre vantaggio da funzionalità avanzate.

Importante

A volte questo articolo si riferisce a Power BI Premium o alle relative sottoscrizioni di capacità (SKU P). Tenere presente che Microsoft sta attualmente consolidando le opzioni di acquisto e ritirando gli SKU di Power BI Premium per capacità. I clienti nuovi ed esistenti devono invece prendere in considerazione l'acquisto di sottoscrizioni con capacità Fabric (SKU F).

Per altre informazioni, vedere Aggiornamento importante disponibile per le licenze Power BI Premium e Domande frequenti su Power BI Premium.

Nota

Una delle funzionalità avanzate è l'aggiornamento incrementale per i flussi di dati. Anche se l'aggiornamento incrementale per modelli semantici è una funzionalità di Power BI Pro, l'aggiornamento incrementale per i flussi di dati è una funzionalità Premium.

Per altre informazioni sulle funzionalità avanzate del flusso di dati, vedere lo scenario di utilizzo preparazione dei dati avanzata.

Aggiornamento del flusso di dati e del modello semantico

Come accennato in precedenza, un flusso di dati è un'origine di dati per i modelli semantici. Nella maggior parte dei casi sono coinvolte più pianificazioni di aggiornamento dati: una per il flusso di dati e una per ogni modello semantico. In alternativa, è possibile usare DirectQuery dal modello semantico al flusso di dati, che è una funzionalità Premium (non illustrata nel diagramma dello scenario).

Azure Data Lake Storage Gen2

In Microsoft Azure, un account ADLS Gen2 è un tipo specifico di account di archiviazione di Azure con lo spazio dei nomi gerarchico abilitato. ADLS Gen2 offre vantaggi in termini di prestazioni, gestione e sicurezza per i carichi di lavoro analitici operativi. Per impostazione predefinita, i flussi di dati di Power BI usano l'archiviazione interna, ovvero un account data lake predefinito gestito dal servizio Power BI. Facoltativamente, le organizzazioni possono usare l'approccio Bring Your Own Data Lake connettendosi all'account ADLS Gen2 dell'organizzazione.

Ecco alcuni vantaggi dell'uso dell'account data lake dell'organizzazione:

  • I dati archiviati da un flusso di dati di Power BI possono (facoltativamente) essere accessibili dal data lake da altri utenti o processi. Questo è utile quando si verifica un riutilizzo del flusso di dati oltre Power BI. Ad esempio, è possibile accedere ai dati da Azure Data Factory.
  • I dati nel data lake possono (facoltativamente) essere gestiti da altri strumenti o sistemi. In questo caso, Power BI potrebbe usare i dati anziché gestirli (operazione non illustrata nel diagramma dello scenario).

Archiviazione a livello di tenant

La sezione Connessioni di Azure del portale di amministrazione include un'impostazione per configurare una connessione a un account ADLS Gen2. La configurazione di questa impostazione abilita l'approccio Bring Your Own Data Lake. Dopo aver configurato, è possibile impostare le aree di lavoro per l'uso dell'account Data Lake.

Importante

L'impostazione di connessioni di Azure non significa che tutti i flussi di dati nel tenant di Power BI vengono archiviati in questo account per impostazione predefinita. Per usare un account di archiviazione esplicito (anziché l'archiviazione interna), ogni area di lavoro deve essere connessa in modo specifico.

È fondamentale impostare le connessioni di Azure dell'area di lavoro prima di creare flussi di dati nell'area di lavoro. Lo stesso account di archiviazione di Azure viene usato per backup di modelli semantici di Power BI.

Archiviazione a livello di area di lavoro

Un amministratore di Power BI può configurare un'impostazione per consentire le autorizzazioni di archiviazione a livello di area di lavoro (nella sezione Connessioni di Azure del portale di amministrazione). Se abilitata, questa impostazione consente agli amministratori dell'area di lavoro di usare un account di archiviazione diverso rispetto a quello definito a livello di tenant. L'abilitazione di questa impostazione è particolarmente utile per le business unit decentralizzate che gestiscono il proprio data lake in Azure.

Nota

L'autorizzazione di archiviazione a livello di area di lavoro nel portale di amministrazione si applica a tutte le aree di lavoro nel tenant di Power BI.

Formato Common Data Model

I dati in un account ADLS Gen2 vengono archiviati nella struttura CDM (Common Data Model). La struttura CDM è un formato di metadati che determina la modalità di archiviazione dello schema autodescrittivo, nonché dei dati. La struttura CDM consente la coerenza semantica in un formato standardizzato per la condivisione dei dati in numerose applicazioni (non illustrato nel diagramma dello scenario).

Pubblicare in aree di lavoro separate

Esistono diversi vantaggi per la pubblicazione di un flusso di dati in un'area di lavoro separata dalla posizione in cui vengono archiviati i modelli semantici dipendenti. Un vantaggio è la chiarezza su chi è responsabile della gestione dei tipi di contenuto (se si hanno persone diverse che gestiscono responsabilità diverse). Un altro vantaggio è che è possibile assegnare autorizzazioni specifiche per l'area di lavoro per ogni tipo di contenuto.

Nota

Non è possibile creare flussi di dati in un'area di lavoro personale nel servizio Power BI.

Lo scenario di preparazione dei dati avanzata descrive come configurare più aree di lavoro per offrire una maggiore flessibilità quando si supportano gli autori self-service a livello aziendale.

Configurazione del gateway

In genere, è necessario un gateway dati locale per la connessione a origini dati che risiedono all'interno di una rete organizzativa privata o di una rete virtuale.

Un gateway dati è necessario quando:

  • Creazione di un flusso di dati in Power Query Online che si connette a dati aziendali privati.
  • Aggiornamento di un flusso di dati che si connette ai dati aziendali privati.

Suggerimento

I flussi di dati richiedono un gateway dati centralizzato in modalità standard. Un gateway in modalità personale non è supportato quando si utilizzano flussi di dati.

Panoramica del sistema

Il log attività registra le attività utente che si verificano nel servizio Power BI. Gli amministratori di Power BI possono usare i dati del log attività raccolti per eseguire controllo per aiutarli a comprendere i modelli di utilizzo e l'adozione. Il log attività è utile anche per supportare le attività di governance, i controlli di sicurezza e i requisiti di conformità. Con uno scenario di preparazione dei dati self-service, è particolarmente utile tenere traccia dell'utilizzo dei flussi di dati.

Nell'articolo successivo della serie vengono fornite informazioni sullo scenario di utilizzo di preparazione avanzata dei dati.