Applicare informazioni dettagliate in Power BI per individuare la posizione in cui le distribuzioni variano
SI APPLICA A: Power BI Desktop
Servizio Power BI
Negli oggetti visivi è spesso visibile un punto dati ma non è possibile determinare se la distribuzione differisce per le diverse categorie. Le informazioni dettagliate in Power BI consentono di determinarlo con soli pochi clic del mouse.
Si consideri l'oggetto visivo seguente che visualizza le Vendite totali per Nome Paese. La maggior parte delle vendite proviene dagli Stati Uniti per un totale del 57% delle vendite totali con contributi minori provenienti da altri paesi/aree. In casi come questi è spesso interessante determinare se la stessa distribuzione è presente per le diverse sottopopolazioni. Ad esempio, è la stessa per tutti gli anni, per tutti i canali di vendita e tutte le categorie di prodotti? Sebbene sia possibile applicare filtri diversi e confrontare visivamente i risultati, queste operazioni possono richiedere molto tempo ed essere soggette a errori.
È possibile richiedere a Power BI di individuare dove la distribuzione è diversa e ottenere un'analisi dei dati rapida, automatica e dettagliata. Fare clic con il pulsante destro del mouse su un punto dati e selezionare Analizza>Scopri le differenze in questa distribuzione per visualizzare informazioni dettagliate in una finestra facile da usare.
Nell'esempio l'analisi automatica mostra che la percentuale delle vendite per le Biciclette da turismo negli Stati Uniti e in Canada è più bassa rispetto alla percentuale degli altri paesi/aree.
Usa informazioni dettagliate
Per usare le informazioni dettagliate per trovare dove le distribuzioni visualizzate nei grafici sono diverse, è sufficiente fare clic con il pulsante destro del mouse su qualsiasi punto dati o sull'oggetto visivo nel suo complesso. Selezionare quindi Analizza>Scopri le differenze in questa distribuzione.
Power BI esegue gli algoritmi di Machine Learning sui dati. Popola quindi una finestra con un oggetto visivo e una descrizione delle categorie (colonne) e quali valori di tali categorie comportano la distribuzione più significativamente diversa. Le informazioni dettagliate sono visualizzate sotto forma di istogramma, come mostra l'immagine seguente:
I valori con il filtro selezionato applicato hanno il colore predefinito. I valori complessivi, come appaiono nell'oggetto visivo originale, sono visualizzati in grigio per facilitare il confronto. È possibile includere fino a tre filtri diversi (nell'esempio Bici da turismo, Mountain Bike, Bici da strada) e scegliere i filtri selezionando un punto dati oppure facendo clic e premendo CTRL per la selezione multipla.
Per le misure aggiuntive semplici, ad esempio Total Sales (Vendite totali) nell'esempio, il confronto è basato su valori relativi anziché assoluti. Le vendite per Touring Bikes sono inferiori alle vendite complessive per tutte le categorie; tuttavia, l'oggetto visivo, per impostazione predefinita, usa un doppio asse per consentire il confronto tra la percentuale di vendite tra paesi/aree geografiche diverse. Questo è per Touring Bikes a confronto con tutte le categorie di biciclette. Attivando o disattivando l'interruttore sotto l'oggetto visivo è possibile visualizzare i due valori sullo stesso asse e confrontare in modo facile i valori assoluti, come mostra l'immagine seguente:
Il testo descrittivo indica anche il livello di importanza che può essere collegato a un valore di filtro, dato il numero di record corrispondenti al filtro. Nell'esempio si nota che la distribuzione di Bici da turismo può essere diversa, ma rappresenta solo il 16,6% dei record.
Le icone del pollice in su e del pollice in giù nella parte superiore della pagina consentono di fornire commenti e suggerimenti sull'oggetto visivo e sulla funzionalità. In questo modo, tuttavia, non esegue il training dell'algoritmo per influenzare i risultati restituiti al successivo uso della funzionalità.
È importante tenere presente che il pulsante + nella parte superiore dell'oggetto visivo consente di aggiungere l'oggetto visivo selezionato al report, come se l'oggetto visivo fosse stato creato manualmente. È quindi possibile formattare o modificare l'oggetto visivo aggiunto proprio come qualsiasi altro oggetto visivo del report. È possibile aggiungere un oggetto visivo informazioni dettagliate selezionato solo quando si modifica un report in Power BI.
È possibile usare informazioni dettagliate quando il report è in modalità di lettura o modifica. In questo modo è versatile sia per l'analisi dei dati che per la creazione di oggetti visivi che è possibile aggiungere ai report.
Dettagli dei risultati restituiti
Si può presupporre che l'algoritmo prenda in considerazione tutte le altre colonne del modello e tutti i valori delle colonne e li applichi come filtri dell'oggetto visivo originale. L'algoritmo trova quindi quale di questi valori di filtro produce il risultato più diverso dall'originale.
È possibile che a questo punto ci si interroghi sul significato della differenza. Si supponga, ad esempio, che la differenza complessiva delle vendite tra Stati Uniti e Canada sia la seguente:
Paese/area geografica | Vendite ($ mio) |
---|---|
USA | 15 |
Canada | 5 |
Per una specifica categoria di prodotti "Bici da strada", la differenza delle vendite potrebbe essere:
Paese/area geografica | Vendite ($ mio) |
---|---|
USA | 3 |
Canada | 1 |
Sebbene i numeri siano diversi in ciascuna di queste tabelle, i valori relativi degli Stati Uniti rispetto al Canada sono uguali: 75% e 25% complessive e per Bici da strada. Pertanto, questi non sono considerati diversi. Per questo tipo di misure aggiuntive semplici, l'algoritmo ricerca le differenze nel valore relativo.
Al contrario, considerare una misura come il margine calcolato come profitto/costo. Se i margini complessivi per gli Stati Uniti e il Canada sono i seguenti:
Paese/area geografica | Margine (%) |
---|---|
USA | 15 |
Canada | 5 |
Per una specifica categoria di prodotti "Bici da strada", la differenza delle vendite potrebbe essere:
Paese/area geografica | Margine (%) |
---|---|
USA | 3 |
Canada | 1 |
Considerata la natura di questo tipo di misure, è interessante notare che questa è diversa. Per le misure non aggiuntive come questo esempio di margine, l'algoritmo ricerca le differenze nel valore assoluto.
Gli oggetti visivi visualizzati hanno quindi lo scopo di illustrare le differenze individuate tra la distribuzione complessiva, come appare nell'oggetto visivo originale, e il valore a cui è applicato un filtro specifico.
Per le misure aggiuntive, come Vendite nell'esempio precedente, viene usato un istogramma e un grafico a linee. In questo caso, l'uso di un asse doppio con la scalabilità appropriata è tale che i valori relativi possono essere confrontati. Le colonne mostrano il valore con il filtro applicato e la riga mostra il valore complessivo. L'asse delle colonne si trova a sinistra e l'asse della linea è a destra, come di consueto. La linea è visualizzata con rientri, è tratteggiata e ha un riempimento di colore grigio. Nell'esempio precedente se il valore massimo dell'asse della colonna è 4 e il valore massimo dell'asse della linea è 20, è possibile confrontare facilmente i valori relativi degli Stati Uniti rispetto al Canada per i valori filtrati e complessivi.
Analogamente, per le misure non aggiuntive, come il margine nell'esempio precedente, vengono usati un istogramma e un grafico a linee dove l'uso di un singolo asse consente di confrontare facilmente i valori assoluti. La linea con riempimento grigio mostra il valore complessivo. Nel confronto di valori effettivi o relativi, l'individuazione del grado di differenza di due distribuzioni non consiste semplicemente nel calcolo della differenza tra i valori. Ad esempio:
Quando la dimensione della popolazione è presa in considerazione, una differenza è meno significativa statisticamente e meno interessante se applicata a una percentuale più piccola della popolazione complessiva. Ad esempio, la distribuzione delle vendite in paesi/aree geografiche potrebbe essere diversa per un determinato prodotto. Questo non sarebbe interessante se ci fossero migliaia di prodotti, perché in questo modo il particolare prodotto rappresenterebbe solo una piccola percentuale delle vendite complessive.
Le differenze per le categorie in cui i valori originali erano elevati o vicini allo zero vengono ponderate con un valore superiore a quelle di altre categorie. Ad esempio, se il valore complessivo di un paese o area contribuisce solo all'1% delle vendite mentre per un tipo di prodotto specifico contribuisce al 6%, ciò potrebbe essere statisticamente significativo e quindi più interessante rispetto a un paese o area il cui contributo è passato dal 50% al 55%.
Varie funzioni euristiche selezionano i risultati più significativi, ad esempio considerando altre relazioni tra i dati.
Dopo aver esaminato le diverse colonne e i valori di ciascuna colonna, vengono scelti i valori che offrono le differenze maggiori. Per facilitare la comprensione, i valori sono restituiti e raggruppati per colonna, con la colonna i cui valori indicano la differenza maggiore elencata per prima. Per ogni colonna vengono visualizzati un massimo di tre valori o meno se sono presenti meno di tre valori con grande impatto o se alcuni valori hanno un impatto di gran lunga maggiore rispetto ad altri.
Poiché non tutte le colonne del modello vengono esaminate necessariamente nel tempo disponibile, non è garantito che vengano visualizzati le colonne e i valori con maggiore impatto. Tuttavia, diverse funzioni euristiche garantiscono che le colonne più probabili vengano esaminate per prime. Si supponga ad esempio che dopo aver esaminato tutte le colonne, si determini che le colonne o i valori seguenti hanno l'impatto maggiore sulla distribuzione, in ordine di impatto:
Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store
L'ordine delle colonne sarà il seguente:
Sottocategoria: Touring Bikes, Mountain Bikes, Road Bikes (ne vengono visualizzate solo tre, con il testo che include "...amongst others" per indicare che più di tre hanno un impatto significativo)
Channel = Direct (viene elencato solo Direct, se il livello di impatto era superiore a quello di Store)
Considerazioni e limitazioni
L'elenco seguente è una raccolta degli scenari attualmente non supportati per le informazioni dettagliate:
- Filtri PrimiN
- Filtri per le misure
- Misure non numeriche
- Uso di "Mostra valore come"
- Misure filtrate: calcoli a livello visivo ai quali viene applicato un filtro specifico, ad esempio Vendite totali per la Francia, e che vengono usati in alcuni oggetti visivi creati dalla funzionalità informazioni dettagliate
Neppure i tipi di modelli e le origini dati seguenti sono attualmente supportati per le informazioni dettagliate:
- DirectQuery
- Live Connect
- Reporting Services locale
- Incorporamento
Contenuto correlato
Per altre informazioni, vedi: