Použití přehledů v Power BI ke zjištění, kde se distribuce liší
PLATÍ PRO: Power BI Desktop
služba Power BI
Vevizuálch S přehledy v Power BI můžete zjistit několika kliknutími.
Podívejte se na následující vizuál, který zobrazuje TotalSales by CountryName. Většina prodejů pochází z USA, přičemž započítávání 57 % všech prodejů s nižšími příspěvky pocházejícími z jiných zemí/oblastí. V takových případech je často zajímavé prozkoumat, jestli by stejné rozdělení bylo vidět u různých dílčích naplnění. Je to například stejné pro všechny roky, všechny prodejní kanály a všechny kategorie produktů? I když můžete použít různé filtry a porovnat výsledky vizuálně, může to být časově náročné a náchylné k chybám.
Power BI vám umožní zjistit, kde se distribuce liší, a získat rychlou, automatizovanou a přehlednou analýzu dat. Klikněte pravým tlačítkem myši na datový bod a vyberte Analyzovat>najít, kde se tato distribuce liší, a přehled se vám doručí v snadno použitelném okně.
V tomto příkladu automatizovaná analýza ukazuje, že podíl prodeje cestovních kol v USA a Kanadě je nižší než podíl pocházející z jiných zemí/oblastí.
Použití přehledů
Pokud chcete pomocí přehledů zjistit, kde se distribuce v grafech liší, stačí kliknout pravým tlačítkem myši na libovolný datový bod nebo na vizuál jako celek. Pak vyberte Analyzovat>najít, kde se tato distribuce liší.
Power BI spouští své algoritmy strojového učení nad daty. Potom naplní okno vizuálem a popisem kategorií (sloupců) a hodnot těchto kategorií vede k nejvýraznějšímu rozdělení. Přehledy se poskytují jako sloupcový graf, jak je znázorněno na následujícím obrázku:
Hodnoty s použitým vybraným filtrem mají výchozí barvu. Celkové hodnoty, jak je vidět na původním počátečním vizuálu, jsou pro snadné porovnání zobrazené šedě. V tomto příkladu můžou být zahrnuty až tři různé filtry (cestovní kola, horská kola a silniční kola) a různé filtry můžete vybrat výběrem datového bodu nebo stisknutím klávesy Ctrl a vybrat více.
U jednoduchých doplňkových měr, jako je total sales v tomto příkladu, je porovnání založeno na relativních, nikoli absolutních hodnotách. Prodej cestovních kol je nižší než celkový prodej pro všechny kategorie; Vizuál ale ve výchozím nastavení používá duální osu, která umožňuje porovnání podílu prodeje v různých zemích/oblastech. Toto je pro touring bikes versus všechny kategorie kol. Přepnutí přepínače pod vizuálem umožňuje zobrazení dvou hodnot na stejné ose, což umožňuje snadné porovnání absolutních hodnot, jak je znázorněno na následujícím obrázku:
Popisný text také označuje úroveň důležitosti, která může být připojena k hodnotě filtru vzhledem k počtu záznamů, které odpovídají filtru. V tomto příkladu vidíte, že zatímco distribuce cestovních kol může být jiná, představují pouze 16,6 % záznamů.
Ikony palce nahoru a palce dolů v horní části stránky existují, abyste mohli poskytnout zpětnou vazbu k vizuálu a funkci. Tím se ale algoritmus nenatrénuje tak, aby ovlivnil výsledky vrácené při příštím použití funkce.
Důležité je, že + tlačítko v horní části vizuálu umožňuje přidat vybraný vizuál do sestavy, jako kdybyste vizuál vytvořili ručně. Přidaný vizuál pak můžete naformátovat nebo upravit stejně jako jakýkoli jiný vizuál v sestavě. Vybraný vizuál přehledu můžete přidat jenom při úpravách sestavy v Power BI.
Přehledy můžete použít, když je sestava v režimu čtení nebo úprav. Díky tomu je univerzální pro analýzu dat i pro vytváření vizuálů, které můžete přidat do sestav.
Podrobnosti o vrácených výsledcích
Algoritmus si můžete představit jako přebírání všech ostatních sloupců v modelu a pro všechny hodnoty těchto sloupců je použijete jako filtry na původní vizuál. Algoritmus pak najde, které z těchto hodnot filtru vytvoří nejrozlivější výsledek od původního filtru.
Pravděpodobně se divíte, co to znamená. Řekněme například, že celkové rozdělení prodeje mezi USA a Kanadou je následující:
Země/oblast | Sales ($M) |
---|---|
USA | 15 |
Kanada | 5 |
Pro určitou kategorii produktu "Silniční kolo" pak může být rozdělení prodeje:
Země/oblast | Sales ($M) |
---|---|
USA | 3 |
Kanada | 0 |
I když se čísla v každé z těchto tabulek liší, relativní hodnoty mezi USA a Kanadou jsou stejné: 75 % a 25 % celkově a pro silniční kola. Proto se nepovažují za jiné. U jednoduchých doplňkových měr, jako je tato, algoritmus hledá rozdíly v relativní hodnotě.
Naproti tomu zvažte míru, jako je marže vypočítaná jako Profit/Cost. Pokud celkové marže pro USA a Kanadu byly následující:
Země/oblast | Margin (%) |
---|---|
USA | 15 |
Kanada | 5 |
Pro určitou kategorii produktu "Silniční kolo" pak může být rozdělení prodeje:
Země/oblast | Margin (%) |
---|---|
USA | 3 |
Kanada | 0 |
Vzhledem k povaze takových opatření je to zajímavé. U nedatných měr, jako je například tento příklad okrajů, hledá algoritmus rozdíly v absolutní hodnotě.
Zobrazené vizuály jsou tedy určeny k zobrazení rozdílů mezi celkovým rozdělením, jak je vidět v původním vizuálu, a hodnotou s použitým konkrétním filtrem.
U doplňkových měr, například Prodej v předchozím příkladu, se použije sloupcový a spojnicový graf. Tam je použití duální osy s odpovídajícím měřítkem takové, že relativní hodnoty lze porovnat. Sloupce zobrazují hodnotu s použitým filtrem a řádek zobrazuje celkovou hodnotu. Osa sloupce je vlevo a osa čáry je vpravo, jak je normální. Čára se zobrazuje ve stupňovitém stylu s přerušovanou čárou vyplněnou šedou. Pokud je v předchozím příkladu maximální hodnota osy sloupce 4 a maximální hodnota osy čáry je 20, pak by bylo možné snadno porovnat relativní hodnoty mezi USA a Kanadou pro filtrované a celkové hodnoty.
Podobně platí, že u nedatných měr, jako je okraj v předchozím příkladu, se používá sloupcový a spojnicový graf, kde použití jedné osy znamená, že absolutní hodnoty lze snadno porovnat. Čára vyplněná šedou zobrazuje celkovou hodnotu. Ať už porovnávání skutečných nebo relativních čísel, určení míry, s jakou jsou dvě rozdělení odlišná, není jednoduše otázkou výpočtu rozdílu v hodnotách. Příklad:
Při faktoru velikosti základního souboru je rozdíl méně statisticky významný a méně zajímavý, pokud se vztahuje na menší podíl celkové populace. Například distribuce prodeje napříč zeměmi nebo oblastmi se může u konkrétního produktu lišit. To by nebylo zajímavé, kdyby existovaly tisíce produktů, takže konkrétní produkt by měl vyčítané jenom malé procento celkového prodeje.
Rozdíly v těchto kategoriích, ve kterých byly původní hodnoty vysoké nebo blízké nule, jsou vážené vyšší než ostatní. Pokud například země nebo oblast celkově přispívá pouze 1 % prodeje, ale pro určitý typ produktu přispívá 6 %, je to statisticky významnější, a proto zajímavější než země nebo oblast, jejichž příspěvek se změnil z 50 % na 55 %.
Různé heuristiky vyberou nejvýstižnější výsledky, například zvážením jiných vztahů mezi daty.
Po prozkoumání různých sloupcůach Pro usnadnění porozumění se pak jedná o výstup a seskupení podle sloupce se sloupcem, jehož hodnoty poskytují největší rozdíl uvedený jako první. V každém sloupci se zobrazují až tři hodnoty, ale méně se může zobrazit buď v případě, že došlo k menšímu než třem hodnotám, které mají velký efekt, nebo pokud některé hodnoty mají mnohem větší dopad než jiné.
Nemusí se nutně jednat o případ, kdy budou všechny sloupce v modelu prozkoumány v dostupném čase, takže není zaručeno, že se zobrazí nejvýraznější sloupce a hodnoty. Různé heuristiky ale zajišťují, aby se nejprve prozkoumaly nejpravděpodobnější sloupce. Řekněme například, že po prozkoumání všech sloupců je zjištěno, že následující sloupce/hodnoty mají největší dopad na distribuci, od největšího dopadu po nejmenší:
Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store
Výstup by se zobrazil v pořadí sloupců následujícím způsobem:
Podkategorie: Touring Bikes, Mountain Bikes, Road Bikes (pouze tři uvedené, s textem včetně "... mimo jiné", aby bylo uvedeno, že více než tři mají významný dopad)
Channel = Direct (pouze Direct, pokud jeho úroveň dopadu byla větší než Store)
Úvahy a omezení
Následující seznam obsahuje kolekci aktuálně nepodporovaných scénářů pro přehledy:
- Filtry topn
- Filtry měr
- Nečíselné míry
- Použití možnosti Zobrazit hodnotu jako
- Filtrované míry – filtrované míry jsou výpočty na úrovni vizuálů s použitým konkrétním filtrem, například Celkový prodej pro Francii a používají se u některých vizuálů vytvořených funkcí přehledů.
Přehledy navíc v současné době nepodporují následující typy modelů a zdroje dat:
- DirectQuery
- Živé připojení
- Místní služba Reporting Services
- Vkládání
Související obsah
Další informace naleznete v tématu: