Udostępnij za pośrednictwem


Próbkowanie o wysokiej gęstości na wykresach punktowych usługi Power BI

Algorytm próbkowania usługi Power BI poprawia sposób przedstawiania danych o wysokiej gęstości na wykresach punktowych.

Możesz na przykład utworzyć wykres punktowy na podstawie aktywności sprzedaży organizacji, a każdy sklep ma dziesiątki tysięcy punktów danych każdego roku. Wykres punktowy takich informacji mógłby próbkować dane z znaczącej reprezentacji tych danych, aby zilustrować, jak sprzedaż miała miejsce w czasie. Szczegóły próbkowania danych o wysokiej gęstości opisano w tym artykule.

Screenshot of a scatter chart, showing the high-density sampling data.

Uwaga

Algorytm próbkowania o wysokiej gęstości opisany w tym artykule jest dostępny na wykresach punktowych dla programu Power BI Desktop i usługa Power BI.

Jak działają wykresy punktowe o wysokiej gęstości

Wcześniej usługa Power BI wybrała kolekcję przykładowych punktów danych w pełnym zakresie danych bazowych w sposób deterministyczny w celu utworzenia wykresu punktowego. W szczególności usługa Power BI wybierze pierwsze i ostatnie wiersze danych w serii wykresów punktowych, a następnie podzieli pozostałe wiersze równomiernie, tak aby na wykresie punktowym wykreśliło 3500 punktów danych. Jeśli na przykład próbka zawiera 35 000 wierszy, pierwsze i ostatnie wiersze zostaną wybrane do wykreślenia, co dziesiąty wiersz zostanie również wykreślony (35 000 / 10 = co dziesiąty wiersz = 3500 punktów danych). Wcześniej wartości null lub punkty, których nie można wykreślić, takie jak wartości tekstowe, w serii danych nie były wyświetlane, a tym samym nie były brane pod uwagę podczas generowania wizualizacji. W przypadku takiego próbkowania postrzegana gęstość wykresu punktowego była również oparta na reprezentatywnych punktach danych, więc implikowana gęstość wizualna była okolicznością punktów próbkowanych, a nie pełną kolekcją danych bazowych.

Po włączeniu próbkowania o wysokiej gęstości usługa Power BI implementuje algorytm eliminujący nakładające się punkty i zapewnia, że punkty na wizualizacji mogą być osiągane podczas interakcji z wizualizacją. Algorytm zapewnia również, że wszystkie punkty w zestawie danych są reprezentowane w wizualizacji, zapewniając kontekst znaczenia wybranych punktów, a nie tylko kreślenie reprezentatywnej próbki.

Zgodnie z definicją dane o wysokiej gęstości są próbkowane w celu tworzenia wizualizacji reagujących na interakcyjność. Zbyt wiele punktów danych w wizualizacji może spowolnić działanie i obniżyć widoczność trendów. Sposób próbkowania danych powoduje utworzenie algorytmu próbkowania w celu zapewnienia najlepszego środowiska wizualizacji i upewnienia się, że wszystkie dane są reprezentowane. W usłudze Power BI algorytm został ulepszony w celu zapewnienia najlepszej kombinacji czasu odpowiedzi, reprezentacji i jasnego zachowania ważnych punktów w ogólnym zestawie danych.

Uwaga

Wykresy punktowe korzystające z algorytmu próbkowania o wysokiej gęstości najlepiej wykreślić na wizualizacjach kwadratowych, podobnie jak w przypadku wszystkich wykresów punktowych.

Jak działa algorytm próbkowania wykresu punktowego

Algorytm próbkowania o wysokiej gęstości dla wykresów punktowych wykorzystuje metody, które skuteczniej przechwytują i reprezentują dane bazowe oraz eliminują nakładające się punkty. Algorytm rozpoczyna się od małego promienia dla każdego punktu danych, który jest rozmiarem okręgu wizualnego dla danego punktu wizualizacji. Następnie zwiększa promień wszystkich punktów danych. Gdy co najmniej dwa punkty danych nakładają się na siebie, jeden okrąg zwiększonego rozmiaru promienia reprezentuje te nakładające się punkty danych. Algorytm nadal zwiększa promień punktów danych, dopóki ta wartość promienia nie spowoduje wyświetlenia rozsądnej liczby punktów danych (3500) na wykresie punktowym.

Metody w tym algorytmie zapewniają, że wartości odstające są reprezentowane w wynikowej wizualizacji. Algorytm uwzględnia skalę podczas określania nakładania się, tak aby skale wykładnicze zostały zwizualizowane z wiernością bazowych punktów wizualizacji.

Algorytm zachowuje również ogólny kształt wykresu punktowego.

Uwaga

W przypadku korzystania z algorytmu próbkowania o wysokiej gęstości dla wykresów punktowych dokładna dystrybucja danych jest celem, a nie implikowanej gęstości wizualnej. Możesz na przykład zobaczyć wykres punktowy z dużą liczbą okręgów nakładających się (gęstość) w określonym obszarze i wyobrazić sobie, że wiele punktów danych musi być tam klastrowanych. Ponieważ algorytm próbkowania o wysokiej gęstości może używać jednego okręgu do reprezentowania wielu punktów danych, takie implikowane gęstości wizualne lub "klastrowanie" nie będzie wyświetlane. Aby uzyskać więcej szczegółów w danym obszarze, możesz użyć fragmentatorów do powiększenia.

Ponadto punkty danych, których nie można wykreślić, takie jak wartości null lub wartości tekstowe, są ignorowane, więc wybrano inną wartość, którą można wykreślić. Dzięki temu zachowany jest prawdziwy kształt wykresu punktowego.

Gdy używany jest standardowy algorytm wykresów punktowych

Istnieją okoliczności, w których nie można zastosować próbkowania o wysokiej gęstości do wykresu punktowego i jest używany oryginalny algorytm. Te okoliczności są następujące:

  • Jeśli klikniesz prawym przyciskiem myszy wartość w obszarze Wartości i ustawisz ją na Pokaż elementy bez danych z menu, wykres punktowy powróci do oryginalnego algorytmu.

    Screenshot of the Visualization menu, showing the Values pane with Show items with no data selection.

  • Wszystkie wartości w polu Oś odtwarzania spowodują przywrócenie oryginalnego algorytmu wykresu punktowego.

  • Jeśli na wykresie punktowym brakuje osi X i Y, wykres zostanie przywrócony do oryginalnego algorytmu.

  • Użycie linii Ratio w okienku Analiza powoduje przywrócenie oryginalnego algorytmu na wykresie.

    Screenshot of the Visualization menu, showing a pointer to the Analytics pane and Ratio line.

Jak włączyć próbkowanie o wysokiej gęstości dla wykresu punktowego

Aby przełączyć próbkowanie o wysokiej gęstości na Wł., wybierz wykres punktowy, przejdź do okienka Formatowanie wizualizacji, rozwiń kartę Ogólne i w dolnej części tej karty przesuń suwak przełączania próbkowania o wysokiej gęstości do pozycji Włączone.

Screenshot of the Visualization menu, showing a pointer to the Format visual pane, General card, and High Density Sampling toggle slider.

Uwaga

Po włączeniu przełącznika usługa Power BI podejmie próbę użycia algorytmu próbkowania o wysokiej gęstości, jeśli jest to możliwe. Gdy nie można użyć algorytmu, takiego jak umieszczenie wartości na osi odtwarzania , przełącznik pozostaje włączony , mimo że wykres został przywrócony do algorytmu standardowego. Jeśli następnie usuniesz wartość z osi odtwarzania lub warunki zmienią się, aby umożliwić korzystanie z algorytmu próbkowania o wysokiej gęstości, wykres automatycznie użyje próbkowania o wysokiej gęstości dla tego wykresu, ponieważ funkcja jest aktywna.

Uwaga

Punkty danych są grupowane lub wybierane przez indeks. Posiadanie legendy nie ma wpływu na próbkowanie dla algorytmu. Ma to wpływ tylko na kolejność wizualizacji.

Rozważania i ograniczenia

Algorytm próbkowania o wysokiej gęstości jest ważnym ulepszeniem usługi Power BI. Jednak algorytm próbkowania o wysokiej gęstości działa tylko z połączeniami na żywo z modelami opartymi na usługa Power BI, zaimportowanymi modelami lub trybem DirectQuery.