Wprowadzenie do optymalizowania wydajności
Optymalizacja wydajności, znana również jako dostrajanie wydajności, obejmuje wprowadzanie zmian w bieżącym stanie modelu semantycznego, dzięki czemu działa wydajniej. Zasadniczo, gdy model semantyczny jest zoptymalizowany, działa lepiej.
Może się okazać, że w przypadku raportu, który działa dobrze w środowisku testowym i programistycznym, po wdrożeniu w środowisku produkcyjnym w celu udostępnienia do szerszego użycia, pojawiają się problemy z wydajnością. Z perspektywy użytkownika raportu niska wydajność objawia się dłuższym czasem ładowania stron raportu i aktualizowania wizualizacji. Ta niska wydajność skutkuje negatywnym doświadczeniem użytkownika.
Jako analityk danych będziesz poświęcać około 90 procent czasu pracy z danymi, a dziewięć razy na dziesięć, niska wydajność jest bezpośrednim wynikiem złego modelu semantycznego, złych wyrażeń analizy danych (DAX) lub kombinacji tych dwóch. Proces projektowania modelu semantycznego pod kątem wydajności może być żmudny i często niedoceniany. Jeśli jednak rozwiążesz problemy z wydajnością podczas programowania, będziesz mieć niezawodny model semantyczny usługi Power BI, który zwróci lepszą wydajność raportowania i bardziej pozytywne środowisko użytkownika. Ostatecznie będziesz także w stanie utrzymać zoptymalizowaną wydajność. Wraz ze wzrostem rozmiaru danych w organizacji rośnie, a jej model semantyczny staje się bardziej złożony. Dzięki wczesnej optymalizacji modelu semantycznego można ograniczyć negatywny wpływ tego wzrostu na wydajność modelu semantycznego.
Mniejszy model semantyczny używa mniejszej ilości zasobów (pamięci) i zapewnia szybsze odświeżanie danych, obliczenia i renderowanie wizualizacji w raportach. W związku z tym proces optymalizacji wydajności polega na zminimalizowaniu rozmiaru modelu semantycznego i najwydajniejszym wykorzystaniu danych w modelu, w tym:
Upewnienie się, że są używane poprawne typy danych.
Usuwanie niepotrzebnych kolumn i wierszy.
Unikanie powtarzających się wartości.
Zamienianie kolumn liczbowych na miary.
Zmniejszanie kardynalności.
Analizowanie metadanych modelu.
Podsumowywanie danych, gdy jest to możliwe.
W tym module przedstawisz kroki, procesy i pojęcia niezbędne do zoptymalizowania modelu semantycznego pod kątem wydajności na poziomie przedsiębiorstwa. Należy jednak pamiętać, że chociaż podstawowe wskazówki dotyczące wydajności i najlepszych rozwiązań w usłudze Power BI prowadzą Cię przez długi czas, aby zoptymalizować model semantyczny pod kątem wydajności zapytań, prawdopodobnie będziesz musiał współpracować z inżynierem danych, aby napędzać model semantyczny optymalizowanie w źródłowych źródłach danych.
Załóżmy na przykład, że pracujesz jako deweloper usługi Power BI firmy Microsoft dla organizacji Tailwind Traders. Masz zadanie przejrzenia modelu semantycznego, który został utworzony kilka lat temu przez innego dewelopera, osobę, która od tego czasu opuściła organizację.
Model semantyczny tworzy raport, który otrzymał negatywną opinię od użytkowników. Użytkownicy są zadowoleni z wyników widocznych w raporcie, ale nie są zadowoleni z wydajności raportu. Ładowanie stron w raporcie trwa zbyt długo, a tabele nie są odświeżane wystarczająco szybko, gdy wprowadzane są pewne wybory. Oprócz tej opinii zespół IT podkreślił, że rozmiar pliku tego konkretnego modelu semantycznego jest zbyt duży i obciąża zasoby organizacji.
Należy przejrzeć model semantyczny, aby zidentyfikować główną przyczynę problemów z wydajnością i wprowadzić zmiany w celu zoptymalizowania wydajności.
Po ukończeniu tego modułu możesz wykonywać następujące czynności:
Przeglądanie wydajności miar, relacji i wizualizacji.
Zwiększanie wydajności i rozwiązywanie problemów przy użyciu zmiennych.
Zwiększanie wydajności za pomocą obniżania poziomów kardynalności.
Optymalizowanie modeli DirectQuery za pomocą magazynu na poziomie tabeli.
Tworzenie agregacji i zarządzanie nimi.