Najlepsze rozwiązania dotyczące ponownego korzystania z przepływów danych w środowiskach i obszarach roboczych
W tym artykule omówiono kolekcję najlepszych rozwiązań dotyczących efektywnego i wydajnego ponownego korzystania z przepływów danych. Przeczytaj ten artykuł, aby uniknąć błędów projektowych i potencjalnych problemów z wydajnością podczas opracowywania przepływów danych do ponownego użycia.
Oddziel przepływy przekształcania danych od przepływów przygotowania/wyodrębniania danych.
Jeśli przepływ danych wykonuje wszystkie akcje, trudno jest ponownie użyć swoich tabel w innych przepływach danych lub w innych celach. Najlepsze przepływy danych do ponownego użycia to te przepływy danych, które wykonują tylko kilka akcji. Tworzenie przepływów danych, które specjalizują się w jednym konkretnym zadaniu, jest jednym z najlepszych sposobów ich ponownego użycia. Jeśli masz zestaw przepływów danych, których używasz jako przejściowych przepływów danych, ich jedyną akcją jest wyodrębnienie as-is danych z systemu źródłowego. Te przepływy danych można używać ponownie w wielu innych przepływach danych.
Jeśli masz przepływy danych przekształcania danych, możesz podzielić je na przepływy danych, które wykonują typowe przekształcenia. Każdy przepływ danych może wykonać tylko kilka akcji. Kilka działań na przepływ danych zapewnia, że dane wyjściowe tego przepływu mogą być używane przez inne przepływy danych.
Obraz z danymi wyodrębnianymi ze źródła danych do przejściowych przepływów danych, w których tabele są przechowywane w usłudze Dataverse lub Azure Data Lake Storage. Następnie dane są przenoszone do przepływów przekształcania danych, w których dane są przekształcane w strukturę magazynu danych. Na koniec dane są ładowane do modelu semantycznego usługi Power BI.
Korzystanie z wielu obszarów roboczych
Każdy obszar roboczy (lub środowisko) jest dostępny tylko dla członków tego obszaru roboczego. Jeśli tworzysz wszystkie przepływy danych w jednym obszarze roboczym, minimalizujesz ponowne użycie przepływów danych. Możesz mieć pewne ogólne obszary robocze dla przepływów danych, które przetwarzają tabele dla całej firmy. Możesz także mieć obszar roboczy do przepływów danych, aby przetwarzać tabele w różnych działach. Ponadto możesz mieć niektóre obszary robocze dla przepływów danych, które mają być używane tylko w określonych działach.
Ustawianie prawidłowych poziomów dostępu w obszarach roboczych
Aby udzielić dostępu do przepływów danych w innych przestrzeniach roboczych, aby korzystać z danych wyjściowych przepływu danych w przestrzeni roboczej, wystarczy przyznać im dostęp w trybie Wyświetl w tej przestrzeni roboczej. Aby dowiedzieć się więcej o innych rolach w obszarze roboczym usługi Power BI, przejdź do Role w nowych obszarach roboczych.
Zatwierdzenie przepływu danych w usłudze Power BI
Istnieje wiele przepływów danych utworzonych w organizacji dzierżawy i trudno jest użytkownikom wiedzieć, który przepływ danych jest najbardziej niezawodny. Autorzy przepływu danych lub użytkownicy, którzy mają do niego dostęp do edycji, mogą zatwierdzać przepływ danych na trzech poziomach: bez poparcia, promowane, lub certyfikowane.
Te poziomy poręczenia pomagają użytkownikom łatwiej i szybciej znaleźć niezawodne przepływy danych. Przepływ danych z wyższym poziomem autoryzacji pojawia się jako pierwszy. Administrator usługi Power BI może delegować możliwość zatwierdzania przepływów danych na poziomie certyfikowanym dla innych osób. Więcej informacji: Aprobata — promowanie i certyfikowanie zawartości Power BI
Oddzielne tabele w wielu przepływach danych
W jednym przepływie danych można mieć wiele tabel. Jedną z przyczyn dzielenia tabel w wielu przepływach danych jest to, co przedstawiono wcześniej w tym artykule na temat oddzielania przepływów danych pozyskiwania danych i przekształcania danych. Innym dobrym powodem, dla którego tabele mają być w wielu przepływach danych, jest to, że chcesz użyć innego harmonogramu odświeżania niż inne tabele.
W przykładzie pokazanym na poniższej ilustracji tabela sprzedaży musi być odświeżona co cztery godziny. Tabela dat musi być odświeżona tylko raz dziennie, aby aktualizować bieżący rekord daty. Tabela mapowania produktów musi być odświeżona raz w tygodniu. Jeśli masz wszystkie te tabele w jednym przepływie danych, masz tylko jedną opcję odświeżania dla nich wszystkich. Jeśli jednak podzielisz te tabele na wiele przepływów danych, możesz zaplanować odświeżanie każdego przepływu danych oddzielnie.
Odpowiednie tabele dla tabel przepływu danych
Podczas opracowywania rozwiązań przy użyciu dodatku Power Query w narzędziach klasycznych możesz zadać sobie pytanie; które z tych tabel są dobrymi kandydatami do przeniesienia do przepływu danych? Najlepsze tabele, które mają zostać przeniesione do przepływu danych, to tabele, które muszą być używane w więcej niż jednym rozwiązaniu lub więcej niż jednym środowisku lub usłudze. Na przykład tabela Data pokazana na poniższej ilustracji musi być używana w dwóch oddzielnych plikach Power BI. Zamiast duplikować tę tabelę w każdym pliku, możesz skompilować tabelę w przepływie danych jako tabelę i użyć jej ponownie w tych plikach usługi Power BI.