Jaka jest struktura magazynu dla analitycznych przepływów danych?
Analityczne przepływy danych przechowują zarówno dane, jak i metadane w usłudze Azure Data Lake Storage. Przepływy danych wykorzystują standardową strukturę do przechowywania i opisywania danych utworzonych w usłudze Lake, czyli folderów Common Data Model. W tym artykule dowiesz się więcej o standardzie magazynu używanym przez przepływy danych w tle.
Magazyn potrzebuje struktury dla analitycznego przepływu danych
Jeśli przepływ danych jest standardowy, dane są przechowywane w usłudze Dataverse. Usługa Dataverse jest jak system bazy danych; zawiera pojęcie tabel, widoków i tak dalej. Dataverse to opcja magazynu danych ze strukturą używana przez standardowe przepływy danych.
Jednak gdy przepływ danych jest analityczny, dane są przechowywane w usłudze Azure Data Lake Storage. Dane i metadane przepływu danych są przechowywane w folderze usługi Common Data Model. Ponieważ konto magazynu może mieć wiele przepływów danych przechowywanych w nim, wprowadzono hierarchię folderów i podfolderów ułatwiających organizowanie danych. W zależności od produktu, w ramach którego został utworzony przepływ danych, foldery i podfoldery mogą reprezentować obszary robocze (lub środowiska), a następnie folder Common Data Model przepływu danych. W folderze Common Data Model przechowywane są zarówno schematy, jak i dane tabel przepływu danych. Ta struktura jest zgodna ze standardami zdefiniowanymi dla usługi Common Data Model.
Jaka jest struktura magazynu usługi Common Data Model?
Common Data Model to struktura metadanych zdefiniowana w celu zapewnienia zgodności i spójności w zakresie używania danych na wielu platformach. Usługa Common Data Model nie jest magazynem danych, jest sposobem przechowywania i definiowania danych.
Foldery common Data Model definiują sposób przechowywania schematu tabeli i jego danych. W usłudze Azure Data Lake Storage dane są zorganizowane w folderach. Foldery mogą reprezentować obszar roboczy lub środowisko. W tych folderach tworzone są podfoldery dla każdego przepływu danych.
Co znajduje się w folderze przepływu danych?
Każdy folder przepływu danych zawiera podfolder dla każdej tabeli i plik metadanych o nazwie model.json
.
Plik metadanych: model.json
Plik model.json
jest definicją metadanych przepływu danych. Jest to jeden plik, który zawiera wszystkie metadane przepływu danych. Zawiera listę tabel, kolumn i ich typów danych w każdej tabeli, relację między tabelami itd. Ten plik można łatwo wyeksportować z przepływu danych, nawet jeśli nie masz dostępu do struktury folderów Common Data Model.
Możesz użyć tego pliku JSON do migracji (lub zaimportowania) przepływu danych do innego obszaru roboczego lub środowiska.
Aby dowiedzieć się dokładnie, co zawiera plik metadanych model.json, przejdź do pozycji Plik metadanych (model.json) dla usługi Common Data Model.
Pliki danych
Oprócz pliku metadanych folder przepływu danych zawiera inne podfoldery. Przepływ danych przechowuje dane dla każdej tabeli w podfolderze z nazwą tabeli. Dane tabeli mogą być podzielone na wiele partycji danych przechowywanych w formacie CSV.
Jak wyświetlać foldery usługi Common Data Model lub uzyskiwać do ich dostępu
Jeśli używasz przepływów danych korzystających z magazynu dostarczonego przez produkt, w którym zostały utworzone, nie będziesz mieć bezpośredniego dostępu do tych folderów. W takich przypadkach pobieranie danych z przepływów danych wymaga użycia łącznika przepływu danych platformy Microsoft Power Platform dostępnego w środowisku Pobieranie danych w produktach usługa Power BI, Power Apps i Dynamics 35 Customer Szczegółowe informacje lub w programie Power BI Desktop.
Aby dowiedzieć się, jak działają przepływy danych i wewnętrzna integracja usługi Data Lake Storage, przejdź do pozycji Przepływy danych i integracja usługi Azure Data Lake (wersja zapoznawcza).
Jeśli Organizacja włączyła przepływy danych, aby korzystać z jego konta usługi Data Lake Storage i została wybrana jako element docelowy ładowania dla przepływów danych, nadal możesz pobierać dane z przepływu danych przy użyciu łącznika przepływu danych platformy Power Platform, jak wspomniano powyżej. Można jednak również uzyskać dostęp do folderu Common Data Model przepływu danych bezpośrednio za pośrednictwem jeziora, nawet poza narzędziami i usługami platformy Power Platform. Dostęp do jeziora jest możliwy za pośrednictwem witryny Azure Portal, Eksplorator usługi Microsoft Azure Storage lub dowolnej innej usługi lub środowiska obsługującego usługę Azure Data Lake Storage. Więcej informacji: Połącz Azure Data Lake Storage Gen2 dla magazynu przepływu danych
Następne kroki
Używanie usługi Common Data Model do optymalizacji usługi Azure Data Lake Storage Gen2
Dodawanie folderu CDM do usługi Power BI jako przepływu danych (wersja zapoznawcza)
Połącz Azure Data Lake Storage Gen2 z magazynem przepływu danych
Przepływy danych i integracja usługi Azure Data Lake (wersja zapoznawcza)
Konfigurowanie ustawień przepływu danych w obszarze roboczym (wersja zapoznawcza)