Potoki wdrażania usługi Lakehouse i integracja z usługą Git (wersja zapoznawcza)
Usługa Lakehouse integruje się z funkcjami zarządzania cyklem życia w usłudze Microsoft Fabric, zapewniając ustandaryzowaną współpracę między wszystkimi członkami zespołu deweloperskiego w całym życiu produktu. Zarządzanie cyklem życia ułatwia efektywne przechowywanie wersji i proces wydawania produktów przez ciągłe dostarczanie funkcji i poprawek usterek w wielu środowiskach. Aby dowiedzieć się więcej, zobacz Co to jest zarządzanie cyklem życia w usłudze Microsoft Fabric?.
Ważne
Ta funkcja jest dostępna w wersji zapoznawczej.
Integracja z usługą Git usługi Lakehouse
Lakehouse to element zawierający zarówno metadane, jak i dane, do których odwołuje się wiele obiektów w obszarze roboczym. Usługa Lakehouse zawiera tabele, foldery i skróty jako podstawowe elementy kontenera danych, którymi można zarządzać. Z perspektywy przepływu pracy programowania następujące obiekty zależne mogą odwoływać się do usługi Lakehouse:
- Przepływy danych i potoki danych
- Definicje zadań platformy Spark
- Notesy
- Modele semantyczne i usługa Power BI
Domyślny model semantyczny i metadane punktu końcowego analizy SQL są domyślnie powiązane z usługą Lakehouse i zarządzane przez proces aktualizacji usługi Git. Ponieważ dane nie są śledzone w usłudze Git, śledzone są tylko metadane.
Reprezentacja usługi Git
Następujące informacje lakehouse są serializowane i śledzone w połączonym obszarze roboczym usługi Git:
- Display name
- Opis
- Identyfikator GUID logiczny
Uwaga
Śledzony logiczny identyfikator GUID jest automatycznie generowanym identyfikatorem między obszarami roboczymi reprezentującymi element i jego reprezentację kontroli źródła.
Ważne
Tylko artefakt kontenera Lakehouse jest śledzony w narzędziu git w bieżącym środowisku. Tabele (delta i inne niż delta) i foldery w sekcji Pliki nie są śledzone i wersjonowane w usłudze Git.
Możliwości integracji z usługą Git usługi Lakehouse
Dostępne są następujące możliwości:
- Serializacja metadanych obiektu Lakehouse w reprezentacji git JSON.
- Zastosuj zmiany bezpośrednio lub użyj żądania ściągnięcia, aby kontrolować zmiany w nadrzędnych lub podrzędnych obszarach roboczych i gałęziach.
- Zmiana nazwy lakehouses jest śledzona w usłudze git. Aktualizacja zmienionej nazwy usługi Lakehouse również zmienia nazwę domyślnego semantycznego modelu danych i punktu końcowego usługi SQL Analytics.
- Do metadanych tabel i folderównie jest stosowana żadna akcja, a dane tych elementów są zawsze zachowywane.
- Metadane skrótów OneLake są zachowywane w git.
Możliwości integracji skrótów OneLake z usługą Git
- Definicje skrótów w sekcji Tabele i Pliki są przechowywane w pliku o nazwie
shortcuts.metadata.json
w folderze lakehouse w usłudze git. - Następujące operacje są obsługiwane i śledzone automatycznie: dodawania, usuwania i aktualizacji skrótów.
- Operacje można wykonywać bezpośrednio w interfejsie użytkownika Fabric lub w repozytorium git, zmieniając plik
shortcuts.metadata.json
. - Skróty z elementami docelowymi wewnętrznymi (skróty OneLake) są automatycznie aktualizowane podczas synchronizacji z użyciem Git. Aby skrót był prawidłowy, odwołania te muszą być prawidłowymi elementami docelowymi w obszarze roboczym. Jeśli obiekty docelowe są nieprawidłowe dla Skrótów zdefiniowanych w sekcji tabel Lakehouse, te Skróty są przenoszone do sekcji
Unidentified
, dopóki odwołania nie zostaną rozwiązane.
Ważne
Należy zachować ostrożność podczas zmiany właściwości skrótu OneLake bezpośrednio w pliku shortcuts.metadata.json
. Nieprawidłowe zmiany właściwości, szczególnie identyfikatorów GUID, mogą powodować, że skrót OneLake staje się nieprawidłowy, gdy aktualizacje są stosowane z powrotem do obszaru roboczego.
Ważne
Aktualizacja z usługi git zastąpi stan skrótów w obszarze roboczym. Wszystkie skróty w obszarze roboczym są tworzone, aktualizowane lub usuwane na podstawie stanu przychodzącego z usługi Git.
Usługa Lakehouse w potokach wdrażania
Usługa Lakehouse jest obsługiwana w potokach wdrażania zarządzania cyklem życia usługi Microsoft Fabric. Umożliwia to najlepsze rozwiązania dotyczące segmentacji środowiska.
Możliwości integracji potoków wdrażania usługi Lakehouse:
Wdrażanie w obszarach roboczych tworzenia, testowania i produkcji.
Usługa Lakehouse może zostać usunięta jako obiekt zależny po wdrożeniu. Mapowanie różnych usług Lakehouse w kontekście potoku wdrażania jest również obsługiwane.
Jeśli podczas konfiguracji potoku wdrażania nie określono nic, w docelowym obszarze roboczym zostanie utworzony nowy pusty obiekt Lakehouse o tej samej nazwie. Definicje zadań notesu i platformy Spark są ponownie mapowane, aby odwołać się do nowego obiektu lakehouse w nowym obszarze roboczym.
Jeśli zależność usługi Lakehouse jest skonfigurowana tak, aby odwoływała się do innej usługi Lakehouse w czasie konfiguracji potoku wdrażania, na przykład nadrzędnego usługi Lakehouse, nowy pusty obiekt Lakehouse o tej samej nazwie nadal jest tworzony w docelowym obszarze roboczym, ale odwołania do notesów i definicji zadań platformy Spark są zachowywane w innej usłudze Lakehouse zgodnie z żądaniem.
Punkty końcowe usługi SQL Analytics i modele semantyczne są aprowizowane w ramach wdrożenia usługi Lakehouse.
Żaden obiekt wewnątrz lakehouse nie został zastąpiony.
Aktualizacje nazwy usługi Lakehouse można synchronizować między obszarami roboczymi w kontekście potoku wdrażania.
Skróty OneLake w ramach potoków wdrażania
- Definicje skrótów są synchronizowane między fazami w procesach wdrażania.
- Skróty z obiektami docelowymi zewnętrznymi (ADLS Gen2, S3 itp.) są takie same we wszystkich etapach po wdrożeniu.
- Skróty z wewnętrznymi celami (skróty OneLake) w obrębie tego samego obszaru roboczego są automatycznie ponownie mapowane na różnych etapach. Skróty przeznaczone dla magazynu danych i modeli semantycznych nie są ponownie mapowane podczas wdrażania. Tabele, foldery i pliki nie są tworzone w docelowym obszarze roboczym. Aby skrót był prawidłowy, te odwołania należy utworzyć w docelowym obszarze roboczym po wdrożeniu.
- W sytuacji, gdy ten sam skrót musi być odpowiedni dla różnych lokalizacji na różnych etapach. Na przykład w obszarze Programowanie wskaż określony folder w usłudze Amazon S3 i w obszarze Produkcja inny folder w usłudze ADLS Gen2. Po wdrożeniu zaktualizuj definicję skrótu OneLake w usłudze Lakehouse lub bezpośrednio przy użyciu interfejsów API usługi OneLake.
Ważne
Wdrożenie zastąpi stan skrótów w docelowym obszarze roboczym. Wszystkie skróty w docelowym lakehouse są aktualizowane lub usuwane na podstawie stanu w lakehouse źródłowym. Nowe skróty są tworzone w obiekcie docelowym lakehouse. Zawsze klikaj pozycję "Przejrzyj zmiany", aby zrozumieć zmiany, które zostaną wdrożone między źródłowymi i docelowymi obszarami roboczymi.