Dzienniki usługi Delta Lake w magazynie w usłudze Microsoft Fabric
Dotyczy:✅ Magazyn w usłudze Microsoft Fabric
Magazyn w usłudze Microsoft Fabric jest tworzony w otwartych formatach plików. Tabele użytkowników są przechowywane w formacie pliku parquet, a dzienniki usługi Delta Lake są publikowane dla wszystkich tabel użytkowników.
Dzienniki usługi Delta Lake otwierają bezpośredni dostęp do tabel użytkowników magazynu dla dowolnego aparatu, który może odczytywać tabele usługi Delta Lake. Ten dostęp jest ograniczony do tylko do odczytu, aby zapewnić, że dane użytkownika zachowują zgodność transakcji ACID. Wszystkie wstawki, aktualizacje i usunięcia danych w tabelach muszą być wykonywane za pośrednictwem magazynu. Po zatwierdzeniu transakcji inicjowany jest proces w tle systemu w celu opublikowania zaktualizowanego dziennika usługi Delta Lake dla tabel, których dotyczy problem.
Jak uzyskać ścieżkę usługi OneLake
Poniższe kroki szczegółowo opisują sposób pobierania ścieżki OneLake z tabeli w magazynie:
Otwórz magazyn w obszarze roboczym usługi Microsoft Fabric.
W Eksplorator obiektów więcej opcji (...) można znaleźć w wybranej tabeli w folderze Tabele. Wybierz menu Właściwości.
Po wybraniu okienka Właściwości są wyświetlane następujące informacje:
- Nazwisko
- Formatuj
- Typ
- URL
- Ścieżka względna
- Ścieżka ABFS
Jak uzyskać ścieżkę dzienników usługi Delta Lake
Dzienniki usługi Delta Lake można zlokalizować za pomocą następujących metod:
Zapytania dotyczące dzienników usługi Delta Lake można wykonywać za pomocą skrótów utworzonych w usłudze Lakehouse. Pliki można wyświetlić przy użyciu notesu Platformy Spark usługi Microsoft Fabric lub eksploratora usługi Lakehouse w usłudze Fabric inżynierowie danych w portalu usługi Microsoft Fabric.
Dzienniki usługi Delta Lake można znaleźć za pośrednictwem Eksplorator usługi Azure Storage, za pośrednictwem połączeń platformy Spark, takich jak tryb usługi Power BI Direct Lake, lub innych usług, które mogą odczytywać tabele różnicowe.
Dzienniki usługi Delta Lake można znaleźć w
_delta_log
folderze każdej tabeli za pośrednictwem Eksploratora OneLake w systemie Windows, jak pokazano na poniższym zrzucie ekranu.
Wstrzymanie publikowania dzienników usługi Delta Lake
Publikowanie dzienników usługi Delta Lake można w razie potrzeby wstrzymać i wznowić. Po wstrzymaniu publikowania aparaty usługi Microsoft Fabric, które odczytują tabele poza magazynem, widzą dane tak jak przed wstrzymaniem. Dzięki temu raporty pozostają stabilne i spójne, odzwierciedlając dane ze wszystkich tabel, ponieważ istniały przed wprowadzeniem zmian w tabelach. Po zakończeniu aktualizacji danych możesz wznowić publikowanie dzienników usługi Delta Lake, aby wszystkie ostatnie zmiany danych zostały widoczne dla innych aparatów analitycznych. Innym przypadkiem użycia wstrzymania publikowania dzienników usługi Delta Lake jest to, że użytkownicy nie potrzebują współdziałania z innymi aparatami obliczeniowymi w usłudze Microsoft Fabric, ponieważ może pomóc zaoszczędzić na kosztach obliczeń.
Składnia wstrzymywania i wznawiania publikowania dzienników usługi Delta Lake jest następująca:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED | AUTO
Przykład: wstrzymywanie i wznawianie publikowania dzienników usługi Delta Lake
Aby wstrzymać publikowanie dzienników usługi Delta Lake, użyj następującego fragmentu kodu:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED
Zapytania dotyczące tabel magazynu w bieżącym magazynie z innych aparatów usługi Microsoft Fabric (na przykład zapytań z usługi Lakehouse) pokazują teraz wersję danych, tak jak przed wstrzymaniem publikowania dzienników usługi Delta Lake. Zapytania magazynu nadal pokazują najnowszą wersję danych.
Aby wznowić publikowanie dzienników usługi Delta Lake, użyj następującego fragmentu kodu:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = AUTO
Gdy stan zostanie zmieniony z powrotem na AUTO, aparat magazynu sieci szkieletowej publikuje dzienniki wszystkich ostatnich zmian wprowadzonych w tabelach w magazynie, co umożliwia innym aparatom analitycznym w usłudze Microsoft Fabric odczytywanie najnowszej wersji danych.
Sprawdzanie stanu publikowania dzienników usługi Delta Lake
Aby sprawdzić bieżący stan publikowania dziennika usługi Delta Lake we wszystkich magazynach dla bieżącego obszaru roboczego, użyj następującego fragmentu kodu:
SELECT [name], [DATA_LAKE_LOG_PUBLISHING_DESC] FROM sys.databases
Ograniczenia
- Nazwy tabel mogą być używane tylko przez platformę Spark i inne systemy, jeśli zawierają tylko następujące znaki: A-Z a-z 0-9 i podkreślenia.
- Nazwy kolumn, które będą używane przez platformę Spark i inne systemy, nie mogą zawierać:
- Spacje
- karty
- Powrotu karetki
- [
- ,
- ;
- {
- }
- (
- )
- =
- ]