Odniesienie do właściwości usługi Delta Live Tables
Ten artykuł zawiera odniesienie do specyfikacji ustawień JSON Delta Live Tables i właściwości table w usłudze Azure Databricks. Aby uzyskać więcej informacji na temat używania tych różnych właściwości i konfiguracji, zobacz następujące artykuły:
konfiguracje potoku usługi Delta Live Tables
Pola |
---|
id Typ: string Globalnie unikatowa identifier dla tego potoku. identifier jest przypisywany przez system i nie można go zmienić. |
name Typ: string Przyjazna dla użytkownika nazwa tego potoku. Nazwa może służyć do identyfikowania zadań potoku w interfejsie użytkownika. |
storage Typ: string Lokalizacja w systemie plików DBFS lub w chmurze where, gdzie przechowywane są dane wyjściowe i metadane wymagane do wykonania pipeline'u. Tables i metadane są przechowywane w podkatalogach tej lokalizacji. storage Jeśli ustawienie nie zostanie określone, system będzie domyślnie ustawiać lokalizację w programie dbfs:/pipelines/ .Nie storage można zmienić ustawienia po utworzeniu potoku. |
configuration Typ: object Opcjonalna list ustawień do dodania do konfiguracji Spark klastra, który uruchomi potok. Te ustawienia są odczytywane przez środowisko uruchomieniowe Delta Live Tables i są dostępne dla zapytań dotyczących potoku za pośrednictwem konfiguracji Spark. Elementy muszą być sformatowane jako key:value pary. |
libraries Typ: array of objects Tablica notesów zawierająca kod potoku i wymagane artefakty. |
clusters Typ: array of objects Tablica specyfikacji klastrów do uruchomienia potoku. Jeśli nie zostanie to określone, potoki będą automatycznie select domyślną konfigurację klastra dla potoku. |
development Typ: boolean Flaga wskazująca, czy należy uruchomić potok w programie development lub production tryb.Domyślna wartość to true |
notifications Typ: array of objects Opcjonalna tablica specyfikacji dla powiadomień e-mail po zakończeniu potoku update kończy się niepowodzeniem z błędem z możliwością ponawiania próby, niepowodzeniem z błędem niemożliwym do ponowienia próby lub niepowodzeniem przepływu. |
continuous Typ: boolean Flaga wskazująca, czy potok ma być uruchomiony w sposób ciągły. Domyślna wartość to false . |
target Typ: string Nazwa bazy danych do utrwalania danych wyjściowych potoku. Skonfigurowanie target ustawienia umożliwia wyświetlanie i wykonywanie zapytań dotyczących danych wyjściowych potoku z interfejsu użytkownika usługi Azure Databricks. |
channel Typ: string Wersja środowiska uruchomieniowego usługi Delta Live Tables, która ma być używana. Obsługiwane values to: - preview aby przetestować potok przy użyciu nadchodzących zmian w wersji środowiska uruchomieniowego.- current aby użyć bieżącej wersji środowiska uruchomieniowego.Pole channel jest opcjonalne. Wartość domyślna tocurrent . Usługa Databricks zaleca używanie bieżącej wersji środowiska uruchomieniowego dla obciążeń produkcyjnych. |
edition Wpisz string Wersja produktu Delta Live Tables do uruchomienia potoku. To ustawienie umożliwia wybranie najlepszej wersji produktu na podstawie wymagań potoku: - CORE do uruchamiania obciążeń pozyskiwania strumieniowego.- PRO w celu uruchamiania pozyskiwania i zmieniania obciążeń przechwytywania danych (CDC).pl-PL: - ADVANCED aby uruchamiać obciążenia przetwarzania strumieniowego, obciążenia CDC i obciążenia, które wymagają wymagań usługi Delta Live Tables w celu wymuszenia ograniczeń jakości danych.Pole edition jest opcjonalne. Wartość domyślna toADVANCED . |
photon Typ: boolean Flaga wskazująca, czy używać funkcji Co to jest photon? do uruchomienia potoku. Photon to aparat Spark o wysokiej wydajności usługi Azure Databricks. Potoki z obsługą fotonu są rozliczane według innej stawki niż potoki inne niż photon. Pole photon jest opcjonalne. Domyślna wartość to false . |
pipelines.maxFlowRetryAttempts Typ: int Jeśli podczas potoku updatewystąpi błąd z możliwością ponawiania próby, maksymalna liczba ponownych prób przepływu to wartość przed zaniechaniem potoku update. Ustawienie domyślne: dwie próby ponawiania prób. W przypadku awarii, którą można ponowić, środowisko uruchomieniowe Delta Live Tables podejmuje próbę uruchomienia przepływu trzy razy, w tym oryginalną próbę. |
pipelines.numUpdateRetryAttempts Typ: int Jeśli podczas updatewystąpi błąd z możliwością ponawiania próby, jest to maksymalna liczba ponownych prób update przed trwałym niepowodzeniem update. Ponowienie próby jest uruchamiane jako pełny update. Ten parametr dotyczy tylko potoków działających w trybie produkcyjnym. Ponowne próby nie są podejmowane, jeśli potok działa w trybie programowania lub po uruchomieniu Validate update.Domyślny: - Pięć dla uruchomionych potoków. - Nieograniczone dla potoków ciągłych. |
właściwości usługi Delta Live Tablestable
Oprócz właściwości table obsługiwanych przez Delta Lake, można set następujące właściwości table.
Table właściwości |
---|
pipelines.autoOptimize.managed Domyślnie: true Włącza lub wyłącza automatycznie zaplanowaną optymalizację tego table. |
pipelines.autoOptimize.zOrderCols Ustawienie domyślne: Brak Opcjonalny ciąg znaków, oddzielany przecinkami, zawierający list nazw column według kolejności tego table. Na przykład pipelines.autoOptimize.zOrderCols = "year,month" |
pipelines.reset.allowed Domyślnie: true Określa, czy dla tego tabledozwolony jest pełny refresh. |
Interwał wyzwalacza potoków
Można określić częstotliwość wyzwalania potoku dla całego potoku Delta Live Tables lub jako część deklaracji zestawu danych. Zobacz Set czas między wyzwoleniami w przypadku potoków ciągłych.
pipelines.trigger.interval |
---|
Wartość domyślna jest oparta na typie przepływu: - Pięć sekund dla zapytań przesyłania strumieniowego. — Minuta wykonywania zapytań, gdy wszystkie dane wejściowe pochodzą ze źródeł różnicowych. — Dziesięć minut dla pełnych zapytań, gdy niektóre źródła danych mogą nie być delty. Wartość jest liczbą oraz jednostką czasową. Poniżej przedstawiono prawidłowe jednostki czasu: - second , seconds - minute , minutes - hour , hours - day , days Można użyć jednostki pojedynczej lub mnogiej podczas definiowania wartości, na przykład: - {"pipelines.trigger.interval" : "1 hour"} - {"pipelines.trigger.interval" : "10 seconds"} - {"pipelines.trigger.interval" : "30 second"} - {"pipelines.trigger.interval" : "1 minute"} - {"pipelines.trigger.interval" : "10 minutes"} - {"pipelines.trigger.interval" : "10 minute"} |
Atrybuty klastra, które nie są konfigurowalne przez użytkownika
Ponieważ Delta Live Tables zarządza cyklami życia klastrów, wiele ustawień klastra jest set przez Delta Live Tables i nie można ich skonfigurować ręcznie przez użytkowników ani w konfiguracji potoku, ani w zasadach klastra używanych w potoku. W poniższym table wymieniono te ustawienia i dlaczego nie można ich ręcznie set.
Pola |
---|
cluster_name Usługa Delta Live Tables ustawia nazwy klastrów używanych do uruchamiania aktualizacji potoku. Tych nazw nie można zastąpić. |
data_security_mode access_mode Te values są automatycznie set przez system. |
spark_version Klastry usługi Delta Live Tables działają w niestandardowej wersji środowiska Databricks Runtime, która jest stale aktualizowana w celu uwzględnienia najnowszych funkcji. Wersja platformy Spark jest dołączona do wersji środowiska Databricks Runtime i nie można jej zastąpić. |
autotermination_minutes Ponieważ Delta Live Tables zarządza logiką automatycznego zakończenia i ponownego użycia klastra, nie można zmienić czasu automatycznego zakończenia klastra. |
runtime_engine Chociaż to pole można kontrolować, włączając aplikację Photon dla potoku, nie można bezpośrednio set tej wartości. |
effective_spark_version Ta wartość jest automatycznie ustawiana jako set przez system. |
cluster_source To pole jest set przez system i jest tylko do odczytu. |
docker_image Ponieważ usługa Delta Live Tables zarządza cyklem życia klastra, nie można użyć niestandardowego kontenera z klastrami potoków. |
workload_type Ta wartość jest set przez system i nie można jej zastąpić. |