FSCK REPAIR TABLE
Dotyczy: Databricks SQL Databricks Runtime
Usuwa wpisy pliku z dziennika transakcji tabeli delty, która nie może być już znaleziona w bazowym systemie plików. Może się to zdarzyć, gdy te pliki zostały ręcznie usunięte.
Składnia
FSCK REPAIR TABLE table_name [DRY RUN]
Parametry
-
Identyfikuje istniejącą tabelę delty. Nazwa nie może zawierać specyfikacji czasowej ani specyfikacji opcji.
PRZEBIEG SUCHY
Przedstawia informacje o wpisach pliku, które zostaną usunięte z dziennika transakcji tabeli delty przez
FSCK REPAIR TABLE
element , ponieważ nie można ich znaleźć w bazowym systemie plików. Może się to zdarzyć, gdy te pliki zostały ręcznie usunięte. Wpisy pliku są ścieżką pliku danych lub kombinacją ścieżki pliku danych i ścieżki pliku wektora usuwania. Wpisy pliku są uwzględniane w danych wyjściowych, gdy brakuje pliku danych, gdy brakuje pliku wektora usuwania lub gdy brakuje obu tych plików.Domyślnie
DRY RUN
zwraca tylko pierwsze 1000 plików. Możesz zwiększyć ten próg, ustawiając zmiennąspark.databricks.delta.fsck.maxNumEntriesInResult
SparkSession na wyższą wartość przed uruchomieniem polecenia w notesie.
Zwraca
W przypadku DRY RUN
raportu formularza:
dataFilePath STRING NOT NULL
dataFileMissing BOOLEAN NOT NULL
deletionVectorPath STRING
deletionVectorFileMissing BOOLEAN NOT NULL
Przykłady
— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet true null false
— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet false dv1.bin true