FSCK REPAIR TABLE
適用対象: Databricks SQL
Databricks Runtime
基になるファイル システムで見つからないデルタ table のトランザクション ログからファイル エントリを削除します。 これは、これらのファイルが手動で削除された場合に行われる可能性があります。
構文
FSCK REPAIR TABLE table_name [DRY RUN]
Parameters
-
既存のデルタ tableを識別します。 名前には、 時仕様またはオプション指定を含めてはなりません。
DRY RUN
FSCK REPAIR TABLE
によってデルタ table のトランザクション ログから削除されるファイル エントリに関する情報が表示されます。これは、基になるファイル システムで見つからないためです。 これは、これらのファイルが手動で削除された場合に行われる可能性があります。 ファイル エントリは、データ ファイル パス、またはデータ ファイル パスと削除ベクトル ファイル パスの組み合わせです。 データ ファイルがない場合、削除ベクトル ファイルがない場合、または両方が見つからない場合は、ファイル エントリが出力に含まれます。既定では、
DRY RUN
の場合、最初の 1000 個のファイルのみを返されます。 ノートブックでコマンドを実行する前に、SparkSession 変数spark.databricks.delta.fsck.maxNumEntriesInResult
の値を大きくすることで、このしきい値を増やすことができます。
返品
DRY RUN
について、次の形式のレポート:
dataFilePath STRING NOT NULL
dataFileMissing BOOLEAN NOT NULL
deletionVectorPath STRING
deletionVectorFileMissing BOOLEAN NOT NULL
例
— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet true null false
— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet false dv1.bin true