次の方法で共有


sync コマンド グループ

Note

この情報は、Databricks CLI バージョン 0.205 以降に適用されます。 Databricks CLI は Public Preview です。

Databricks CLI の使用には、Databricks ライセンスおよび使用状況データのプロビジョニングを含むDatabricks のプライバシーに関する通知が適用されます。

Databricks CLI 内の sync コマンド グループを使用すると、ローカル ファイル システム ディレクトリ内のファイル変更を、リモート Azure Databricks ワークスペース内のディレクトリに一方向で同期できます。

Note

  • sync コマンドは、リモート Azure Databricks ワークスペース内のディレクトリからローカル ファイル システム内のディレクトリにファイルの変更を同期することはできません。
  • sync コマンドを使用すると、ローカル開発マシンからのファイル変更を Azure Databricks ワークスペース内のワークスペース ユーザー (/Users) ファイルにのみ同期できます。 DBFS (dbfs:/) ファイルと同期することはできません。 ファイルの変更をローカル開発マシンから Azure Databricks ワークスペースの DBFS (dbfs:/) に同期するには、dbx 同期ユーティリティを使用します。

sync コマンドは、databricks sync に追加して実行します。 sync コマンドのヘルプを表示するには、databricks sync -h を実行してください。

ローカル ファイルの変更をリモート ディレクトリに増分同期します

ローカル ファイル システム ディレクトリ内のファイル変更をリモート Azure Databricks ワークスペース内のディレクトリに単一の増分一方向同期を実行するには、次のように sync コマンドを実行します。

databricks sync <local-directory-path> <remote-directory-path>

たとえば、ローカルの現在の作業ディレクトリ内の my-folder という名前のフォルダー内のすべてのファイルの変更を、リモート ワークスペース内の特定のパスに 1 回限りの一方向の増分同期を実行するには、次のコマンドを実行します。

databricks sync ./my-folder/ /Users/someone@example.com/

この例では、sync コマンドの最後の実行以降のファイル変更のみが /Users/someone@example.com/ に同期されます。 デフォルトでは、呼び出し元の DEFAULT プロファイル内のワークスペース URL を使用して、同期先のリモート ワークスペースが決定されます。

ローカル ファイルの変更をリモート ディレクトリに完全同期します

ローカル ファイル システム ディレクトリ内のファイル変更をリモート Azure Databricks ワークスペース内のディレクトリに単一の完全な一方向同期を実行するには、最後の sync コマンドがいつ実行されたかに関係なく、次のように --full オプションを使用します。

databricks sync ./my-folder/ /Users/someone@example.com/ --full

ローカル ファイルの変更をリモート ディレクトリに継続的同期します

ローカル ファイル システム ディレクトリ内のファイル変更のリモート Azure Databricks ワークスペース内のディレクトリへの継続的な一方向の同期を有効にするには、次のように --watch オプションを使用します。

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

一方向の同期は、通常は Ctrl + c または Ctrl + z を押して端末からコマンドを停止するまで継続します。

考えられる同期イベントのポーリングは、既定では 1 秒に 1 回行われます。 この間隔を変更するには、--interval オプションをポーリング秒数とともに使用し、その後に文字 s を続けます (例: 5 秒)。

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

同期進行状況の出力形式を変更する

同期の進行状況情報は、既定ではテキスト形式で端末に出力されます。 同期進行状況の出力形式を指定するには、--output オプションを使用して、text (--output が指定されていない場合の既定値) または json を指定します。次に例を示します。

databricks sync ./my-folder/ /Users/someone@example.com/ --output json