チュートリアル: データ コピー サービスを使用してデータを Azure Data Box Heavy にコピーする (プレビュー)
このチュートリアルでは、中間ホストを介さずにデータ コピー サービスを使用してデータを取り込む方法について説明します。 データ コピー サービスは、Azure Data Box Heavy 上でローカルに動作し、SMB 経由でお客様のネットワーク接続ストレージ (NAS) デバイスに接続して、Data Box Heavy にデータをコピーします。
データ コピー サービスの用途:
- 中間ホストが必ずしも利用できない NAS 環境。
- データのインジェストとアップロードに数週間かかる小さなファイル。 データ コピー サービスを利用すると、小さなファイルのインジェストとアップロードにかかる時間を大幅に短縮できます。
このチュートリアルでは、以下の内容を学習します。
- データを Data Box Heavy にコピーする
前提条件
開始する前に次の点を確認します。
- Azure Data Box Heavy の設定に関するチュートリアルを完了していること。
- Data Box Heavy の受け取りが済んでいて、ポータル内での注文の状態が [配送済み] であること。
- 自分がデータ コピーのために接続するソース NAS デバイスの資格情報があること。
- 高速ネットワークに接続していること。 最速のコピー速度を得るため、2 つの 40 GbE 接続 (ノードごとに 1 つずつ) を並列で利用できます。 40 GbE 接続を使用できない場合は、少なくとも 2 つの 10 GbE 接続 (ノードごとに 1 つずつ) を使用することをお勧めします。
データを Data Box Heavy にコピーする
NAS デバイスに接続したら、次の手順はデータのコピーです。 データのコピーを開始する前に、次の考慮事項を確認してください。
- データのコピー中は、データのサイズが Azure Storage と Data Box Heavy の制限に関する記事に記載されているサイズ制限に準拠していることを確認してください。
- Data Box Heavy によってアップロードされているデータが、Data Box Heavy の外部で別のアプリケーションによって同時にアップロードされた場合、アップロード ジョブ エラーやデータの破損が生じる可能性があります。
- データ コピー サービスによる読み取りの過程でデータが変更されている場合、エラーやデータの破損が生じる可能性があります。
データ コピー サービスを使用してデータをコピーするには、ジョブを作成する必要があります。
Data Box Heavy デバイスのローカル Web UI で、 [管理]>[データのコピー] の順に移動します。
[データのコピー] ページで [作成] を選択します。
[ジョブの構成と開始] ダイアログ ボックスで、以下のフィールドを入力します。
フィールド 値 ジョブ名 ジョブの一意の名前を 230 文字未満で指定します。 <、>、|、?、*、\、:、/、\ の各文字は、ジョブの名前には使用できません。 ソースの場所 データ ソースの SMB パスを \\<ServerIPAddress>\<ShareName>
形式または\\<ServerName>\<ShareName>
形式で指定します。ユーザー名 データ ソースにアクセスするための \\<DomainName><UserName>
形式のユーザー名。 ローカルの管理者が接続する場合は、明示的なセキュリティ アクセス許可が必要です。 フォルダーを右クリックし、 [プロパティ] を選択して、 [セキュリティ] を選択します。 これで、 [セキュリティ] タブでローカル管理者が追加されます。パスワード データ ソースにアクセスするためのパスワード。 コピー先ストレージ アカウント データのアップロード先となるターゲット ストレージ アカウントを一覧から選択します。 送信先の種類 ターゲット ストレージの種類を一覧から選択します。 [ブロック BLOB] 、 [ページ BLOB] 、または [Azure ファイル] です。 コピー先コンテナー/共有 自分のコピー先ストレージ アカウントにおけるデータのアップロード先にしたいコンテナーまたは共有の名前を入力します。 この名前には、共有名またはコンテナー名を使用できます。 たとえば、 myshare
またはmycontainer
を使用します。sharename\directory_name
またはcontainername\virtual_directory_name
の形式で名前を入力することもできます。パターンに一致するファイルのコピー 次の 2 つの方法でファイル名の一致パターンを入力できます。 -
ワイルドカード式を使用: ワイルドカード式でサポートされるのは
*
と?
だけです。 たとえば、*.vhd
という式は、拡張子が.vhd
であるすべてのファイルと一致します。 同様に、*.dl?
は、拡張詞が.dl
であるか、または.dl
で始まる (.dll
など) すべてのファイルと一致します。 さらに、*foo
は、名前がfoo
で終わるすべてのファイルと一致します。
ワイルドカード式はフィールドに直接入力することができます。 フィールドに入力する値は、既定でワイルドカード式として扱われます。 -
正規表現を使用: POSIX ベースの正規表現がサポートされます。 たとえば、正規表現
.*\.vhd
は、拡張子が.vhd
であるすべてのファイルと一致します。 正規表現には、<pattern>
を直接regex(<pattern>)
として指定します。 正規表現の詳細については、正規表現言語のクイック リファレンスを参照してください。
ファイルの最適化 この機能が有効な場合、1 MB 未満のファイルがインジェスト中に圧縮されます。 この圧縮により、小さなファイルのデータをより高速にコピーできるようになります。 さらに、ファイル数がディレクトリ数を大幅に超えている場合は、時間が大幅に節約されます。 -
ワイルドカード式を使用: ワイルドカード式でサポートされるのは
[スタート] を選択します。 入力が検証され、検証が成功した場合にジョブが開始されます。 ジョブが開始されるまでに、数分かかる場合があります。
指定した設定のジョブが作成されます。 ジョブの一時停止、再開、取り消し、または再起動を実行できます。 ジョブ名の横にあるチェック ボックスをオンにして、適切なボタンを選択します。
ピーク時にジョブが NAS デバイスのリソースに影響を及ぼしている場合、それを一時停止できます。
ピーク時を避けて後でジョブを再開することができます。
ジョブはいつでも取り消すことができます。
ジョブを取り消す際には、確認が必要です。
ジョブの取り消しを確定した場合でも、既にコピーされたデータは削除されません。 自分の Data Box デバイスにコピーしたデータを削除するには、デバイスをリセットします。
注意
ジョブの取り消しまたは一時停止を行った場合、大きなファイルが部分的にのみコピーされる可能性があります。 部分的にコピーされたこれらのファイルは、同じ状態で Azure にアップロードされます。 ジョブの取り消しまたは一時停止を行う場合、ファイルが適切にコピーされたことを確認してください。 ファイルを確認するには、SMB 共有を調べるか、BOM ファイルをダウンロードします。
ネットワーク障害など、一時的なエラーが原因でジョブが失敗した場合、それを再起動することができます。 ただし、 [成功] や [完了 (エラーあり)] など、最終状態に達した場合にジョブを再起動することはできません。 ファイルの命名またはファイルサイズの問題が原因で、ジョブ エラーが発生する場合があります。 これらのエラーはログに記録されますが、完了した後にジョブを再起動することはできません。
エラーが発生し、ジョブを再起動できない場合は、エラー ログをダウンロードしてログ ファイルでエラーを探します。 問題を修正した後、新しいジョブを作成してファイルをコピーします。 SMB 経由でファイルをコピーすることもできます。
このリリースでは、ジョブを削除することはできません。
ジョブは無制限に作成できますが、任意の一時点に並列で実行できるジョブは最大 10 個だけです。
[ファイルの最適化] をオンにした場合、コピーのパフォーマンスを高めるために、小さなファイルが取り込み時に圧縮されます。 これらの場合、圧縮されたファイルが表示されます (そのファイル名は GUID になります)。 このファイルは削除しないでください。 これはアップロード中に解凍されます。
ジョブの進行中、 [データのコピー] ページでは:
-
[状態] 列で、コピー ジョブの状態を確認できます。 ステータスの値が示す内容は次のとおりです。
- 実行中
- Failed
- Succeeded
- 一時停止中
- 一時停止
- キャンセル中
- Canceled
- 完了 (エラーあり)
- [ファイル] 列で、コピー中のファイルの数と合計サイズを確認できます。
- [処理済み] 列で、処理されたファイルの数と合計サイズを確認できます。
- [ジョブの詳細] 列で [表示] を選択すると、ジョブの詳細が表示されます。
- [エラー数] 列に示されているように、コピー プロセス中にエラーが発生した場合、 [エラー ログ] 列に移動し、エラー ログをダウンロードしてトラブルシューティングを行います。
-
[状態] 列で、コピー ジョブの状態を確認できます。 ステータスの値が示す内容は次のとおりです。
コピー ジョブが完了するのを待ちます。 一部のエラーは [接続とコピー] ページにしかログが記録されないので、エラーなくコピー ジョブが完了したことを確認してから次の手順に進んでください。
データ整合性を保証するため、データがコピーされるときにインラインでチェックサムが計算されます。 コピーが完了した後、 [ダッシュボードの表示] を選択して、デバイスで使用済み領域と空き領域を確認します。
重要
同じ手順を繰り返して、Data Box Heavy 上の 2 番目のノードにデータをコピーします。
コピー ジョブが完了した後、 [発送準備] を選択できます。
Note
コピー ジョブの進行中は [発送準備] を実行できません。
次のステップ
次のチュートリアルに進み、Data Box Heavy デバイスを Microsoft に返送する方法を学習してください。