中速から高速のネットワーク帯域幅での大規模なデータセットのデータ転送
この記事では、ご利用の環境に中速から高速のネットワーク帯域幅があり、大規模なデータセットを転送する予定の場合の、データ転送ソリューションの概要を示します。 また、この記事では、推奨されるデータ転送と、このシナリオのそれぞれの主要な機能のマトリックスについても説明します。
利用可能なすべてのデータ転送オプションの概要を理解するには、Azure データ転送ソリューションの選択に関するページに移動します。
シナリオの説明
大規模なデータセットでは、TB から PB の順にデータ サイズを参照します。 中速から高速のネットワーク帯域幅では、100 Mbps から 10 Gbps の順に参照します。
推奨されるオプション
このシナリオで推奨されるオプションは、中速ネットワーク帯域幅であるか、高速ネットワーク帯域幅であるかによって異なります。
ネットワーク帯域幅 - 中 (100 Mbps から 1 Gbps)
中速ネットワーク帯域幅では、ネットワーク経由のデータ転送時間をプロジェクションする必要があります。
以下の表を使用して時間を予測し、それに基づいて、オフライン転送かネットワーク経由の転送を選びます。 表には、さまざまなネットワーク帯域幅に対する、ネットワーク データ転送の予想時間が示されています (90% の使用率と仮定)。
ネットワーク転送に時間がかかりすぎると予想される場合は、物理デバイスを使用する必要があります。 この場合に推奨されるオプションは、Azure Data Box ファミリのデバイスを使用するオフライン転送、または独自のディスクを使用する Azure Import/Export です。
- オフライン転送用の Azure Data Box ファミリ: 時間、ネットワークの可用性、またはコストが限られている場合は、Microsoft が供給する Data Box デバイスのデバイスを使用して、大量のデータを Azure に移動します。 Robocopy などのツールを使って、オンプレミスのデータをコピーします。 転送対象のデータのサイズに応じて、Data Box Disk、Data Box、Data Box Heavy から選択できます。
- Azure Import/Export – 大量のデータを安全に Azure Blob Storage と Azure Files にインポートするために、独自のディスク ドライブを送付して Azure Import/Export サービスを使用します。 また、このサービスでは、Azure Blob Storage からディスク ドライブにデータを転送し、オンプレミスのサイトに送付できます。
ネットワーク転送が妥当であると予想される場合は、「ネットワーク帯域幅 - 高」で詳しく説明されている以下のツールのいずれかを使用できます。
ネットワーク帯域幅 - 高 (1 Gbps から 100 Gbps)
利用可能なネットワーク帯域幅が高い場合は、次のツールのいずれかを使用します。
- AzCopy - このコマンドライン ツールを使用すると、最適なパフォーマンスで Azure BLOB、Files、および Table ストレージとの間で相互に簡単にデータをコピーできます。 AzCopy はコンカレンシーと並列処理をサポートし、中断された場合にコピー操作を再開することができます。
- Azure Storage REST API/SDK – アプリケーションの構築時に、Azure Storage REST API に対するアプリケーションを開発し、複数の言語で提供される Azure SDK を使用できます。
- オンライン転送用の Azure Data Box ファミリ - Azure Stack Edge と Data Box Gateway はオンラインのネットワーク デバイスであり、Azure の内外にデータを移動することができます。 継続的なインジェストと、アップロード前のデータの前処理を同時に行う必要がある場合は、Azure Stack Edge の物理デバイスを使用します。 Data Box Gateway は、同じデータ転送機能を備えた、デバイスの仮想バージョンです。 いずれの場合も、データ転送はデバイスによって管理されます。
- Azure Data Factory – 転送操作をスケールアウトする場合や、オーケストレーションとエンタープライズ レベルの監視機能が必要な場合は、Data Factory を使用する必要があります。 Data Factory を使用し、複数の Azure サービス間またはオンプレミスで、あるいは 2 つを組み合わせて、ファイルを定期的に転送します。 Data Factory では、さまざまなデータ ストアからデータを取り込み、データ移動とデータ転送を自動化するデータ駆動型ワークフロー (パイプラインと呼ばれる) を作成し、スケジュールを設定できます。
主な機能の比較
次の表は、推奨されるオプションの主な機能の違いをまとめたものです。
ネットワーク帯域幅 - 中
オフライン データ転送を使用する場合は、以下の表を使用して、主な機能の違いを理解します。
Data Box Disk | Data Box | Data Box Heavy | インポート/エクスポート | |
---|---|---|---|---|
データ サイズ | 最大 35 TB | デバイスあたり最大 80 TB | デバイスあたり最大 800 TB | 変数 |
データの種類 | Azure BLOB Azure Files* |
Azure BLOB Azure Files |
Azure BLOB Azure Files |
Azure BLOB Azure Files |
フォーム ファクター | 注文ごとに 5 つの SSD | 1 X 50 lbs。 1 回の注文ごとにデスクトップ サイズのデバイス | 1 X 最大 500-lbs。 1 回の注文ごとに大容量のデバイス | 1 回の注文ごとに最大 10 台の HDD/SSD |
初期セットアップ時間 | 低 (15 分) |
低から中 (<30 分) |
中 (1 ~ 2 時間) |
中から難 (可変) |
Azure にデータを送信する | はい | Yes | はい | はい |
Azure からデータをエクスポートする | いいえ | いいえ | いいえ | はい |
暗号化 | AES 128 ビット | AES 256 ビット | AES 256 ビット | AES 128 ビット |
ハードウェア | Microsoft による提供 | Microsoft による提供 | Microsoft による提供 | お客様による提供 |
ネットワーク インターフェイス | USB 3.1/SATA | RJ 45、SFP+ | RJ45、QSFP+ | SATA II/SATA III |
パートナー統合 | 一部 | 高 | 高 | 一部 |
送付 | Microsoft による管理 | Microsoft による管理 | Microsoft による管理 | お客様による管理 |
データの移動時に使用する | コマース境界内 | コマース境界内 | コマース境界内 | 地理的境界を越える (US から EU など) |
料金 | 料金 | 料金 | 料金 | 料金 |
* Data Box Disk では大きなファイル共有はサポートされず、ファイルのメタデータは維持されません
オンラインのデータ転送を使用する場合は、高速ネットワーク帯域幅に対して、次のセクションの表を使用します。
ネットワーク帯域幅 - 高
ツール AzCopy、 Azure PowerShell、 Azure CLI |
Azure Storage REST API、SDK | Data Box Gateway または Azure Stack Edge | Azure Data Factory | |
---|---|---|---|---|
データの種類 | Azure BLOB、Azure Files、Azure Tables | Azure BLOB、Azure Files、Azure Tables | Azure BLOB、Azure Files | データ ストアと形式について、70 個を超えるデータ コネクタがサポートされます |
フォーム ファクター | コマンドライン ツール | プログラマティック インターフェイス | Microsoft では仮想 または物理デバイスが提供されます |
Azure ポータルのサービス |
最初の 1 回限りのセットアップ | 簡単 | 中 | 簡単 (30 分未満) から中 (1 から 2 時間) | 広範 |
データの前処理 | いいえ | いいえ | はい (Edge コンピューティングを使用) | はい |
その他のクラウドからの転送 | いいえ | いいえ | いいえ | はい |
ユーザーの種類 | IT プロフェッショナルまたは開発者 | Dev | IT プロフェッショナル | IT プロフェッショナル |
料金 | 無料、データ エグレス料金を適用 | 無料、データ エグレス料金を適用 |
Azure Stack Edge の価格 Data Box Gateway の価格 |
料金 |