次の方法で共有


Analytics Platform System のサーバー キャパシティ プランニング ワークシートの読み込み

このキャパシティ プランニング ワークシートは、SQL Server PDW にデータを読み込むための読み込みサーバーの要件を決定するのに役立ちます。 これを使用して、既存の読み込みサーバーを購入またはプロビジョニングするためのプランを作成します。

ワークシートのメモ

  1. このワークシートは、dwloader コマンド ライン読み込みツールを使用してデータを読み込むサーバーに適用されます。

  2. 統合サービスまたはサード パーティの読み込みツールを使用してデータを読み込む場合、要件は読み込みプロセスの違いによって異なる場合があります。

  3. ほとんどの要件は、圧縮または圧縮されていないデータ ファイルの読み込みに適用されます。要件の違いは太字で示されています。

Clipboard キャパシティ プランニング ワークシート

このワークシートを印刷し、独自の要件を入力します。

コンポーネント 要件 この列に独自の要件を入力します 推奨事項
Storage 特定の期間に読み込みサーバーに格納する予定の最大バイト数。 Pencil icon ストレージ要件を決定するには、特定の期間に読み込みサーバーに格納する予定のデータの量を確認します。 容量の要件は、ファイルの読み込み専用です。オペレーティング システムと読み込みファイルは、異なるディスク アレイに配置する必要があります。

たとえば、毎日 3 回ディスクから 100 GB のデータを読み込む予定で、週の終わりまでデータ ファイルを削除しない場合、データ ファイルを格納するには最低 2.1 TB が必要です。 変動と増加を考慮して保守的になり、約 30% 追加のストレージを取得することをお勧めします。 この例では、2.73 TB の記憶域スペースが適しています。
読み込みレート PDW に読み込むデータの 1 時間あたりの最大バイト数。 Pencil icon これは見積もりです。 この要件を計算するときは、ファイルがすでに読み込みサーバー上にあり、他の読み込み条件が可能な限り良好であることを前提とします。

例: dwloader は常に圧縮されていないデータを PDW に送信するため、データの圧縮性を考慮する必要はありません。 データ型の変換と変換先テーブルのサイズを考慮する必要はありません。
ネットワーク ネットワーク接続の種類。 Pencil icon 負荷速度の要件に最適なネットワーク接続の種類を決定します。

たとえば、InfiniBand または 10 Gbit イーサネットでは、最適な読み込み速度が提供されます。 1 Gbit イーサネットでは、1 時間あたり 360 GB 以下の負荷レートに制限されます。
I/O 読み取りと書き込みの 1 時間あたりのバイト数。 Pencil icon データを読み込むには、dwloader を PDW に送信する前に、ディスクからすべてのデータを読み取る必要があります。

各読み込みサーバーは、アプライアンスがすべての読み込みソースからデータを受信できるよりも高速にデータを読み込むことはできません。 コストを節約するには、アプライアンスの負荷容量を超えないように、読み込み用の I/O 読み取り容量を計画します。

次に例を示します。
PDW は、1 時間あたり最大 1.8 TB のレートでデータを受信し、1 ラック アプライアンスに読み込みます。 ラックが 2 つ以上のアプライアンスの場合、最大負荷速度は 1 時間あたり 3.6 TB です。

複数の読み込みサーバーから同時に読み込みすることを計画している場合、各読み込みサーバーの I/O 要件は、1 つのサーバーがすべての読み込みを実行する場合よりも少なくなります。

たとえば、1 台の読み込みサーバーは、1 ラック アプライアンスに対して 1 時間あたり最大 1.8 TB を読み込むことができます。 2 台の読み込みサーバーは、それぞれ 1 ラック アプライアンスに 1 時間あたり 900 GB を同時に読み込むことができます。 コンカレンシーのレベルが高いほど、効率と最大スループットが低下する可能性があります。

I/O 容量については、読み込みサーバーで発生するすべての I/O を考慮します。 読み込みサーバーに、ETL サーバーからのデータ ファイルの受信など、データの読み込みに加えて他の I/O トラフィックがある場合、I/O 要件が増加します。

圧縮データの場合、I/O 要件はデータ圧縮率によって異なります。 dwloader は圧縮されたデータを読み取り、PDW に送信する前に圧縮を解除します。 圧縮率が高いほど、読み込みサーバーがディスクから読み取る必要があるデータが少なくなります。

たとえば、必要な読み込み速度が 1 時間あたり 1.8 TB で、データが 2:1 圧縮で読み込みサーバーに格納されている場合、読み込みサーバーは 1.8 TB ではなく 1 時間あたり 900 GB をディスクから読み取るだけで済みます。 圧縮率が 3:1 の場合、読み込みサーバーはディスクから 1 時間あたり 600 GB を読み取る必要があります。
CPU ソケットの数。 Pencil icon 非圧縮データをロードする場合、dwloader は CPU を大量に使用するアプリケーションではありません。 最小要件として、最近製造された 2 ソケット サーバーを使用することをお勧めします。

圧縮データをロードするには、PDW に送信する前にデータを解凍するのに十分な CPU パワーが必要です。 dwloader は、一度に 10 個のアクティブなスレッドを実行できます。 10 個の圧縮ファイルを同時にロードする予定がある場合は、サーバーに少なくとも 10 コア CPU または 2 つの 6 コア CPU を搭載することをお勧めします。
RAM GB のメモリで Windows が読み込み中にファイルをキャッシュできるようにします。 Pencil icon dwloader は、読み込みサーバーで RAM をほとんど使用しません。 パフォーマンスを向上させるため、Windows はロード ファイルをディスクから読み取った後、メモリを使用してファイルをキャッシュします。

RAM の要件を決定するには、Windows Server のインストールとサード パーティ製アプリケーションの要件を参照してください。 他のソースからの要件がない場合は、最低でも 32 GB をお勧めします。

圧縮データの場合は、展開が高速化されるため、RAM の高速化が役立ちます。

参照

ローディングサーバー コマンドラインローダー を取得して構成する