Parallel Data Warehouse のコンポーネント - Analytics Platform System
この記事では、Analytics Platform System のアプライアンス ソフトウェアとアプライアンス以外のソフトウェア コンポーネントについて説明します。
アプライアンス ソフトウェア - クエリ処理およびユーザー データ ストレージ
制御ノード
MPP Engine
MPP エンジンは、超並列処理 (MPP) システムの頭脳のようなものです。 その後、次の処理を実行します。
並列クエリ プランを作成して、コンピューティング ノードでの並列クエリ実行を調整します。
すべてのデータベースのメタデータおよび構成データを格納および調整します。
SQL Server PDW データベースの認証と承認を管理します。
ハードウェアとソフトウェアの状態を追跡します。
データ移動サービス (DMS)
データ移動サービス (DMS) は、PDW の「シークレット ソース」の一部です。 その後、次の処理を実行します。
SQL Server PDW ノードとの間でデータを転送します。
ノード間でデータを転送する必要があるクエリ操作を処理します。
データ転送速度を最適化することで、クエリのパフォーマンスが向上します。
管理コンソール
管理コンソールは、アプライアンスの状態、正常性、およびパフォーマンスの情報を表示する Web アプリケーションです。
構成マネージャー
Configuration Manager (dwconfig.exe) は、アプライアンス管理者が Analytics Platform System の構成に使用するツールです。
ノード データベースを制御する
SQL Server は、コントロール ノード上のすべてのデータベースを管理します。
シェル データベースは、すべての分散ユーザー データベースのメタデータを管理します。
TempDB には、アプライアンス全体のすべてのユーザーの一時テーブルのメタデータが含まれています。
Master は、制御ノード上の SQL Server のマスター テーブルです。
計算ノード
コンピューティング ノードは、並列データ処理とストレージ ユニットです。 直接アタッチされたストレージがあり、SQL Server を使用してユーザー データを管理します。
データ移動サービス (DMS)
データ移動サービス (DMS) は、各コ計算ノードで実行され、次の操作を行います。
DMS は、並列クエリの処理の一環として、他の計算ノードと制御ノードとの間でデータを転送します。
DMS は、各計算ノードで実行され、データの読み込みを並列で受け取ります。 データは、読み込みサーバーから計算ノードに直接並列で読み込まれます
DMS は、各計算ノードからバックアップ サーバーに直接データを転送します。
PolyBase を使用して、DMS は外部 Hadoop クラスターまたは Azure Storage BLOB との間でデータを転送します。
計算ノード データベース
各計算ノードは、SQL Server のインスタンスを実行してクエリを処理し、ユーザー データを管理します。
アプライアンス ファブリック
アプライアンス ファブリックは、アプライアンスのオペレーティング システム、サービス、およびネットワーク インフラストラクチャを提供します。
ドメイン コントローラー
Active Directory (AD) Domain Services (DS)
Analytics Platform System は、Analytics Platform System ノード間で認証を実行し、SQL Server PDW Windows 認証ログインの認証を管理します。
DNS サービス
Windows ドメイン ネーム サービス (DNS) は、Analytics Platform System アプライアンスのドメイン名を IP アドレスに解決します。
Windows Deployment Services
Windows 展開サービス (WDS) は、Windows Server オペレーティング システムをアプライアンスに展開します。 アプライアンス全体のすべてのホストと仮想マシンにデプロイされます。
DHCP サービスは IP アドレスを作成し、アプライアンス ドメイン内のホストが事前に構成された IP アドレスを持たずにアプライアンス ネットワークに参加できるようにします。
Virtual Machine Manager
Analytics Platform System では、仮想化を使用して高可用性を実現します。 Virtual Machine Manager は、オペレーティング システムを物理ホストに展開するために System Center をホストします。
Windows Server Update Services (WSUS) を使用して、すべてのホストと仮想マシンに対して Windows Update を適用または削除します。
Windows Server
アプライアンス内のすべてのホストと仮想マシンは、Windows Server オペレーティング システムを実行します。
フェールオーバー クラスタリング
Windows フェールオーバー クラスタリングでは、ホストが失敗した場合にパッシブ ホストでプロセスを再起動できます。
記憶域スペース
Windows 記憶域スペースは、ユーザー データを計算ノードの小さなグループの記憶域プールとして管理します。 計算ノードで障害が発生した場合でも、グループ内の別の計算ノードを介してデータにアクセスできます。
Hyper-V
Microsoft Hyper-V Server は、シンプルで信頼性の高い仮想化ソリューションを提供します。 Analytics Platform System では、仮想化を使用して CPU リソースのバランスを取り、PDW ノードとアプライアンス ファブリック コンポーネントの高可用性を提供します。
非リレーショナル データ
PolyBase テクノロジは、SQL Server PDW データを外部 Hadoop データと統合します。 Hadoop データは、次のいずれかの Hadoop データ ソースに格納できます。
Hortonworks Hadoop ディストリビューション
Hadoop の Cloudera ディストリビューション
HDInsight データセットは Azure Blob Storage に格納されています
クエリ ツール
クエリは、クエリの MPP の性質に合わせて Transact-SQL が変更された状態で書き込まれます。 すべてのクエリが 制御ノードに送信され、コンピューティング ノード全体でクエリを実行する並列クエリ プランが生成されます。
SQL Server Data Tools (SSDT)
SQL Server Data Tools は Visual Studio 内で実行され、SQL Server PDW にクエリを送信するための推奨 GUI ツールです。 これは、オブジェクト エクスプローラー内を移動できるようにすることで、SQL Server Management Studio と似ています。
Visual Studio をまだお持ちでない場合は、必要なツールを無料でダウンロードできます。
sqlcmd コマンド ライン クエリ ツール
sqlcmd は、Transact-SQL ステートメントとシステム コマンドを実行するための SQL Server コマンド ライン ツールです。 これは SQL Server PDW で動作し、SQL Server PDW に対してクエリを実行するために推奨されるコマンド ライン ツールです。 sqlcmd を使用すると、コマンド ラインから、バッチ ファイルとして、または Windows PowerShell から対話形式で Transact-SQL ステートメントを実行できます。
統合サービス
統合サービス を使用して SQL Server PDW のクエリを実行できます。
リンク サーバー
SQL Server のリンク サーバー接続を使用すると、SQL Server を使用して Transact-SQL ステートメントを SQL Server PDW に送信できます。
ビジネス インテリジェンス ツール
Analysis Services
SQL Server PDW は、Analysis Services データベースと Excel PowerPivot モデルの有効なデータ ソースです。 OLE DB プロバイダーを使用すると、多次元オンライン分析処理 (MOLAP) またはリレーショナル オンライン分析処理 (ROLAP) ストレージを使用するように Analysis Services キューブを構成できます。
レポート ビルダー
SQL Server レポート ビルダーを使用して、Reporting Services 用に開発するレポートの SQL Server データ ソースとして SQL Server PDW を使用できます。 レポート モデルの SQL Server ソースとして、SQL Server PDW を使用することもできます。 レポート マネージャーまたはレポート サーバー API を使用すると、SQL Server PDW データベースからモデルを生成できます。
Power Pivot for Excel
Excel のデータ分析機能を大幅に拡張する無料ダウンロードである PowerPivot for Excel を使用して SQL Server PDW に接続できます。
ツールの読み込み
統合サービス
SQL Server Integration Services を使用して、分析プラットフォーム システム (PDW) にデータを読み込むことができる分析プラットフォーム システム (PDW) 固有の変換先アダプターをインストールします。
dwloader コマンド ライン ローダー
dwloader は、読み込みサーバーから SQL Server PDW 計算ノードにデータを並列に読み込むコマンドライン読み込みツールです。
PolyBase for Hadoop の統合
PolyBase テクノロジを使用すると、Hadoop クラスターから SQL Server PDW のリレーショナル テーブルに非リレーショナル データを読み込むことができます。 Hadoop データは、外部 Hadoop クラスターまたは Azure Blob Storage に配置できます。
データベースのバックアップと復元
SQL Server PDW では、Transact-SQL データベースのバックアップと復元のコマンドを使用して、バックアップ サーバーとの間でユーザー データベースを並行してバックアップおよび復元します。 SQL Server PDW は、バックアップを Windows ファイル共有内のディレクトリに書き込み、同様に Windows ファイル共有からデータを復元します。
詳細については、「ハードウェアのバックアップと読み込みの計画」および「バックアップと復元の概要」を参照してください
リモート テーブルのコピー
リモート テーブル コピー機能を使用すると、SQL Server PDW データベースからリモート (非アプライアンス) SMP SQL Server データベースにテーブルをコピーできます。 これにより、SQL Server PDW のハブおよびスポークのシナリオが可能になります。
監視
Analytics Platform System には、アプライアンスのアクティビティを監視するいくつかの方法があります
管理コンソール
管理者コンソールを使用すると、アプライアンスの正常性に関する現在の状態を表示できます。 これは、制御ノード上の Web アプリケーションとして実行され、https 経由でアクセスできます。
詳細については、「管理コンソールを使用したアプライアンスの監視 (Analytics Platform System)」を参照してください
システム ビュー
管理者コンソールは、システム ビュークエリに基づいています。 必要な特定の情報を取得するには、システム ビューを個別に照会します。
詳細については、「システム ビューを使用したアプライアンスの監視 (Analytics Platform System)」を参照してください
System Center Operations Manager
SQL Server PDW 用の System Center Operations Manager (SCOM) 管理パックがあります。
SCOM 用にアプライアンスを構成するには、「System Center Operations Managerを使用してアプライアンスを監視する (Analytics Platform System)」を参照してください