U-SQL データベース プロジェクトを使った Azure Data Lake 用 U-SQL データベースの開発
重要
Azure Data Lake Analytics 2024 年 2 月 29 日に廃止されました。 詳細については、このお知らせを参照してください。
データ分析の場合、organizationでは Azure Synapse Analytics または Microsoft Fabric を使用できます。
U-SQL データベースは、非構造化データに対する構造化ビューと、テーブル内で管理された構造化データに対する構造化ビューを提供します。 また、構造化データとカスタム コードを整理するための一般的なメタデータ カタログ システムを提供します。 データベースは、これらの関連オブジェクトをグループ化する概念です。
詳細については、U-SQL データベースおよびデータ定義言語 (DDL) を参照してください。
U-SQL データベース プロジェクトは、開発者が高速かつ簡単に U-SQL データベースの開発、管理、および配置を行えるようにする Visual Studio のプロジェクトの一種です。
U-SQL データベース プロジェクトの作成
バージョン 2.3.3000.0 以降の Azure Data Lake Tools for Visual Studio には、U-SQL データベース プロジェクトと呼ばれる新しいプロジェクト テンプレートが追加されています。 U-SQL プロジェクトを作成するには、[File](ファイル) > [New](新規) > [Project](プロジェクト) の順に選択します。 U-SQL データベース プロジェクトは、[Azure Data Lake] > [U-SQL] ノードにあります。
データベース プロジェクトを使用した U-SQL データベース オブジェクトの開発
U-SQL データベース プロジェクトを右クリックします。 [追加] > [新しい項目] の順に選択します。 サポートされているすべての種類のオブジェクトが [新しい項目の追加] ウィザードに表示されます。
テーブル値関数などの非アセンブリ オブジェクトの場合、新しい項目の追加後に新しい U-SQL スクリプトが作成されます。 エディターで、そのオブジェクトの DDL ステートメントの開発を始めることができます。
アセンブリ オブジェクトの場合、このツールには、アセンブリを登録し、DLL ファイルやその他のファイルを展開するのに役立つわかりやすい UI エディターが用意されています。 次の手順は、アセンブリ オブジェクトの定義を U-SQL データベース プロジェクトに追加する方法を示したものです。
UDO/UDAG/UDF を含む C# プロジェクトへの参照を U-SQL データベース プロジェクトに追加します。
アセンブリ デザイン ビューで、 [Create assembly from reference](参照からアセンブリを作成) ボックスの一覧から参照先アセンブリを選択します。
[マネージドの依存関係] と [追加ファイル] が存在する場合は追加します。 追加ファイルを追加する場合、ローカル コンピューターと後のビルド コンピューターの両方で確実にアセンブリを検索できるようにするため、ツールは相対パスを使用します。
@_DeployTempDirectory は、ビルド出力フォルダーを指すツールの定義済み変数です。 ビルド出力フォルダーには、アセンブリ名を名前とするサブフォルダーがすべてのアセンブリにあり、 すべての DLL および追加ファイルがそのサブフォルダーに格納されます。
U-SQL データベース プロジェクトの作成
U-SQL データベース プロジェクトのビルド出力は、名前に .usqldbpack
というサフィックスのついた U-SQL データベース展開パッケージです。
.usqldbpack
パッケージは .zip ファイルで、DDL フォルダー内の単一の U-SQL スクリプトにはすべての DDL ステートメントが、Temp フォルダーにはアセンブリのすべての DLL と追加ファイルが含まれています。
詳細については、MSBuild コマンド ラインと Azure DevOps Services ビルド タスクを使用して U-SQL データベース プロジェクトをビルドする方法に関するページをご覧ください。
U-SQL データベースの配置
.usqldbpack パッケージは、ローカル アカウントと Azure Data Lake Analytics アカウントのどちらにでも、Visual Studio またはデプロイ SDK を使用して配置できます。
Visual Studio での U-SQL データベースの配置
Visual Studio で、U-SQL データベース プロジェクトまたは .usqldbpack パッケージを使用して U-SQL データベースを配置できます。
U-SQL データベース プロジェクトによる配置
U-SQL データベース プロジェクトを右クリックし、 [展開] を選択します。
U-SQL データベースの配置ウィザードで、データベースを配置する [ADLA account](ADLA アカウント) を選択します。 ローカル アカウントと ADLA アカウントの両方がサポートされています。
[Database Source](データベース ソース) は、プロジェクトのビルド出力フォルダー内の .usqldbpack パッケージを指すように自動的に設定されます。
データベースを作成するには、 [データベース名] に名前を入力します。 ターゲットの Azure Data Lake Analytics アカウントに同じ名前のデータベースが存在する場合、データベースは再作成されず、データベース プロジェクトに定義されているすべてのオブジェクトが作成されます。
U-SQL データベースを配置するには、 [送信] を選択します。 すべてのリソース (アセンブリおよび追加ファイル) がアップロードされ、すべての DDL ステートメントを含む U-SQL ジョブが送信されます。
U-SQL データベース展開パッケージによる配置
[サーバー エクスプローラー] を開きます。 データベースの配置先となる Azure Data Lake Analytics アカウントを展開します。
右クリックするか、 U-SQL データベースを長押しし、[ データベースの配置] を選択します。
[Database Source] (データベース ソース) に U-SQL データベース展開パッケージ (.usqldbpack ファイル) のパスを設定します。
データベースを作成するには、 [データベース名] に名前を入力します。 ターゲットの Azure Data Lake Analytics アカウントに同じ名前のデータベースが既に存在する場合、データベース プロジェクトで定義されているすべてのオブジェクトは、データベースを再作成せずに作成されます。
SDK を使用した U-SQL データベースの配置
PackageDeploymentTool.exe
は、U-SQL データベースを配置する際に役立つプログラミングとコマンド ライン インターフェイスを提供します。 SDK は、 にある U-SQL SDK NuGet パッケージに build/runtime/PackageDeploymentTool.exe
含まれています。
SDK と、U-SQL データベースを配置する CI/CD パイプラインの設定方法の詳細については、こちらを参照してください。
U-SQL データベース プロジェクトの参照
U-SQL プロジェクトから、U-SQL データベース プロジェクトを参照できます。 この参照は、2 つのワークロードに影響します。
- プロジェクトのビルド: U-SQL スクリプトをビルドする前に、参照先のデータベース環境が設定されます。
- (local-project) アカウントに対するローカル実行: U-SQL スクリプトを実行する前に、参照先のデータベース環境が (local-project) アカウントに配置されます。 ローカル実行と、(local-machine) アカウントと (local-project) アカウントの違いについては、こちらを参照してください。
U-SQL データベース参照の追加方法
ソリューション エクスプローラーで U-SQL プロジェクトを右クリックし、 [U-SQL データベース参照の追加] を選択します。
現在のソリューションの U-SQL データベース プロジェクトまたは U-SQL データベース パッケージ ファイルからのデータベース参照を構成します。
データベースの名前を指定します。