クイック スタート: データベース テンプレートを利用して新しい Lake データベースを作成する
このクイック スタートでは、データベース テンプレートを適用して Lake データベースを作成し、新しいモデルにデータを配置し、統合エクスペリエンスを使用してデータを分析する方法について、完全なサンプル シナリオを提供します。
前提条件
- ギャラリーから lake データベース テンプレートを探索するには、少なくとも Synapse ユーザー ロールのアクセス許可が必要です。
- Azure Synapse ワークスペースで lake データベースを作成するには、Synapse 管理者または Synapse 共同作成者のアクセス許可が必要です。
- テーブルを作成する際に [データ レイクから] オプションを使用する場合は、データ レイクに対するストレージ BLOB データ共同作成者のアクセス許可が必要です。
データベース テンプレートから Lake データベースを作成する
新しいデータベース テンプレート機能を使用して、データベースのデータ モデルを構成するために使用できる Lake データベースを作成します。
このシナリオでは、Retail
データベース テンプレートを使用し、次のエンティティを選択します。
- RetailProduct - 製品とは、潜在顧客のニーズを満たす可能性のある市場に提供できるものすべてを指します。 製品に関連付けられた物理的、心理的、象徴的、およびサービスの属性すべてがその製品に含まれます。
- Transaction - 実行可能な作業または顧客アクティビティの最低レベルです。 トランザクションは、1 つ以上の個別のイベントで構成されます。
- TransactionLineItem - Product と Quantity に分類されるトランザクションのコンポーネントです (項目ごとに 1 つ)。
- Party - パーティとは、ビジネスの目的となる個人、組織、法人、ソーシャル組織、または事業単位です。
- Customer - 顧客は、製品またはサービスを所有する、または購入した個人または法人です。
- Channel - チャネルは、製品またはサービスが販売または配布される手段です。
エンティティを見つける最も簡単な方法は、テーブルを含むさまざまなビジネス領域の上にある検索ボックスを使用することです。
Lake データベースを構成する
データベースを作成したら、ストレージ アカウントとファイルパスが、データを格納する場所に設定されていることを確認します。 パスは、既定で Azure Synapse Analytics 内のプライマリ ストレージ アカウントに設定されますが、必要に応じて変更できます。
レイアウトを保存し、Azure Synapse 内で使用可能にするには、すべての変更を [発行] します。 この手順により、Lake データベースのセットアップが完了し、Azure Synapse Analytics の内部および外部で利用できるようになります。
Lake データベースにデータを取り込む
Lake データベースにデータを取り込むには、データをデータベース テーブルに直接読み込むためのワークスペース DB コネクタを持つパイプラインを実行できます。これには、コーディングなしのデータ フロー マッピングが使用されます。 対話型の Spark ノートブックを使用して、Lake データベース テーブルにデータを取り込むこともできます。
%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);
データにクエリを実行する
Lake データベースを作成した後、データに対してクエリを実行するさまざまな方法があります。 現在、サーバーレス SQL プールの SQL データベースがサポートされており、新しく作成された lake データベースの形式は自動的に理解されます。
SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]
Azure Synapse 内でデータにアクセスするもう 1 つの方法は、新しい Spark ノートブックを開き、そこで統合エクスペリエンスを使用することです。
df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)
機械学習モデルをトレーニングする
Lake データベースを使用して機械学習モデルをトレーニングし、データをスコア付けすることができます。 詳細については、「機械学習モデルをトレーニングする」を参照してください
次のステップ
次のリンクを使用して、データベース デザイナーの機能の詳細を引き続き確認します。