Azure Databricks を開始する
Azure Databricks を初めて使用する方は、まずここから始めましょう。 このセクションには、基本的なアカウントのセットアップ手順、Databricks ワークスペース UI のツアー、Azure Databricks での探索的データ分析と ETL に関連するいくつかの基本的なチュートリアルが含まれます。
オンライン トレーニング リソースの詳細については、「無料の Databricks トレーニングを入手する」を参照してください。
Azure Databricks ワークスペースを作成する
Databricks では、Azure portal を使用して最初の Azure Databricks ワークスペースをデプロイすることをお勧めします。 次のいずれかのオプションを使用して Azure Databricks をデプロイすることもできます。
注意
Azure Databricks ワークスペースを作成するときに、試用版 (Premium - 14 日間無料 DBU) 価格レベルを選択して、ワークスペースに無料の Premium Azure Databricks DBU に 14 日間アクセスできます。
開始する前に
- Azure サブスクリプションをお持ちで、しかも無料試用版サブスクリプションでない必要があります。 無料アカウントをお持ちの場合は、次の手順を実行します。
- お使いのプロファイルにアクセスし、サブスクリプションを [従量課金制] に変更します。 「Azure の無料アカウント」を参照してください。
- 使用制限を削除します。
- リージョン内の vCPU のクォータの引き上げを要求します。
- Azure Portal にサインインします。
必要な Azure のアクセス許可
Azure Databricks ワークスペースを作成するには、次のいずれかが必要です。
サブスクリプション レベルで Azure 共同作成者 または 所有者 ロールを持つユーザー。
次のアクセス許可の一覧を持つカスタム ロール定義を持つユーザー。
Microsoft.Databricks/workspaces/*
Microsoft.Resources/subscriptions/resourceGroups/read
Microsoft.Resources/subscriptions/resourceGroups/write
Microsoft.Databricks/accessConnectors/*
Microsoft.Compute/register/action
Microsoft.ManagedIdentity/register/action
Microsoft.Storage/register/action
Microsoft.Network/register/action
Microsoft.Resources/deployments/validate/action
Microsoft.Resources/deployments/write
Microsoft.Resources/deployments/read
注意
これらのプロバイダーがサブスクリプションに既に登録されている場合は、
Microsoft.Compute/register/action
、Microsoft.ManagedIdentity/register/action
、Microsoft.Storage/register/action
、Microsoft.Network/register/action
のアクセス許可は必要ありません。 「リソース プロバイダーを登録する」を参照してください。
portal を使用して Azure Databricks ワークスペースを作成する
Azure portal で、[リソースを作成]>[Analytics]>[Azure Databricks]を選択します。
Azure Databricks Serviceで、Databricks ワークスペースを作成するための値を指定します。
プロパティ 説明 ワークスペース名 Databricks ワークスペースの名前を指定します サブスクリプション ドロップダウンから Azure サブスクリプションを選択します。 リソース グループ 新しいリソース グループを作成するか、既存のリソース グループを使用するかを指定します。 リソース グループは、Azure ソリューションの関連するリソースを保持するコンテナーです。 詳しくは、Azure リソース グループの概要に関するページをご覧ください。 Location [米国西部 2] を選択します。 使用可能な他のリージョンについては、「リージョン別の利用可能な製品」をご覧ください。 価格レベル Standard、Premium、Trial のいずれかを選択します。 これらのレベルの詳細については、Databricks の価格に関するページを参照してください。 [確認と作成]、[作成] の順に選択します。 ワークスペースの作成には数分かかります。 ワークスペースの作成中に、 [通知] でデプロイの状態を表示できます。 この処理が完了すると、ユーザー アカウントが管理者ユーザーとして自動的にワークスペースに追加されます。
注意
ワークスペースのデプロイが失敗した場合でも、ワークスペースはエラー状態で作成されます。 失敗したワークスペースを削除し、デプロイ エラーのない新しいワークスペースを作成します。 失敗したワークスペースを削除すると、管理対象リソース グループと、正常にデプロイされたリソースもすべて削除されます。
次の手順
次の手順は、アカウントの組織とセキュリティのセットアップを続行するか、データ パイプラインの構築を開始するかによって異なります。
Databricks ワークスペースを外部データ ソースに接続します。 「データ ソースに接続する」を参照してください。
ワークスペースにデータを取り込みます。 Azure Databricks lakehouse にデータを取り込むを参照してください。
Databricks SQL のワークスペースにデータをオンボードします。 Databricks SQL のストリーミング テーブルを使用してデータを読み込むを参照してください。
ワークスペース内のデータへのアクセスの管理について学習します。 「Unity Catalog とは?」を参照してください。
ノートブック、コンピューティング、ダッシュボード、クエリなどのワークスペース オブジェクトへのアクセスの管理について学習します。 「アクセス制御リスト」を参照してください。
助けを求める
Azure Databricks の設定に関する質問があり、ライブ ヘルプが必要な場合は、メールでお問い合わせください onboarding-help@databricks.com。
組織に Azure Databricks サポート サブスクリプションがない場合、または会社のサポート サブスクリプションの承認された連絡先でない場合は、Databricks Office Hours または Databricks Communityから多くの質問に対する回答を得ることができます。
追加のヘルプが必要な場合は、毎週のライブ デモにサインアップ して、Databricks の専門家と一緒に質問し、練習してください。 または、環境の管理と保守に関するベスト プラクティスに関するこちらのブログ シリーズに従ってください。