Azure Databricks 入门
如果不熟悉 Azure Databricks,可以从这里开始。 本部分包括有关基本帐户设置的说明、Databricks 工作区 UI 的介绍,以及与 Azure Databricks 上的探索数据分析和 ETL 相关的一些基本教程。
有关联机培训资源的信息,请参阅获取免费的 Databricks 培训。
创建 Azure Databricks 工作区
Databricks 建议使用 Azure 门户部署第一个 Azure Databricks 工作区。 也可使用以下选项之一部署 Azure Databricks:
注意
创建 Azure Databricks 工作区时,可以选择“试用版(高级 - 14天免费 DBU)”定价层,让工作区访问免费的高级 Azure Databricks DBU 14 天。
准备阶段
- 必须具有不是免费试用版订阅的 Azure 订阅。 如果你有免费帐户,请完成以下步骤:
- 转到个人资料并将订阅更改为“即用即付”。 请参阅 Azure 免费帐户。
- 移除支出限制。
- 对你所在区域中的 vCPU 请求增加配额。
- 登录 Azure 门户。
- 必须是 Azure 参与者或所有者,或者必须在订阅中注册 Microsoft.ManagedIdentity 资源提供程序。 若要注册 Microsoft.ManagedIdentity 资源提供程序,必须拥有有权执行 操作的自定义角色
/register/action
。 有关详细信息,请参阅 Azure 资源提供程序。
使用门户创建 Azure Databricks 工作区
在 Azure 门户中,选择“创建资源”“分析”>“Azure Databricks”。
在“Azure Databricks 服务”下,提供所需的值以创建 Databricks 工作区。
Property 说明 工作区名称 提供 Databricks 工作区的名称 订阅 从下拉列表中选择自己的 Azure 订阅。 资源组 指定是要创建新的资源组还是使用现有的资源组。 资源组是用于保存 Azure 解决方案相关资源的容器。 有关详细信息,请参阅 Azure 资源组概述。 位置 选择“美国西部 2” 。 有关其他可用区域,请参阅各区域推出的 Azure 服务。 定价层 在“标准”、“高级”和“试用”之间进行选择。 有关这些层的详细信息,请参阅 Databricks 价格页。 选择“查看 + 创建”,然后选择“创建” 。 创建工作区需要几分钟时间。 创建工作区时,可以在“通知”中查看部署状态。 完成此过程后,你的用户帐户将自动添加为工作区的管理员用户。
注意
当工作区部署失败时,仍然会在失败状态下创建工作区。 删除失败的工作区,并创建一个解决部署错误的新工作区。 删除失败的工作区时,托管资源组和任何成功部署的资源也将被删除。
后续步骤
后续步骤取决于是要继续设置帐户组织和安全性,还是要开始构建数据管道:
将 Databricks 工作区连接到外部数据源。 请参阅连接到数据源。
将数据输入工作区。 查看将数据输入 Databricks 湖屋。
将数据载入 Databricks SQL 中的工作区。 请参阅 在 Databricks SQL 中使用流式处理表加载数据。
建立帐户组织和安全性。 请参阅 Azure Databricks 管理入门。
了解如何管理对工作区中数据的访问。 请参阅什么是 Unity Catalog?。
了解如何管理对工作区对象的访问,如笔记本、计算、仪表板和查询。 请参阅访问控制列表。
获取帮助
如果你对设置 Azure Databricks 有任何疑问并需要获取实时帮助,请发送电子邮件至 onboarding-help@databricks.com。
如果你的组织没有订阅 Azure Databricks 支持,或者你不是贵公司支持订阅的授权联系人,可以在 Azure Databricks 办公时间或从 Azure Databricks 社区获取许可问题的答案。
如果需要其他帮助,请注册每周实时演示,以便向 Azure Databricks 专家一起提问,并和专家一起进行练习。 也可参阅这个有关管理和维护环境的最佳做法的博客系列。