对于 2020 年 8 月之前创建的旧版工作区,请按照以下步骤确认是否仍在工作区中启用:
重要
Databricks 建议将所有 init 脚本配置为群集范围的初始化脚本,并使用群集策略跨工作区管理它们。 请参阅群集范围的初始化脚本。
全局初始化脚本在工作区中配置了单个用户或旧版无隔离共享访问模式的所有群集上运行。 只有工作区管理员才能创建全局 init 脚本。 你可以使用 UI 或 REST API 来创建它们。
重要
在使用全局初始化脚本之前,请考虑以下事项:
- 全局初始化脚本不会在所有群集类型上运行。 仅支持单个用户和无隔离共享访问模式。
- 可以轻松地添加库,或者进行其他可能造成意外影响的修改。 应尽可能使用群集范围 init 脚本。
- 创建群集并启用群集日志传送的任何用户都可以查看全局 init 脚本的
stderr
和stdout
输出。 应确保全局 init 脚本不输出任何敏感信息。
可通过配置日志传送并检查 init 脚本日志来排查全局 init 脚本问题。 请参阅 init 脚本日志记录。
注意
全局 init 脚本不在提供群集的模型上运行。
使用 UI 添加全局 init 脚本
若要使用管理员设置来配置全局 init 脚本,请执行以下操作:
转到管理员设置,然后单击“计算”选项卡。
单击“全局初始化脚本”旁边的“管理”。
单击“+ 添加”。
通过在“脚本”字段中键入内容、粘贴或拖动文本文件,为脚本命名。
注意
Init 脚本不能大于 64KB。 如果脚本超过该大小,则尝试保存时将出现错误消息。
如果为工作区配置了多个全局 init 脚本,请设置新脚本的运行顺序。
要在保存后为所有新群集和重启的群集启用脚本,请切换为“启用”。
重要
添加全局 init 脚本或对 init 脚本的名称、运行顺序或启用状态进行更改时,这些更改在重启群集后才会生效。
单击“添加” 。
使用 Terraform 添加全局 init 脚本
可以使用 Databricks Terraform 提供程序和 databricks_global_init_script 添加全局 init 脚本。
使用 UI 编辑全局 init 脚本
- 转到管理员设置,然后单击“计算”选项卡。
- 单击“全局初始化脚本”旁边的“管理”。
- 单击一个脚本。
- 编辑该脚本。
- 单击“确认” 。
使用 API 配置全局 init 脚本
工作区管理员可以使用全局 Init 脚本 API 在工作区中添加、删除、重新排序并获取有关全局 init 脚本的信息。