Referência de configuração
Este artigo fornece referência para chaves compatíveis com a configuração de Pacotes de Ativos do Databricks (YAML). Consulte O que são os Pacotes de Ativos do Databricks?.
Para obter exemplos completos de pacote, consulte Exemplos de configuração do pacote e Repositório GitHub de exemplos de pacote.
artefato
Define as configurações para criar um artefato.
Chave | Tipo | Descrição |
---|---|---|
build |
corda | Um conjunto opcional de comandos de build a serem executados localmente antes da implantação. |
executable |
corda | O tipo executável. Os valores válidos são bash , sh e cmd . |
files |
Mapeamento | O caminho relativo ou absoluto para os arquivos de artefato criados, definido como artifact_file. |
path |
corda | O caminho local do diretório do artefato. |
type |
corda | Necessário se o artefato for uma roda do Python. O tipo do artefato. Os valores válidos são whl e jar . |
artefatos
Define os atributos para compilar artefatos, em que cada chave é o nome do artefato e o valor é um Mapa que define as configurações de compilação do artefato . Para obter informações sobre o mapeamento artifacts
, consulte artefatos.
As configurações de artefato definidas no nível superior da configuração do pacote podem ser substituídas no mapeamento de targets
. Consulte Definir configurações de artefato nos Pacotes de Ativos do Databricks.
artifacts:
<artifact-name>:
<artifact-field-name>: <artifact-field-value>
Exemplo
artifacts:
default:
type: whl
build: poetry build
path: .
artifact_file
Define um arquivo de artefato em um pacote.
Chave | Tipo | Descrição |
---|---|---|
source |
corda | Obrigatório O arquivo de origem do artefato. |
pacote
Os atributos do pacote. Consulte pacote.
Chave | Tipo | Descrição |
---|---|---|
cluster_id |
corda | A ID de um cluster a ser usada para executar o pacote. Consulte cluster_id. |
databricks_cli_version |
corda | A versão da CLI do Databricks a ser usada para o pacote. Consulte databricks_cli_version. |
deployment |
Mapeamento | A definição da implantação do pacote. Para os atributos com suporte, consulte implantação e Modos de implantação do Pacote de Ativos do Databricks. |
git |
Mapeamento | Os detalhes do controle de versão do Git associados ao bundle. Para obter atributos com suporte, consulte git e git. |
name |
corda | Obrigatório O nome do pacote. |
uuid |
corda | Reservado. Um UUID (Identificador Universal exclusivo) para o pacote que identifica exclusivamente o pacote em sistemas internos do Databricks. Isso é gerado quando um projeto de pacote é inicializado usando um modelo do Databricks (usando o comando databricks bundle init ). |
implantação
Define atributos de implantação do pacote.
Chave | Tipo | Descrição |
---|---|---|
fail_on_active_runs |
Booliano | Se deve falhar em execuções ativas. Se isso estiver definido como true uma implantação em execução poderá ser interrompida. |
lock |
Mapeamento | Os atributos de bloqueio de implantação. Consulte bloqueio. |
experimental
Define atributos para recursos experimentais.
Chave | Tipo | Descrição |
---|---|---|
python_wheel_wrapper |
Booliano | Se deve usar um wrapper de wheel do Python. |
scripts |
Comando (cadeia de caracteres) | Os comandos a serem executados |
use_legacy_run_as |
Booliano | Se deve usar o comportamento run_as herdado. |
git
Define os detalhes do controle de versão do Git associados ao pacote. Consulte git.
Chave | Tipo | Descrição |
---|---|---|
origin_url |
corda | A URL de origem do repositório. Consulte git. |
branch |
corda | O nome do branch do Git. Consulte git. |
subvenção
Define o acesso aos objetos do Catálogo do Unity. Para obter mais informações, consulte Conectar-se ao armazenamento e serviços de objetos de nuvem usando o Catálogo do Unity.
Chave | Tipo | Descrição |
---|---|---|
principal |
corda | Obrigatório O nome do principal que receberá privilégios. |
privileges |
corda | Obrigatório Os privilégios a serem concedidos à entidade especificada. |
Exemplo
O exemplo a seguir define um esquema do Catálogo do Unity com concessões:
resources:
schemas:
my_schema:
name: test-schema
grants:
- principal: users
privileges:
- CAN_MANAGE
- principal: my_team
privileges:
- CAN_READ
catalog_name: main
comment: "my schema with grants"
bloqueio
Define os atributos de bloqueio de implantação do pacote.
Chave | Tipo | Descrição |
---|---|---|
enabled |
Booliano | Se esse bloqueio está habilitado. |
force |
Booliano | Se será necessário forçar esse bloqueio se ele estiver habilitado. |
permissão
Define uma permissão para uma entidade específica. Consulte permissões e Definir permissões para recursos em Pacotes de Ativos do Databricks.
Chave | Tipo | Descrição |
---|---|---|
group_name |
corda | O nome do grupo que tem a permissão definida em level . |
level |
corda | Obrigatório A permissão autorizada para usuário, grupo ou entidade de serviço definida para esta permissão. |
service_principal_name |
corda | O nome da entidade de serviço que tem a permissão definida em level . |
user_name |
corda | O nome do usuário que tem a permissão definida em level . |
permissões
Uma sequência que define as permissões a serem aplicadas a experimentos, trabalhos, pipelines e modelos definidos no pacote, em que cada item na sequência é uma permissão para uma entidade específica.
Consulte permissões e Definir permissões para recursos em Pacotes de Ativos do Databricks.
Exemplo
permissions:
- level: CAN_VIEW
group_name: test-group
- level: CAN_MANAGE
user_name: someone@example.com
- level: CAN_RUN
service_principal_name: 123456-abcdef
predefinições
Define as predefinições de implantação de pacote. Consulte Predefinições personalizadas.
Chave | Tipo | Descrição |
---|---|---|
jobs_max_concurrent_runs |
Número Inteiro | O máximo de execuções simultâneas para um trabalho. |
name_prefix |
corda | O prefixo para execuções de trabalho do pacote. |
pipelines_development |
Booliano | Se as implantações de pipeline devem ser bloqueadas no modo de desenvolvimento. |
source_linked_deployment |
Booliano | Se deve vincular a implantação à origem do pacote. |
tags |
Mapeamento | Os rótulos para a implantação do pacote. |
trigger_pause_status |
corda | Um status de pausa a ser aplicado a todos os gatilhos e agendamentos de trabalho. Os valores válidos são PAUSED ou UNPAUSED . |
recursos
Um mapa que define os recursos do pacote, em que cada chave é o nome do recurso e o valor é um Mapa que define o recurso. Para obter mais informações sobre os recursos com suporte dos Pacotes de Ativos do Databricks e a referência de definição de recursos, consulte Recursos de Pacotes de Ativos do Databricks.
resources:
<resource-type>s:
<resource-name>:
<resource-field-name>: <resource-field-value>
Chave | Tipo | Descrição |
---|---|---|
clusters |
Mapeamento | As definições de cluster para o pacote, em que cada chave é o nome de um cluster. Consulte cluster |
dashboards |
Mapeamento | As definições do painel de controle para o pacote, onde cada chave é o nome do painel de controle. Confira painel |
experiments |
Mapeamento | As definições de experimento para o pacote, em que cada chave é o nome do experimento. Consulte experimento |
jobs |
Mapeamento | As definições de tarefas para o pacote, onde cada chave é o nome da tarefa. Consulte trabalho |
model_serving_endpoints |
Mapeamento | O modelo que serve definições de ponto de extremidade para o pacote, em que cada chave é o nome do ponto de extremidade do serviço do modelo. Consulte model_serving_endpoint |
models |
Mapeamento | As definições de modelo para o pacote, em que cada chave é o nome do modelo. Veja o modelo (legado) |
pipelines |
Mapeamento | As definições de pipeline para o pacote, em que cada chave é o nome do pipeline. Consulte pipeline |
quality_monitors |
Mapeamento | As definições do monitor de qualidade para o pacote, em que cada chave é o nome do monitor de qualidade. Consulte quality_monitor (Catálogo do Unity) |
registered_models |
Mapeamento | As definições de modelo registradas para o pacote, onde cada chave corresponde ao nome de um modelo registrado no Catálogo Unity. Consulte registered_model (Catálogo do Unity) |
schemas |
Mapeamento | As definições de esquema para o pacote, em que cada chave é o nome do esquema. Consulte esquema (Catálogo do Unity) |
volumes |
Mapeamento | As definições de volume para o conjunto, em que cada chave é o nome do volume. Confira o tomo (Catálogo do Unity) |
run_as
A identidade a ser usada ao executar fluxos de trabalho de Pacotes de Ativos do Databricks. Consulte Especificar uma identidade de execução para um fluxo de trabalho dos Pacotes de Ativos do Databricks.
Chave | Tipo | Descrição |
---|---|---|
service_principal_name |
corda | ID de aplicativo de uma entidade de serviço ativa. Definir este campo requer a função servicePrincipal/user . |
user_name |
corda | O e-mail de um usuário ativo do workspace. Usuários não administradores só podem definir esse campo como seu próprio email. |
sincronizar
Os arquivos e caminhos de arquivo a serem incluídos ou excluídos no pacote. Consulte sincronização.
Chave | Tipo | Descrição |
---|---|---|
exclude |
Sequência | Uma lista de arquivos ou pastas a serem excluídos do pacote. |
include |
Sequência | Uma lista de arquivos ou pastas a serem incluídos no pacote. |
paths |
Sequência | Os caminhos das pastas locais, que podem estar fora da raiz do pacote, devem ser sincronizados com o espaço de trabalho quando o pacote for implantado. |
destino
Define os destinos de implantação para o pacote. Confira destinos
Chave | Tipo | Descrição |
---|---|---|
artifacts |
Mapeamento | Os artefatos a serem incluídos na implantação de destino. Confira artefatos. |
bundle |
Mapeamento | Os atributos do pacote ao serem implantados nesse destino. |
cluster_id |
corda | A ID do cluster a ser usada para esse destino. |
compute_id |
corda | Preterido. A ID da computação a ser usada para esse destino. |
default |
Booliano | Se esse destino é o destino padrão. |
git |
Mapeamento | As configurações de controle de versão do Git para o destino. Consulte git. |
mode |
corda | O modo de implantação para o destino. Os valores válidos são development ou production . Confira Modos de implantação do Pacote de Ativos do Databricks. |
permissions |
Sequência | As permissões para implantar e executar o pacote no destino. Consulte permissões. |
presets |
Mapeamento | As predefinições de implantação para o destino. Consulte predefinições. |
resources |
Mapeamento | As definições de recurso para o destino. Consulte recursos. |
run_as |
Mapeamento | A identidade a ser usada para executar o pacote. Consulte run_as e Especificar uma identidade de execução para um fluxo de trabalho dos Pacotes de Ativos do Databricks. |
sync |
Mapeamento | Os caminhos locais para sincronizar com o espaço de trabalho de destino quando um pacote for executado ou implantado. Consulte sincronização. |
variables |
Mapeamento | As definições personalizadas de variáveis para o alvo. Consulte variáveis e Substituições e variáveis nos Pacotes de Ativos do Databricks. |
workspace |
Mapeamento | O workspace do Databricks para o destino. workspace |
variáveis
Um mapa que define as variáveis personalizadas para o pacote, em que cada chave é o nome da variável e o valor é um Mapa que define a variável. Consulte Substituições e variáveis nos Pacotes de Ativos do Databricks.
Chave | Tipo | Descrição |
---|---|---|
nome da variável | Mapeamento | A definição de uma variável. Consulte nome de variável. |
nome da variável
Cada definição de variável tem os seguintes atributos:
Chave | Tipo | Descrição |
---|---|---|
description |
corda | A descrição da variável. |
lookup |
corda | O nome do objeto alert , cluster_policy , cluster , dashboard , instance_pool , job , metastore , pipeline , query , service_principal ou warehouse para o qual recuperar uma ID. |
type |
corda | O tipo da variável. Os valores válidos são complex . |
workspace
Define o espaço de trabalho do Databricks para o pacote. Consulte workspace.
Chave | Tipo | Descrição |
---|---|---|
artifact_path |
corda | O caminho do artefato a ser usado dentro do workspace para implantações e execuções de fluxo de trabalho |
auth_type |
corda | O tipo de autenticação. |
azure_client_id |
corda | A ID do cliente do Azure. |
azure_environment |
corda | O ambiente do Azure. |
azure_login_app_id |
corda | A ID do aplicativo de logon do Azure. |
azure_tenant_id |
corda | ID do locatário do Azure. |
azure_use_msi |
Booliano | Se o MSI deve ser usado para o Azure. |
azure_workspace_resource_id |
corda | A ID do recurso do workspace do Azure. |
client_id |
corda | A ID do cliente para o workspace. |
file_path |
corda | O caminho do arquivo a ser usado dentro do workspace para implantações e execuções de fluxo de trabalho. |
google_service_account |
corda | O nome da conta de serviço do Google. |
host |
corda | A URL do host do workspace do Databricks. |
profile |
corda | O nome do perfil do workspace do Databricks. |
resource_path |
corda | O caminho do recurso do workspace. |
root_path |
corda | O caminho raiz do workspace do Databricks. |
state_path |
corda | O caminho de estado do workspace. |