Referencia de configuración
En este artículo se proporciona referencia a las claves compatibles con la configuración de Conjuntos de recursos de Databricks (YAML). Consulte ¿Qué son las agrupaciones de recursos de Databricks?
Para obtener ejemplos completos de paquetes, consulte los ejemplos de configuración de paquetes y el repositorio de GitHub de ejemplos de paquetes .
artefacto
Se definen las configuraciones para construir un artefacto.
Clave | Tipo | Descripción |
---|---|---|
build |
Cadena | Conjunto opcional de comandos de compilación que se ejecutarán localmente antes de la implementación. |
executable |
Cadena | Tipo ejecutable. Los valores válidos son bash , sh y cmd . |
files |
Mapa | Ruta de acceso relativa o absoluta a los archivos de artefactos compilados, definidos como artifact_file. |
path |
Cadena | Ruta de acceso local del directorio para el artefacto. |
type |
Cadena | Obligatorio si el artefacto es una rueda de Python. Tipo del artefacto. Los valores válidos son whl y jar . |
artefactos
Definen los atributos para compilar artefactos, donde cada clave es el nombre del artefacto y el valor es un mapa que define la configuración de compilación del artefacto . Para obtener información sobre la asignación artifacts
, consulte artefactos.
La configuración del artefacto definida en el nivel superior de la configuración de agrupación se puede invalidar en la asignación targets
. Consulte Definición de la configuración de artefactos en agrupaciones de recursos de Databricks.
artifacts:
<artifact-name>:
<artifact-field-name>: <artifact-field-value>
Ejemplo
artifacts:
default:
type: whl
build: poetry build
path: .
artifact_file
Define un archivo de artefacto en una agrupación.
Clave | Tipo | Descripción |
---|---|---|
source |
Cadena | Necesario. El archivo de origen del artefacto. |
agrupación
Atributos de la agrupación. Consulte agrupación.
Clave | Tipo | Descripción |
---|---|---|
cluster_id |
Cadena | Identificador de un clúster que se va a usar para ejecutar el paquete. Consulte el identificador del clúster . |
databricks_cli_version |
Cadena | La versión de la CLI de Databricks para usar con el paquete. Consulte databricks_cli_version. |
deployment |
Mapa | Definición de la implementación de agrupación. Para ver los atributos admitidos, consulte implementación y modos de implementación de la agrupación de recursos de Databricks. |
git |
Mapa | Detalles del control de versiones de Git asociados a tu paquete. Para ver los atributos admitidos, consulte git y git. |
name |
Cadena | Necesario. Nombre del lote. |
uuid |
Cadena | Reservado. Identificador único universal (UUID) para el lote que identifica de forma única el lote en sistemas internos de Databricks. Esto se genera cuando se inicializa un proyecto de agrupación mediante una plantilla de Databricks (mediante el comando databricks bundle init ). |
implementación
Define los atributos de implementación del paquete.
Clave | Tipo | Descripción |
---|---|---|
fail_on_active_runs |
Booleano | Si se produce un error en las ejecuciones activas. Si se establece en true se puede interrumpir una implementación que se está ejecutando. |
lock |
Mapa | Atributos de bloqueo de la implementación. Consulte bloqueo. |
experimental
Define atributos para las características experimentales.
Clave | Tipo | Descripción |
---|---|---|
python_wheel_wrapper |
Booleano | Si se va a usar un contenedor de paquete wheel de Python. |
scripts |
Comando (cadena) | Los comandos para ejecutar |
use_legacy_run_as |
Booleano | Indica si se debe usar el comportamiento del run_as heredado. |
git
Define los detalles del control de versiones de Git asociados a la agrupación. Consulte Git.
Clave | Tipo | Descripción |
---|---|---|
origin_url |
Cadena | Dirección URL de origen del repositorio. Consulte Git. |
branch |
Cadena | Nombre de la rama de Git. Consulte Git. |
subvención
Define el acceso a objetos de Catálogo de Unity. Para obtener más información, consulte Conexión al almacenamiento de objetos en la nube y servicios mediante Unity Catalog.
Clave | Tipo | Descripción |
---|---|---|
principal |
Cadena | Necesario. El nombre del principal al que se le concederán privilegios. |
privileges |
Cadena | Necesario. Privilegios que se van a conceder a la entidad especificada. |
Ejemplo
En el ejemplo siguiente se define un esquema de catálogo de Unity con concesiones:
resources:
schemas:
my_schema:
name: test-schema
grants:
- principal: users
privileges:
- CAN_MANAGE
- principal: my_team
privileges:
- CAN_READ
catalog_name: main
comment: "my schema with grants"
bloqueo
Define los atributos de bloqueo de implementación de agrupación.
Clave | Tipo | Descripción |
---|---|---|
enabled |
Booleano | Si este bloqueo está habilitado. |
force |
Booleano | Si se va a forzar este bloqueo si está habilitado. |
permiso
Define un permiso para una entidad específica. Consulte permisos y Establecimiento de permisos para recursos en agrupaciones de recursos de Databricks.
Clave | Tipo | Descripción |
---|---|---|
group_name |
Cadena | Nombre del grupo que tiene el permiso establecido en level . |
level |
Cadena | Necesario. El permiso permitido para usuario, grupo, o entidad de servicio está definido por este permiso. |
service_principal_name |
Cadena | Nombre de la entidad de servicio que tiene el permiso establecido en level . |
user_name |
Cadena | Nombre del usuario que tiene el permiso establecido en level . |
permisos
Secuencia que define los permisos para aplicar a experimentos, trabajos, canalizaciones y modelos definidos en el conjunto, donde cada elemento de la secuencia es un permiso para una entidad específica.
Consulte permisos y Establecimiento de permisos para recursos en agrupaciones de recursos de Databricks.
Ejemplo
permissions:
- level: CAN_VIEW
group_name: test-group
- level: CAN_MANAGE
user_name: someone@example.com
- level: CAN_RUN
service_principal_name: 123456-abcdef
valores preestablecidos
Define los valores preestablecidos de implementación de agrupación. Consulte Valores preestablecidos personalizados.
Clave | Tipo | Descripción |
---|---|---|
jobs_max_concurrent_runs |
Entero | Número máximo de ejecuciones simultáneas para un trabajo. |
name_prefix |
Cadena | Prefijo para ejecuciones de trabajo de la agrupación. |
pipelines_development |
Booleano | Si las implementaciones de canalización deben bloquearse en modo de desarrollo. |
source_linked_deployment |
Booleano | Si se va a vincular la implementación al origen de la agrupación. |
tags |
Mapa | Etiquetas para la implementación de la agrupación. |
trigger_pause_status |
Cadena | Estado de pausa que se aplicará a todos los desencadenadores y programaciones del trabajo. Los valores válidos son PAUSED y UNPAUSED . |
recursos
Mapa que define los recursos de la agrupación, donde cada clave es el nombre del recurso y el valor es un mapa que define el recurso. Para obtener más información sobre los recursos admitidos de agrupación de recursos de Databricks y la referencia de definición de recursos, consulte Recursos de agrupaciones de recursos de Databricks.
resources:
<resource-type>s:
<resource-name>:
<resource-field-name>: <resource-field-value>
Clave | Tipo | Descripción |
---|---|---|
clusters |
Mapa | Las definiciones de clúster para la agrupación, donde cada clave es el nombre de un clúster. Consulte el clúster |
dashboards |
Mapa | Las definiciones del tablero de control para el paquete, donde cada clave es el nombre del tablero de control. Consulte el panel |
experiments |
Mapa | Las definiciones del experimento para la agrupación, donde cada clave es el nombre del experimento. Consulte el experimento |
jobs |
Mapa | Las definiciones de tareas para el paquete, donde cada clave es el nombre del trabajo. Consulte el trabajo |
model_serving_endpoints |
Mapa | El modelo que atiende las definiciones de punto de conexión para la agrupación, donde cada clave es el nombre del punto de conexión de servicio del modelo. Consulte model_serving_endpoint |
models |
Mapa | Las definiciones de modelo para la agrupación, donde cada clave es el nombre del modelo. Consulte el modelo (heredado) |
pipelines |
Mapa | Las definiciones de canalización para la agrupación, donde cada clave es el nombre de la canalización. Consulte la canalización |
quality_monitors |
Mapa | Las definiciones del monitor de calidad para la agrupación, donde cada clave es el nombre del monitor de calidad. Consulte quality_monitor (Unity Catalog) |
registered_models |
Mapa | Las definiciones de modelo registradas para la agrupación, donde cada clave es el nombre del modelo registrado del catálogo de Unity. Consulte registered_model (Unity Catalog) |
schemas |
Mapa | Las definiciones de esquema para la agrupación, donde cada clave es el nombre del esquema. Consulte el esquema (Catálogo de Unity) |
volumes |
Mapa | Las definiciones de volumen para la agrupación, donde cada clave es el nombre del volumen. Consulte volumen (Unity Catalog) |
run_as
Identidad que se va a usar al ejecutar flujos de trabajo de agrupaciones de recursos de Databricks. Consulte Especificación de una identidad de ejecución para un flujo de trabajo de agrupaciones de recursos de Databricks.
Clave | Tipo | Descripción |
---|---|---|
service_principal_name |
Cadena | Identificador de aplicación de una entidad de servicio activa. Establecer este campo requiere el rol servicePrincipal/user . |
user_name |
Cadena | Correo electrónico de un usuario de área de trabajo activa. Los usuarios que no son administradores solo pueden establecer este campo en su propio correo electrónico. |
sincronización
Los archivos y rutas de archivo a incluir o excluir en el paquete. Consulte sincronización.
Clave | Tipo | Descripción |
---|---|---|
exclude |
Secuencia | Lista de archivos o carpetas que se van a excluir de la agrupación. |
include |
Secuencia | Lista de archivos o carpetas que se van a incluir en la agrupación. |
paths |
Secuencia | Las rutas de acceso a carpetas locales, que pueden ubicarse fuera de la raíz del paquete, para sincronizarlas en el área de trabajo cuando se implementa el paquete. |
objetivo
Define los destinos de implementación para la agrupación. Consulte destinos
Clave | Tipo | Descripción |
---|---|---|
artifacts |
Mapa | Artefactos que se van a incluir en la implementación de destino. Consulte artefactos. |
bundle |
Mapa | Atributos de agrupación al implementar en este destino. |
cluster_id |
Cadena | Identificador del clúster que se va a usar para este destino. |
compute_id |
Cadena | En desuso. Identificador del proceso que se va a usar para este destino. |
default |
Booleano | Si este destino es el destino predeterminado. |
git |
Mapa | Configuración del control de versiones de Git para el destino. Consulte Git. |
mode |
Cadena | Modo de implementación del destino. Los valores válidos son development y production . Consulte Modos de implementación de la agrupación de recursos de Databricks. |
permissions |
Secuencia | Permisos para implementar y ejecutar el paquete en el destino objetivo. Consulte los permisos. |
presets |
Mapa | Valores preestablecidos de implementación para el destino. Consulte valores preestablecidos. |
resources |
Mapa | Definiciones de recursos para el objetivo. Consulte los recursos. |
run_as |
Mapa | La identidad a utilizar para ejecutar el paquete. Consulte run_as y Especificar una identidad de ejecución para un flujo de trabajo de agrupaciones de recursos de Databricks. |
sync |
Mapa | Las rutas de acceso locales que se van a sincronizar con el área de trabajo de destino cuando se ejecuta o se implementa una agrupación. Consulte sincronización. |
variables |
Mapa | Definiciones de variables personalizadas para el destino. Consulte variables y Sustituciones y variables en agrupaciones de recursos de Databricks. |
workspace |
Mapa | Área de trabajo de Databricks para el destino. área de trabajo |
variables
Mapa que define las variables personalizadas para la agrupación, donde cada clave es el nombre de la variable y el valor es un mapa que define la variable. Consulte Sustituciones y variables en agrupaciones de recursos de Databricks.
Clave | Tipo | Descripción |
---|---|---|
variable-name | Mapa | Definición de una variable. Consulte variable-name. |
variable-name
Cada definición de variable tiene los siguientes atributos:
Clave | Tipo | Descripción |
---|---|---|
description |
Cadena | Descripción de la variable. |
lookup |
Cadena | Nombre del alert , cluster_policy , cluster , dashboard , instance_pool , job , metastore , pipeline , query , service_principal , o warehouse objeto para el que se va a recuperar un identificador. |
type |
Cadena | Tipo de la variable. Los valores válidos son complex . |
área de trabajo
Define el área de trabajo de Databricks para la agrupación. Consulte el área de trabajo.
Clave | Tipo | Descripción |
---|---|---|
artifact_path |
Cadena | Ruta de acceso del artefacto que se va a usar en el área de trabajo para las implementaciones y ejecuciones de flujo de trabajo. |
auth_type |
Cadena | El tipo de autenticación. |
azure_client_id |
Cadena | Identificador de cliente de Azure. |
azure_environment |
Cadena | Entorno de Azure. |
azure_login_app_id |
Cadena | Identificador de la aplicación de inicio de sesión de Azure. |
azure_tenant_id |
Cadena | Identificador del inquilino de Azure. |
azure_use_msi |
Booleano | Si se usa MSI para Azure. |
azure_workspace_resource_id |
Cadena | Identificador de recurso del área de trabajo de Azure. |
client_id |
Cadena | Identificador de cliente del área de trabajo. |
file_path |
Cadena | Ruta de archivo a utilizar en el área de trabajo tanto para implementaciones como para ejecuciones de flujo de trabajo. |
google_service_account |
Cadena | Nombre de la cuenta de servicio de Google. |
host |
Cadena | Dirección URL del host del área de trabajo de Databricks. |
profile |
Cadena | Nombre del perfil del área de trabajo de Databricks. |
resource_path |
Cadena | Ruta de acceso del recurso del área de trabajo. |
root_path |
Cadena | Ruta de acceso raíz del área de trabajo de Databricks. |
state_path |
Cadena | Ruta de estado del área de trabajo. |