Referencia de configuración

Artículo
02/13/2025

En este artículo se proporciona referencia a las claves compatibles con la configuración de Conjuntos de recursos de Databricks (YAML). Consulte ¿Qué son las agrupaciones de recursos de Databricks?

Para obtener ejemplos completos de paquetes, consulte los ejemplos de configuración de paquetes y el repositorio de GitHub de ejemplos de paquetes .

artefacto

Se definen las configuraciones para construir un artefacto.

Clave	Tipo	Descripción
`build`	Cadena	Conjunto opcional de comandos de compilación que se ejecutarán localmente antes de la implementación.
`executable`	Cadena	Tipo ejecutable. Los valores válidos son `bash`, `sh` y `cmd`.
`files`	Mapa	Ruta de acceso relativa o absoluta a los archivos de artefactos compilados, definidos como artifact_file.
`path`	Cadena	Ruta de acceso local del directorio para el artefacto.
`type`	Cadena	Obligatorio si el artefacto es una rueda de Python. Tipo del artefacto. Los valores válidos son `whl` y `jar`.

artefactos

Definen los atributos para compilar artefactos, donde cada clave es el nombre del artefacto y el valor es un mapa que define la configuración de compilación del artefacto . Para obtener información sobre la asignación artifacts, consulte artefactos.

La configuración del artefacto definida en el nivel superior de la configuración de agrupación se puede invalidar en la asignación targets. Consulte Definición de la configuración de artefactos en agrupaciones de recursos de Databricks.

artifacts:
  <artifact-name>:
      <artifact-field-name>: <artifact-field-value>

Ejemplo

artifacts:
  default:
    type: whl
    build: poetry build
    path: .

artifact_file

Define un archivo de artefacto en una agrupación.

Clave	Tipo	Descripción
`source`	Cadena	Necesario. El archivo de origen del artefacto.

agrupación

Atributos de la agrupación. Consulte agrupación.

Clave	Tipo	Descripción
`cluster_id`	Cadena	Identificador de un clúster que se va a usar para ejecutar el paquete. Consulte el identificador del clúster .
`databricks_cli_version`	Cadena	La versión de la CLI de Databricks para usar con el paquete. Consulte databricks_cli_version.
`deployment`	Mapa	Definición de la implementación de agrupación. Para ver los atributos admitidos, consulte implementación y modos de implementación de la agrupación de recursos de Databricks.
`git`	Mapa	Detalles del control de versiones de Git asociados a tu paquete. Para ver los atributos admitidos, consulte git y git.
`name`	Cadena	Necesario. Nombre del lote.
`uuid`	Cadena	Reservado. Identificador único universal (UUID) para el lote que identifica de forma única el lote en sistemas internos de Databricks. Esto se genera cuando se inicializa un proyecto de agrupación mediante una plantilla de Databricks (mediante el comando `databricks bundle init`).

implementación

Define los atributos de implementación del paquete.

Clave	Tipo	Descripción
`fail_on_active_runs`	Booleano	Si se produce un error en las ejecuciones activas. Si se establece en `true` se puede interrumpir una implementación que se está ejecutando.
`lock`	Mapa	Atributos de bloqueo de la implementación. Consulte bloqueo.

experimental

Define atributos para las características experimentales.

Clave	Tipo	Descripción
`python_wheel_wrapper`	Booleano	Si se va a usar un contenedor de paquete wheel de Python.
`scripts`	Comando (cadena)	Los comandos para ejecutar
`use_legacy_run_as`	Booleano	Indica si se debe usar el comportamiento del run_as heredado.

git

Define los detalles del control de versiones de Git asociados a la agrupación. Consulte Git.

Clave	Tipo	Descripción
`origin_url`	Cadena	Dirección URL de origen del repositorio. Consulte Git.
`branch`	Cadena	Nombre de la rama de Git. Consulte Git.

subvención

Define el acceso a objetos de Catálogo de Unity. Para obtener más información, consulte Conexión al almacenamiento de objetos en la nube y servicios mediante Unity Catalog.

Clave	Tipo	Descripción
`principal`	Cadena	Necesario. El nombre del principal al que se le concederán privilegios.
`privileges`	Cadena	Necesario. Privilegios que se van a conceder a la entidad especificada.

Ejemplo

En el ejemplo siguiente se define un esquema de catálogo de Unity con concesiones:

resources:
  schemas:
    my_schema:
      name: test-schema
      grants:
        - principal: users
          privileges:
            - CAN_MANAGE
        - principal: my_team
          privileges:
            - CAN_READ
      catalog_name: main
      comment: "my schema with grants"

bloqueo

Define los atributos de bloqueo de implementación de agrupación.

Clave	Tipo	Descripción
`enabled`	Booleano	Si este bloqueo está habilitado.
`force`	Booleano	Si se va a forzar este bloqueo si está habilitado.

permiso

Define un permiso para una entidad específica. Consulte permisos y Establecimiento de permisos para recursos en agrupaciones de recursos de Databricks.

Clave	Tipo	Descripción
`group_name`	Cadena	Nombre del grupo que tiene el permiso establecido en `level`.
`level`	Cadena	Necesario. El permiso permitido para usuario, grupo, o entidad de servicio está definido por este permiso.
`service_principal_name`	Cadena	Nombre de la entidad de servicio que tiene el permiso establecido en `level`.
`user_name`	Cadena	Nombre del usuario que tiene el permiso establecido en `level`.

permisos

Secuencia que define los permisos para aplicar a experimentos, trabajos, canalizaciones y modelos definidos en el conjunto, donde cada elemento de la secuencia es un permiso para una entidad específica.

Consulte permisos y Establecimiento de permisos para recursos en agrupaciones de recursos de Databricks.

Ejemplo

permissions:
  - level: CAN_VIEW
    group_name: test-group
  - level: CAN_MANAGE
    user_name: someone@example.com
  - level: CAN_RUN
    service_principal_name: 123456-abcdef

valores preestablecidos

Define los valores preestablecidos de implementación de agrupación. Consulte Valores preestablecidos personalizados.

Clave	Tipo	Descripción
`jobs_max_concurrent_runs`	Entero	Número máximo de ejecuciones simultáneas para un trabajo.
`name_prefix`	Cadena	Prefijo para ejecuciones de trabajo de la agrupación.
`pipelines_development`	Booleano	Si las implementaciones de canalización deben bloquearse en modo de desarrollo.
`source_linked_deployment`	Booleano	Si se va a vincular la implementación al origen de la agrupación.
`tags`	Mapa	Etiquetas para la implementación de la agrupación.
`trigger_pause_status`	Cadena	Estado de pausa que se aplicará a todos los desencadenadores y programaciones del trabajo. Los valores válidos son `PAUSED` y `UNPAUSED`.

recursos

Mapa que define los recursos de la agrupación, donde cada clave es el nombre del recurso y el valor es un mapa que define el recurso. Para obtener más información sobre los recursos admitidos de agrupación de recursos de Databricks y la referencia de definición de recursos, consulte Recursos de agrupaciones de recursos de Databricks.

resources:
  <resource-type>s:
    <resource-name>:
      <resource-field-name>: <resource-field-value>

Clave	Tipo	Descripción
`clusters`	Mapa	Las definiciones de clúster para la agrupación, donde cada clave es el nombre de un clúster. Consulte el clúster
`dashboards`	Mapa	Las definiciones del tablero de control para el paquete, donde cada clave es el nombre del tablero de control. Consulte el panel
`experiments`	Mapa	Las definiciones del experimento para la agrupación, donde cada clave es el nombre del experimento. Consulte el experimento
`jobs`	Mapa	Las definiciones de tareas para el paquete, donde cada clave es el nombre del trabajo. Consulte el trabajo
`model_serving_endpoints`	Mapa	El modelo que atiende las definiciones de punto de conexión para la agrupación, donde cada clave es el nombre del punto de conexión de servicio del modelo. Consulte model_serving_endpoint
`models`	Mapa	Las definiciones de modelo para la agrupación, donde cada clave es el nombre del modelo. Consulte el modelo (heredado)
`pipelines`	Mapa	Las definiciones de canalización para la agrupación, donde cada clave es el nombre de la canalización. Consulte la canalización
`quality_monitors`	Mapa	Las definiciones del monitor de calidad para la agrupación, donde cada clave es el nombre del monitor de calidad. Consulte quality_monitor (Unity Catalog)
`registered_models`	Mapa	Las definiciones de modelo registradas para la agrupación, donde cada clave es el nombre del modelo registrado del catálogo de Unity. Consulte registered_model (Unity Catalog)
`schemas`	Mapa	Las definiciones de esquema para la agrupación, donde cada clave es el nombre del esquema. Consulte el esquema (Catálogo de Unity)
`volumes`	Mapa	Las definiciones de volumen para la agrupación, donde cada clave es el nombre del volumen. Consulte volumen (Unity Catalog)

run_as

Identidad que se va a usar al ejecutar flujos de trabajo de agrupaciones de recursos de Databricks. Consulte Especificación de una identidad de ejecución para un flujo de trabajo de agrupaciones de recursos de Databricks.

Clave	Tipo	Descripción
`service_principal_name`	Cadena	Identificador de aplicación de una entidad de servicio activa. Establecer este campo requiere el rol `servicePrincipal/user`.
`user_name`	Cadena	Correo electrónico de un usuario de área de trabajo activa. Los usuarios que no son administradores solo pueden establecer este campo en su propio correo electrónico.

sincronización

Los archivos y rutas de archivo a incluir o excluir en el paquete. Consulte sincronización.

Clave	Tipo	Descripción
`exclude`	Secuencia	Lista de archivos o carpetas que se van a excluir de la agrupación.
`include`	Secuencia	Lista de archivos o carpetas que se van a incluir en la agrupación.
`paths`	Secuencia	Las rutas de acceso a carpetas locales, que pueden ubicarse fuera de la raíz del paquete, para sincronizarlas en el área de trabajo cuando se implementa el paquete.

objetivo

Define los destinos de implementación para la agrupación. Consulte destinos

Clave	Tipo	Descripción
`artifacts`	Mapa	Artefactos que se van a incluir en la implementación de destino. Consulte artefactos.
`bundle`	Mapa	Atributos de agrupación al implementar en este destino.
`cluster_id`	Cadena	Identificador del clúster que se va a usar para este destino.
`compute_id`	Cadena	En desuso. Identificador del proceso que se va a usar para este destino.
`default`	Booleano	Si este destino es el destino predeterminado.
`git`	Mapa	Configuración del control de versiones de Git para el destino. Consulte Git.
`mode`	Cadena	Modo de implementación del destino. Los valores válidos son `development` y `production`. Consulte Modos de implementación de la agrupación de recursos de Databricks.
`permissions`	Secuencia	Permisos para implementar y ejecutar el paquete en el destino objetivo. Consulte los permisos.
`presets`	Mapa	Valores preestablecidos de implementación para el destino. Consulte valores preestablecidos.
`resources`	Mapa	Definiciones de recursos para el objetivo. Consulte los recursos.
`run_as`	Mapa	La identidad a utilizar para ejecutar el paquete. Consulte run_as y Especificar una identidad de ejecución para un flujo de trabajo de agrupaciones de recursos de Databricks.
`sync`	Mapa	Las rutas de acceso locales que se van a sincronizar con el área de trabajo de destino cuando se ejecuta o se implementa una agrupación. Consulte sincronización.
`variables`	Mapa	Definiciones de variables personalizadas para el destino. Consulte variables y Sustituciones y variables en agrupaciones de recursos de Databricks.
`workspace`	Mapa	Área de trabajo de Databricks para el destino. área de trabajo

variables

Mapa que define las variables personalizadas para la agrupación, donde cada clave es el nombre de la variable y el valor es un mapa que define la variable. Consulte Sustituciones y variables en agrupaciones de recursos de Databricks.

Clave	Tipo	Descripción
variable-name	Mapa	Definición de una variable. Consulte variable-name.

variable-name

Cada definición de variable tiene los siguientes atributos:

Clave	Tipo	Descripción
`description`	Cadena	Descripción de la variable.
`lookup`	Cadena	Nombre del `alert`, `cluster_policy`, `cluster`, `dashboard`, `instance_pool`, `job`, `metastore`, `pipeline`, `query`, `service_principal`, o `warehouse` objeto para el que se va a recuperar un identificador.
`type`	Cadena	Tipo de la variable. Los valores válidos son `complex`.

área de trabajo

Define el área de trabajo de Databricks para la agrupación. Consulte el área de trabajo.

Clave	Tipo	Descripción
`artifact_path`	Cadena	Ruta de acceso del artefacto que se va a usar en el área de trabajo para las implementaciones y ejecuciones de flujo de trabajo.
`auth_type`	Cadena	El tipo de autenticación.
`azure_client_id`	Cadena	Identificador de cliente de Azure.
`azure_environment`	Cadena	Entorno de Azure.
`azure_login_app_id`	Cadena	Identificador de la aplicación de inicio de sesión de Azure.
`azure_tenant_id`	Cadena	Identificador del inquilino de Azure.
`azure_use_msi`	Booleano	Si se usa MSI para Azure.
`azure_workspace_resource_id`	Cadena	Identificador de recurso del área de trabajo de Azure.
`client_id`	Cadena	Identificador de cliente del área de trabajo.
`file_path`	Cadena	Ruta de archivo a utilizar en el área de trabajo tanto para implementaciones como para ejecuciones de flujo de trabajo.
`google_service_account`	Cadena	Nombre de la cuenta de servicio de Google.
`host`	Cadena	Dirección URL del host del área de trabajo de Databricks.
`profile`	Cadena	Nombre del perfil del área de trabajo de Databricks.
`resource_path`	Cadena	Ruta de acceso del recurso del área de trabajo.
`root_path`	Cadena	Ruta de acceso raíz del área de trabajo de Databricks.
`state_path`	Cadena	Ruta de estado del área de trabajo.

Compartir a través de

Referencia de configuración

artefacto

artefactos

Ejemplo

artifact_file

agrupación

implementación

experimental

git

subvención

Ejemplo

bloqueo

permiso

permisos

Ejemplo

valores preestablecidos

recursos

run_as

sincronización

objetivo

variables

variable-name

área de trabajo

Comentarios

Recursos adicionales