Configuración de colas y simultaneidad de trabajos de Databricks
Este artículo incluye instrucciones y recomendaciones para configurar las opciones avanzadas en trabajos de Databricks.
Habilitación de la cola de ejecuciones de trabajos
Nota:
La cola está habilitada de forma predeterminada para los trabajos creados mediante la interfaz de usuario después del 15 de abril de 2024.
Para evitar que se omitan las ejecuciones de un trabajo debido a los límites de simultaneidad, puede habilitar la puesta en cola para el trabajo. Cuando la puesta en cola está habilitada, la ejecución se pone en cola durante un máximo de 48 horas si los recursos no están disponibles para una ejecución de trabajo. Cuando la capacidad está disponible, la ejecución del trabajo se quita y se ejecuta. Las ejecuciones en cola se muestran en la lista de ejecuciones para el trabajo y la lista de ejecuciones de trabajos recientes.
Una ejecución se pone en cola cuando se alcanza uno de los límites siguientes:
- Número máximo de ejecuciones activas simultáneas en el área de trabajo.
- La tarea simultánea máxima
Run Job
se ejecuta en el área de trabajo. - Número máximo de ejecuciones simultáneas del trabajo.
La cola es una propiedad de nivel de trabajo que las colas solo se ejecutan para ese trabajo.
Para habilitar o deshabilitar la puesta en cola, haga clic en Configuración avanzada y haga clic en el botón de alternancia Cola en el panel lateral Detalles del trabajo.
Configurar el número máximo de ejecuciones simultáneas
De manera predeterminada, el número máximo de ejecuciones simultáneas para todos los nuevos trabajos es 1.
Haga clic en Editar ejecuciones simultáneas en Configuración avanzada para establecer el número máximo de ejecuciones paralelas de este trabajo.
Azure Databricks omite la ejecución si el trabajo ya ha alcanzado el número máximo de ejecuciones activas al intentar iniciar una nueva ejecución.
Establezca este valor por encima de 1 para permitir ejecuciones simultáneas del mismo trabajo. Esto es útil, por ejemplo, si desencadena el trabajo con una programación frecuente y quiere permitir que las ejecuciones consecutivas se superpongan o desencadena varias ejecuciones que difieren en sus parámetros de entrada.