Compartir a través de


Ejecución de trabajos continuamente

Use el modo continuo para programar cargas de trabajo para que se ejecuten continuamente. Databricks recomienda usar el modo continuo para cargas de trabajo de streaming siempre activadas.

El modo continuo reemplaza las recomendaciones antiguas de las cargas de trabajo de flujo estructurado para configurar trabajos con una directiva de reintento sin limites y un máximo de una ejecución simultánea.

Importante

El proceso sin servidor para trabajos no admite el modo continuo.

Configuración del trabajo para que se ejecute en modo continuo

Para configurar un trabajo para que se ejecute en modo continuo, haga lo siguiente:

  1. En la barra lateral, haga clic en Áreas de trabajo.
  2. Haga clic en el nombre del trabajo, en la columna Nombre de la pestaña Trabajos.
  3. Haga clic en Agregar desencadenador en el panel Detalles del trabajo, seleccione Continuo en Tipo de desencadenador y haga clic en Guardar.

Para detener un trabajo continuo, haga clic en el botón Pausar. Haga clic en Reanudar para reiniciar el trabajo en modo continuo.

Nota:

  • Solo puede haber una instancia en ejecución de un trabajo continuo.
  • Hay un pequeño retraso entre la finalización de una ejecución y un nuevo inicio de ejecución. Este retraso debe ser inferior a 60 segundos.
  • No se pueden usar dependencias de tareas con un trabajo continuo.
  • No puede usar directivas de reintento con un trabajo continuo. En su lugar, los trabajos continuos usan el retroceso exponencial para administrar los errores de ejecución del trabajo.
  • Seleccione Ejecutar ahora para desencadenar una nueva ejecución de trabajo en un trabajo continuo que está en pausa.
  • Para que el trabajo continuo seleccione una nueva configuración, cancele la ejecución existente. Se inicia automáticamente una nueva ejecución. También puede hacer clic en Reiniciar ejecución para reiniciar la ejecución del trabajo con la configuración actualizada.

¿Cómo se controlan los errores de los trabajos continuos?

Azure Databricks usa un esquema de retroceso exponencial para administrar trabajos continuos con varios errores consecutivos. El retroceso exponencial permite que los trabajos continuos se ejecuten sin pausa y vuelvan a un estado correcto cuando se produzcan errores recuperables.

Cuando un trabajo continuo supera el umbral permitido de errores consecutivos, a continuación se describe cómo se administran las ejecuciones de trabajos posteriores:

  1. El trabajo se reinicia después de un período de reintento establecido por el sistema.
  2. Si se produce un error en la siguiente ejecución del trabajo, se aumenta el período de reintento y el trabajo se reinicia después de este nuevo período de reintento.
    1. Para cada error de ejecución de trabajo posterior, el período de reintento aumenta hasta un período máximo de reintento establecido por el sistema. Después de alcanzar el período máximo de reintentos, el trabajo continúa reintentándose mediante el período máximo de reintento. No hay ningún límite en el número de reintentos de un trabajo continuo.
    2. Si la ejecución del trabajo se completa correctamente e inicia una nueva ejecución o si la ejecución supera un umbral sin error, el trabajo se considera correcto y la secuencia de retroceso se restablece.

Puede reiniciar un trabajo continuo en el estado de retroceso exponencial en la Interfaz de usuario de Jobs o pasando el id. de trabajo a la solicitud POST /api/2.1/jobs/run-now en la API Jobs 2.1 o POST /api/2.0/jobs/run-now en la API Jobs 2.0.