Conexión al proceso sin servidor

Artículo
12/17/2024

En este artículo se explican varias ofertas sin servidor disponibles en Azure Databricks. El proceso sin servidor permite conectarse rápidamente a recursos informáticos a petición.

Los artículos de esta sección se centran en el proceso sin servidor para cuadernos, trabajos y Delta Live Tables. Para obtener información sobre los almacenes de SQL sin servidor, consulte ¿Qué son los almacenes de SQL sin servidor? Para obtener más información sobre el servicio de modelos, consulte Servicio de modelos con Azure Databricks.

Para obtener información sobre la arquitectura del plano de proceso sin servidor, consulte Plano de proceso sin servidor.

¿Qué es el proceso sin servidor?

El proceso sin servidor permite ejecutar cargas de trabajo sin aprovisionar un clúster. En su lugar, Databricks asigna y administra automáticamente los recursos de proceso necesarios. Esto le permite centrarse en escribir código y analizar datos, sin preocuparse por la administración de clústeres o el uso de recursos.

El proceso sin servidor ofrece las siguientes ventajas:

Azure Databricks administra los recursos en la nube, lo que reduce la sobrecarga de administración y proporciona un proceso instantáneo para mejorar la productividad del usuario.
Los tiempos de inicio y escalado rápidos para los recursos de proceso sin servidor minimizan el tiempo de inactividad y garantizan que solo paga por el proceso que usa.
Dado que el control de capacidad, la seguridad, la aplicación de revisiones y las actualizaciones se administran automáticamente, puede preocuparse menos por la confiabilidad, las directivas de seguridad y la escasez de capacidad.

¿Qué tipos de proceso sin servidor están disponibles en Azure Databricks?

Azure Databricks ofrece actualmente los siguientes tipos de proceso sin servidor:

Proceso sin servidor para cuadernos: Proceso escalable y a petición que se usa para ejecutar código SQL y Python en cuadernos.
Proceso sin servidor para trabajos: proceso escalable a petición que se usa para ejecutar los trabajos de Databricks sin configurar e implementar la infraestructura.
Almacenes de SQL sin servidor: proceso elástico a petición que se usa para ejecutar comandos SQL en objetos de datos en el editor de SQL o cuadernos interactivos. Puede crear almacenes de SQL mediante la interfaz de usuario, la CLI o la API de REST.
Canalizaciones de DLT sin servidor: proceso optimizado y escalable para las actualizaciones de canalización de Delta Live Tables.
Servicio de modelo de Mosaic AI: servicio de alta disponibilidad y baja latencia para implementar modelos de IA.
Entrenamiento de modelos de inteligencia artificial Mosaic: pronóstico: Use AutoML para elegir el mejor algoritmo de pronóstico e hiperparámetros basado en un conjunto de datos suministrado por el usuario.

Habilitación del proceso sin servidor

Para acceder al proceso sin servidor para cuadernos, trabajos y Tablas dinámicas delta, es posible que un administrador de la cuenta tenga que habilitar la característica. Consulte Habilitación del proceso sin servidor.

Para acceder a almacenes sql sin servidor, consulte Habilitación de almacenes SQL sin servidor.

Limitaciones de proceso sin servidor

Para ver una lista de limitaciones, consulte Limitaciones de los procesos sin servidor.

Preguntas más frecuentes

¿Cómo se implementan las versiones?
¿Cómo puedo determinar qué versión sin servidor estoy ejecutando?
¿Cómo se calculan los costes de las versiones sin servidor?
¿Cómo se analiza el uso de DBU para una carga de trabajo específica?
No he habilitado el proceso sin servidor para trabajos y cuadernos. Entonces, ¿por qué veo registros de facturación para trabajos sin servidor?
¿Admite el proceso sin servidor repositorios privados?
¿Cómo se instalan bibliotecas para mis tareas de trabajo?
¿Puedo conectarme a orígenes de datos personalizados?
¿Cómo funciona la red del plano de proceso sin servidor?
¿Puedo configurar el proceso sin servidor para trabajos con conjuntos de recursos de Databricks?

¿Cómo se implementan las versiones?

El proceso sin servidor es un productosin versión, lo que significa que Databricks actualiza automáticamente el entorno de ejecución de proceso sin servidor para admitir mejoras y actualizaciones en la plataforma. Todos los usuarios obtienen las mismas actualizaciones, que se han implementado durante un breve período de tiempo.

¿Cómo puedo determinar qué versión sin servidor estoy ejecutando?

Las cargas de trabajo sin servidor siempre se ejecutan en la versión en tiempo de ejecución más reciente. Vea notas de la versión para obtener la versión más reciente.

¿Cómo se calculan los costes de las versiones sin servidor?

Databricks recomienda ejecutar y comparar una carga de trabajo representativa o específica y, a continuación, analizar la tabla del sistema de facturación. Consulte Referencia de tabla del sistema de utilización facturable.

¿Cómo se analiza el uso de DBU para una carga de trabajo específica?

Para ver el coste de una carga de trabajo específica, consulte la tabla del sistema system.billing.usage. Consulte Supervisión del coste del proceso sin servidor para obtener consultas de ejemplo y descargar nuestro panel de observabilidad de costes.

No he habilitado el proceso sin servidor para trabajos y cuadernos. Entonces, ¿por qué veo registros de facturación para trabajos sin servidor?

La supervisión de Lakehouse y la optimización predictiva también se facturan en la SKU de trabajos sin servidor.

El proceso sin servidor no necesita estar habilitado para usar estas dos características.

¿Admite el proceso sin servidor repositorios privados?

Los repositorios pueden ser privados o requerir autenticación. Por motivos de seguridad, se requiere una dirección URL firmada previamente al acceder a repositorios autenticados.

¿Cómo se instalan bibliotecas para mis tareas de trabajo?

Databricks recomienda usar entornos para instalar y administrar bibliotecas para los trabajos. Consulte Configuración de entornos y dependencias para tareas que no son de cuaderno.

¿Puedo conectarme a orígenes de datos personalizados?

No, solo se admiten los orígenes que usan la federación de Lakehouse. Consulte Orígenes de datos compatibles.

¿Cómo funciona la red del plano de proceso sin servidor?

Los recursos de proceso sin servidor se ejecutan en el plano de proceso sin servidor, administrado por Azure Databricks. Para obtener más información sobre la red y la arquitectura, consulte Redes de plano de proceso sin servidor.

¿Puedo configurar el proceso sin servidor para trabajos con conjuntos de recursos de Databricks?

Sí, los conjuntos de recursos de Databricks se pueden utilizar para configurar trabajos que utilizan el proceso sin servidor. Consulte Configuración de un trabajo que usa un proceso sin servidor.

Compartir a través de