DatabricksCluster Clase
Define la información del clúster de Databricks para su uso en DatabricksSection.
Inicializar.
- Herencia
-
azureml._base_sdk_common.abstract_run_config_element._AbstractRunConfigElementDatabricksCluster
Constructor
DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)
Parámetros
Nombre | Description |
---|---|
existing_cluster_id
|
Id. de un clúster interactivo existente en el área de trabajo de Databricks. Si se especifica este parámetro, no se debe especificar ninguno de los demás parámetros. Valor predeterminado: None
|
spark_version
|
La versión de Spark para el clúster de ejecución de Databricks. Ejemplo: "10.4.x-scala2.12". Valor predeterminado: None
|
node_type
|
Los tipos de nodo de máquina virtual de Azure para el clúster de ejecución de Databricks. Example: "Standard_D3_v2". Valor predeterminado: None
|
instance_pool_id
|
Identificador del grupo de instancias al que se debe asociar el clúster. Valor predeterminado: None
|
num_workers
|
El número de trabajos para un clúster de ejecución de Databricks. Si se especifica este parámetro, no se deben especificar los parámetros Valor predeterminado: None
|
min_workers
|
Número mínimo de trabajos para un clúster de Databricks con escalabilidad automática. Valor predeterminado: None
|
max_workers
|
Número de trabajos para un clúster de ejecución de Databricks con escalabilidad automática. Valor predeterminado: None
|
spark_env_variables
|
dict(<xref:{str:str}>)
Las variables de entorno de Spark para el clúster de ejecución de Databricks. Valor predeterminado: None
|
spark_conf
|
dict(<xref:{str:str}>)
La configuración de Spark para el clúster de ejecución de Databricks. Valor predeterminado: None
|
init_scripts
|
Desusado. Databricks anunció que el script de inicialización almacenado en DBFS dejará de funcionar después del 1 de dic de 2023. Para mitigar el problema, use scripts de inicialización globales en databricks después https://learn.microsoft.com/azure/databricks/init-scripts/global de 2) convierta en comentario la línea de init_scripts en el paso de Databricks de AzureML. Valor predeterminado: None
|
cluster_log_dbfs_path
|
Ruta de acceso de DBFS a donde deben entregarse los registros de clústeres. Valor predeterminado: None
|
permit_cluster_restart
|
Si se especifica existing_cluster_id, este parámetro indica si el clúster se puede reiniciar en nombre del usuario. Valor predeterminado: None
|
Métodos
validate |
Valida los detalles del clúster de Databricks especificados. Se validan las comprobaciones de los tipos de parámetros proporcionados, así como si se proporciona la combinación correcta de parámetros. Por ejemplo, debe especificar |
validate
Valida los detalles del clúster de Databricks especificados.
Se validan las comprobaciones de los tipos de parámetros proporcionados, así como si se proporciona la combinación correcta de parámetros. Por ejemplo, debe especificar existing_cluster_id
o especificar el resto de los parámetros del clúster. Para más información, vea las definiciones de parámetros de constructor.
validate()
Excepciones
Tipo | Description |
---|---|
class:azureml.exceptions.UserErrorException
|