dataset_utilities Módulo

Métodos de utilidad para interactuar con azureml.core.Dataset.

Funciones

collect_usage_telemetry

collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None

Parámetros

Nombre Description
compute
Requerido
spark_context
Requerido

convert_inputs

Convierte los conjuntos de datos especificados en definiciones de las que se puede realizar un seguimiento.

convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]

Parámetros

Nombre Description
X
Requerido

conjunto de datos que representa X

y
Requerido

conjunto de datos que representa y

sample_weight
Requerido

conjunto de datos que representa el peso de la muestra

X_valid
Requerido

conjunto de datos que representa X_valid

y_valid
Requerido

conjunto de datos que representa y_valid

sample_weight_valid
Requerido

conjunto de datos que representa el peso de la muestra de validación

convert_inputs_dataset

Convierte los conjuntos de datos especificados en definiciones de las que se puede realizar un seguimiento.

convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]

Parámetros

Nombre Description
datasets
Requerido

conjuntos de datos que se convierten en definiciones de las que se puede realizar un seguimiento

ensure_saved

ensure_saved(workspace: Workspace, **kwargs: Any) -> None

Parámetros

Nombre Description
workspace
Requerido

get_dataset_from_mltable_data_json

Obtiene un conjunto de datos del objeto JSON de datos de MLTable.

get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None

Parámetros

Nombre Description
ws
Requerido

Área de trabajo de la que se obtiene el conjunto de datos.

mltable_data_json_obj
Requerido

Objeto JSON de datos de mltable.

data_label
Requerido

Etiqueta que indica el conjunto de datos que se carga desde el objeto JSON de datos de mltable.

get_datasets_from_data_json

Obtiene conjuntos de datos del objeto JSON de datos, que pueden ser JSON de datos de MLTable (con identificador uri) o JSON de Dataprep (con identificador de conjunto de datos)

get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parámetros

Nombre Description
ws
Requerido

Área de trabajo de la que se obtiene el conjunto de datos.

data_preparation_json
Requerido

Objeto JSON de datos.

data_labels
Requerido

Lista de etiquetas que indican el conjunto de datos que se cargue desde el objeto JSON de datos.

get_datasets_from_dataprep_json

Obtiene el conjunto de datos de Dataprep json (con el identificador del conjunto de datos)

get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parámetros

Nombre Description
ws
Requerido

Área de trabajo de la que se obtiene el conjunto de datos.

data_preparation_json
Requerido

Objeto JSON de datos.

data_labels
Requerido

Lista de etiquetas que indican el conjunto de datos que se cargue desde el objeto JSON de datos.

dataprep_json
Requerido

get_datasets_from_mltable_data_json

Obtiene conjuntos de datos del objeto JSON de datos de MLTable (con identificador URI).

get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parámetros

Nombre Description
ws
Requerido

Área de trabajo de la que se obtiene el conjunto de datos.

data_preparation_json
Requerido

Objeto JSON de datos.

data_labels
Requerido

Lista de etiquetas que indican el conjunto de datos que se cargue desde el objeto JSON de datos.

mltable_data_json_obj
Requerido

get_datasets_json

Obtiene un JSON de preparación de datos.

get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

Parámetros

Nombre Description
training_data

Datos de entrenamiento.

Valor predeterminado: None
validation_data

Datos de validación

Valor predeterminado: None
test_data

Datos de prueba

Valor predeterminado: None

Devoluciones

Tipo Description

Representación de cadena JSON de un diccionario del conjunto de datos

is_dataset

Comprueba si el objeto especificado es un conjunto de datos o una definición de conjunto de datos.

is_dataset(dataset: Any) -> bool

Parámetros

Nombre Description
dataset
Requerido

objeto que se debe comprobar