dataset_utilities Módulo
Métodos de utilidad para interactuar con azureml.core.Dataset.
Funciones
collect_usage_telemetry
collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None
Parámetros
Nombre | Description |
---|---|
compute
Requerido
|
|
spark_context
Requerido
|
|
convert_inputs
Convierte los conjuntos de datos especificados en definiciones de las que se puede realizar un seguimiento.
convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]
Parámetros
Nombre | Description |
---|---|
X
Requerido
|
conjunto de datos que representa X |
y
Requerido
|
conjunto de datos que representa y |
sample_weight
Requerido
|
conjunto de datos que representa el peso de la muestra |
X_valid
Requerido
|
conjunto de datos que representa X_valid |
y_valid
Requerido
|
conjunto de datos que representa y_valid |
sample_weight_valid
Requerido
|
conjunto de datos que representa el peso de la muestra de validación |
convert_inputs_dataset
Convierte los conjuntos de datos especificados en definiciones de las que se puede realizar un seguimiento.
convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]
Parámetros
Nombre | Description |
---|---|
datasets
Requerido
|
conjuntos de datos que se convierten en definiciones de las que se puede realizar un seguimiento |
ensure_saved
ensure_saved(workspace: Workspace, **kwargs: Any) -> None
Parámetros
Nombre | Description |
---|---|
workspace
Requerido
|
|
get_dataset_from_mltable_data_json
Obtiene un conjunto de datos del objeto JSON de datos de MLTable.
get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None
Parámetros
Nombre | Description |
---|---|
ws
Requerido
|
Área de trabajo de la que se obtiene el conjunto de datos. |
mltable_data_json_obj
Requerido
|
Objeto JSON de datos de mltable. |
data_label
Requerido
|
Etiqueta que indica el conjunto de datos que se carga desde el objeto JSON de datos de mltable. |
get_datasets_from_data_json
Obtiene conjuntos de datos del objeto JSON de datos, que pueden ser JSON de datos de MLTable (con identificador uri) o JSON de Dataprep (con identificador de conjunto de datos)
get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]
Parámetros
Nombre | Description |
---|---|
ws
Requerido
|
Área de trabajo de la que se obtiene el conjunto de datos. |
data_preparation_json
Requerido
|
Objeto JSON de datos. |
data_labels
Requerido
|
Lista de etiquetas que indican el conjunto de datos que se cargue desde el objeto JSON de datos. |
get_datasets_from_dataprep_json
Obtiene el conjunto de datos de Dataprep json (con el identificador del conjunto de datos)
get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]
Parámetros
Nombre | Description |
---|---|
ws
Requerido
|
Área de trabajo de la que se obtiene el conjunto de datos. |
data_preparation_json
Requerido
|
Objeto JSON de datos. |
data_labels
Requerido
|
Lista de etiquetas que indican el conjunto de datos que se cargue desde el objeto JSON de datos. |
dataprep_json
Requerido
|
|
get_datasets_from_mltable_data_json
Obtiene conjuntos de datos del objeto JSON de datos de MLTable (con identificador URI).
get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]
Parámetros
Nombre | Description |
---|---|
ws
Requerido
|
Área de trabajo de la que se obtiene el conjunto de datos. |
data_preparation_json
Requerido
|
Objeto JSON de datos. |
data_labels
Requerido
|
Lista de etiquetas que indican el conjunto de datos que se cargue desde el objeto JSON de datos. |
mltable_data_json_obj
Requerido
|
|
get_datasets_json
Obtiene un JSON de preparación de datos.
get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None
Parámetros
Nombre | Description |
---|---|
training_data
|
Datos de entrenamiento. Valor predeterminado: None
|
validation_data
|
Datos de validación Valor predeterminado: None
|
test_data
|
Datos de prueba Valor predeterminado: None
|
Devoluciones
Tipo | Description |
---|---|
Representación de cadena JSON de un diccionario del conjunto de datos |
is_dataset
Comprueba si el objeto especificado es un conjunto de datos o una definición de conjunto de datos.
is_dataset(dataset: Any) -> bool
Parámetros
Nombre | Description |
---|---|
dataset
Requerido
|
objeto que se debe comprobar |