dataset_utilities Módulo

Métodos utilitários para interagir com azureml.core.Dataset.

Funções

collect_usage_telemetry

collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None

Parâmetros

Nome Description
compute
Obrigatório
spark_context
Obrigatório

convert_inputs

Converta os conjuntos de dados determinados em definições rastreáveis.

convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]

Parâmetros

Nome Description
X
Obrigatório

conjunto de dados que representa X

y
Obrigatório

conjunto de dados que representa y

sample_weight
Obrigatório

conjunto de dados que representa o peso da amostra

X_valid
Obrigatório

conjunto de dados que representa X_valid

y_valid
Obrigatório

conjunto de dados que representa y_valid

sample_weight_valid
Obrigatório

conjunto de dados que representa o peso da amostra de validação

convert_inputs_dataset

Converter os conjuntos de dados determinados em definições rastreáveis.

convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]

Parâmetros

Nome Description
datasets
Obrigatório

conjuntos de dados a serem convertidos em definições rastreáveis

ensure_saved

ensure_saved(workspace: Workspace, **kwargs: Any) -> None

Parâmetros

Nome Description
workspace
Obrigatório

get_dataset_from_mltable_data_json

Obter conjunto de dados do JSON de dados da MLTable

get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None

Parâmetros

Nome Description
ws
Obrigatório

workspace do qual obter o conjunto de dados

mltable_data_json_obj
Obrigatório

objeto de dados JSON da mltable

data_label
Obrigatório

rótulo que indica o conjunto de dados a ser carregado do JSON de dados da mltable

get_datasets_from_data_json

Obter conjuntos de dados do JSON de dados que podem ser JSON de dados da MLTable (com URI) ou JSON Dataprep (com ID de conjunto de dados)

get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parâmetros

Nome Description
ws
Obrigatório

workspace do qual obter o conjunto de dados

data_preparation_json
Obrigatório

objeto de dados JSON

data_labels
Obrigatório

lista de rótulos indicando o conjunto de dados a ser carregado do JSON de dados

get_datasets_from_dataprep_json

Obter conjunto de dados do JSON Dataprep (com ID do conjunto de dados)

get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parâmetros

Nome Description
ws
Obrigatório

workspace do qual obter o conjunto de dados

data_preparation_json
Obrigatório

objeto de dados JSON

data_labels
Obrigatório

lista de rótulos indicando o conjunto de dados a ser carregado do JSON de dados

dataprep_json
Obrigatório

get_datasets_from_mltable_data_json

Obter conjuntos de dados do JSON de dados da MLTable (com URI)

get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parâmetros

Nome Description
ws
Obrigatório

workspace do qual obter o conjunto de dados

data_preparation_json
Obrigatório

objeto de dados JSON

data_labels
Obrigatório

lista de rótulos indicando o conjunto de dados a ser carregado do JSON de dados

mltable_data_json_obj
Obrigatório

get_datasets_json

Obtenha JSON dataprep.

get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

Parâmetros

Nome Description
training_data

Dados de treinamento.

Valor padrão: None
validation_data

Dados de validação

Valor padrão: None
test_data

Dados de teste

Valor padrão: None

Retornos

Tipo Description

Representação de cadeia de caracteres JSON de um dict do Conjunto de Dados

is_dataset

Verifique se o objeto determinado é um conjunto de dados ou uma definição de conjunto de dados.

is_dataset(dataset: Any) -> bool

Parâmetros

Nome Description
dataset
Obrigatório

objeto a ser verificado