automl Pacote
Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning.
As principais áreas incluem o gerenciamento de tarefas de AutoML.
Classes
ClassificationJob |
Configuração do Trabalho de Classificação de AutoML. Inicialize uma nova tarefa de Classificação de AutoML. |
ColumnTransformer |
Configurações do transformador de coluna. |
ForecastingJob |
Configuração da Tarefa de Previsão de AutoML. Inicialize uma nova tarefa de Previsão de AutoML. |
ForecastingSettings |
Configurações de previsão para um trabalho AutoML. |
ImageClassificationJob |
Configuração do trabalho classificação de imagens de várias classes do AutoML. Inicialize um novo trabalho de Classificação de Imagens de várias classes do AutoML. |
ImageClassificationMultilabelJob |
Configuração do trabalho classificação de imagens de vários rótulos do AutoML. Inicialize um novo trabalho de Classificação de Imagens de vários rótulos do AutoML. |
ImageClassificationSearchSpace |
Espaço de pesquisa para tarefas de classificação de imagem automl e classificação de imagens multi-rótulo. |
ImageInstanceSegmentationJob |
Configuração para o trabalho de segmentação de instância de imagem do AutoML. Inicialize um novo trabalho de Segmentação de Instância de Imagem AutoML. |
ImageLimitSettings |
Limitar as configurações para Verticais de Imagem AutoML. ImageLimitSettings é uma classe que contém os seguintes parâmetros: max_concurrent_trials, max_trials e timeout_minutes. Esse é um método de configuração opcional para configurar parâmetros de limites, como tempos limite etc. Observação O número de execuções simultâneas é ligado aos recursos disponíveis no destino de computação especificado. Verifique se o destino de computação tem os recursos disponíveis para a simultaneidade desejada. Dica É uma boa prática corresponder max_concurrent_trials contagem com o número de nós no cluster. Por exemplo, se você tiver um cluster com 4 nós, defina max_concurrent_trials como 4. Exemplo de uso Configuração de ImageLimitSettings
Inicialize um objeto ImageLimitSettings. Construtor para ImageLimitSettings para Verticais de Imagem AutoML. |
ImageModelSettingsClassification |
Configurações de modelo para tarefas de Classificação de Imagem de AutoML. |
ImageModelSettingsObjectDetection |
Configurações de modelo para a Tarefa de Detecção de Objeto de Imagem AutoML. |
ImageObjectDetectionJob |
Configuração para o trabalho de Detecção de Objeto de Imagem AutoML. Inicialize um novo trabalho de Detecção de Objeto de Imagem AutoML. |
ImageObjectDetectionSearchSpace |
Espaço de pesquisa para tarefas de detecção de objeto de imagem autoML e segmentação de instância de imagem. |
ImageSweepSettings |
Configurações de varredura para todas as Verticais de Imagem AutoML. |
NlpFeaturizationSettings |
Configurações de definição de recursos para todas as verticais de NLP do AutoML. |
NlpFixedParameters |
Objeto para abrigar parâmetros fixos para trabalhos NLP. |
NlpLimitSettings |
Limitar as configurações para todas as Verticais de NLP do AutoML. |
NlpSearchSpace |
Espaço de pesquisa para tarefas de NLP do AutoML. |
NlpSweepSettings |
Configurações de varredura para todas as tarefas de NLP do AutoML. |
RegressionJob |
Configuração do Trabalho de Regressão de AutoML. Inicialize uma nova tarefa de Regressão de AutoML. |
SearchSpace |
Classe SearchSpace para verticais de AutoML. |
StackEnsembleSettings |
Configuração avançada para personalizar a execução do StackEnsemble. |
TabularFeaturizationSettings |
Configurações de definição de recursos para um trabalho de AutoML. |
TabularLimitSettings |
Limitar as configurações de uma Tabela AutoML Vertical. |
TextClassificationJob |
Configuração do trabalho de classificação de texto do AutoML. Inicializa uma nova tarefa de Classificação de Texto AutoML. |
TextClassificationMultilabelJob |
Configuração do trabalho de classificação de texto multilódigo de classificação de texto do AutoML. Inicializa uma nova tarefa de Classificação de Texto AutoML Multi-rótulo. |
TextNerJob |
Configuração do trabalho NER de Texto NER do AutoML. Inicializa uma nova tarefa NER de Texto AutoML. |
TrainingSettings |
Classe TrainingSettings para o Azure Machine Learning. Classe TrainingSettings para o Azure Machine Learning. |
Enumerações
BlockedTransformers |
Enumeração para todos os modelos de classificação compatíveis com o AutoML. |
ClassificationModels |
Enumeração para todos os modelos de classificação compatíveis com o AutoML. |
ClassificationMultilabelPrimaryMetrics |
Métricas primárias para tarefas de classificação de vários rótulos. |
ClassificationPrimaryMetrics |
Métricas primárias para tarefas de classificação. |
FeaturizationMode |
Modo de caracterização – determina o modo de recursos de dados. |
ForecastHorizonMode |
Enumerar para determinar o modo de seleção do horizonte de previsão. |
ForecastingModels |
Enumeração para todos os modelos de previsão compatíveis com o AutoML. |
ForecastingPrimaryMetrics |
Métricas primárias para a tarefa Previsão. |
InstanceSegmentationPrimaryMetrics |
Métricas primárias para tarefas instanceSegmentation. |
LearningRateScheduler |
Enumeração do agendador de taxa de aprendizagem. |
LogTrainingMetrics |
Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning. As principais áreas incluem o gerenciamento de tarefas de AutoML. |
LogValidationLoss |
Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning. As principais áreas incluem o gerenciamento de tarefas de AutoML. |
NCrossValidationsMode |
Determina como o valor das validações N-Cross é determinado. |
ObjectDetectionPrimaryMetrics |
Métricas primárias para a tarefa Image ObjectDetection. |
RegressionModels |
Enumeração para todos os modelos de regressão compatíveis com o AutoML. |
RegressionPrimaryMetrics |
Métricas primárias para a tarefa Regressão. |
SamplingAlgorithmType |
Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning. As principais áreas incluem o gerenciamento de tarefas de AutoML. |
ShortSeriesHandlingConfiguration |
O parâmetro que define como o AutoML deve lidar com uma série temporal curta. |
StochasticOptimizer |
Otimizador stocástico para modelos de imagem. |
TargetAggregationFunction |
Função de agregação de destino. |
TargetLagsMode |
O destino atrasa os modos de seleção. |
TargetRollingWindowSizeMode |
Modo de tamanho de janela sem interrupção de destino. |
UseStl |
Configure a Decomposição de STL da coluna de destino da série temporal. |
ValidationMetricType |
Método de computação de métrica a ser usado para métricas de validação em tarefas de imagem. |
Funções
classification
Função para criar um ClassificationJob.
Um trabalho de classificação é usado para treinar um modelo que melhor preveja a classe de um exemplo de dados. Vários modelos são treinados usando os dados de treinamento. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos training_data
parâmetros e validation_data
test_data
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e padrões de precision_score_weighted para precisão
- enable_model_explainability
- bool
Se deve habilitar a explicação do melhor modelo do AutoML no final de todas as iterações de treinamento do AutoML. A opção padrão é Nenhum. Para obter mais informações, consulte Interpretabilidade: explicações de modelo no machine learning automatizado.
- weight_column_name
- str
O nome da coluna de peso de amostra. O ML Automatizado oferece suporte a uma coluna ponderada como uma entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada são de um pandas.DataFrame que não tem nomes de coluna, os índices de coluna podem ser usados, expressos como inteiros.
Esse parâmetro é aplicável aos training_data
parâmetros e validation_data
- validation_data
- Input
Os dados de validação a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).
Padrão como Nenhum
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação; caso contrário, defina n_cross_validations
ou validation_data_size
para extrair os dados de validação dos dados de treinamento especificados.
Para a dobra de validação cruzada personalizada, use cv_split_column_names
.
Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.
Padrão como Nenhum
Quantas validações cruzadas devem ser executadas quando os dados de validação do usuário não são especificados.
Especifique validation_data
para fornecer dados de validação; caso contrário, defina n_cross_validations
ou validation_data_size
para extrair os dados de validação dos dados de treinamento especificados.
Para a dobra de validação cruzada personalizada, use cv_split_column_names
.
Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.
Padrão como Nenhum
Lista de nomes das colunas que contêm divisão de validação cruzada personalizada. Cada uma das colunas de divisão CV representa uma divisão CV, em que cada linha é marcada como 1 para treinamento ou 0 para validação.
Padrão como Nenhum
- test_data
- Input
O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Os dados de teste a serem usados para uma execução de teste que serão iniciados automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.
Se esse parâmetro ou o parâmetro test_data_size
não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.
Os dados de teste devem conter os recursos e a coluna de rótulo.
Se test_data
for especificado, o parâmetro target_column_name
deverá ser especificado.
Padrão como Nenhum
- test_data_size
- float
O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Qual fração dos dados de treinamento deve ser mantida para dados de teste em uma execução de teste que será iniciada automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.
Isso deve estar entre 0,0 e 1,0 não inclusivo.
Se test_data_size
for especificado ao mesmo tempo que validation_data_size
, os dados de teste serão divididos de training_data
antes da divisão dos dados de validação.
Por exemplo, se validation_data_size=0.1
, test_data_size=0.1
e os dados de treinamento originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação terão 90 linhas e os dados de treinamento terão 810 linhas.
Para tarefas de regressão, usa-se a amostragem aleatória. Para tarefas de classificação, a amostragem estratificada é usada. No momento, a previsão não é compatível com a especificação de um conjunto de dados de teste usando uma divisão de treinamento/teste.
Se esse parâmetro ou o parâmetro test_data
não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.
Padrão como Nenhum
Retornos
Um objeto de trabalho que pode ser enviado a uma computação do Azure ML para execução.
Tipo de retorno
forecasting
Função para criar um trabalho de Previsão.
Uma tarefa de previsão é usada para prever valores de destino para um período de tempo futuro com base nos dados históricos. Vários modelos são treinados usando os dados de treinamento. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos training_data
parâmetros e validation_data
test_data
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Padrões para normalized_root_mean_squared_error
- enable_model_explainability
- bool
Se deve habilitar a explicação do melhor modelo do AutoML no final de todas as iterações de treinamento do AutoML. A opção padrão é Nenhum. Para obter mais informações, consulte Interpretabilidade: explicações de modelo no machine learning automatizado.
- weight_column_name
- str
O nome da coluna de peso de amostra. O ML Automatizado oferece suporte a uma coluna ponderada como uma entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada são de um pandas.DataFrame que não tem nomes de coluna, os índices de coluna podem ser usados, expressos como inteiros.
Esse parâmetro é aplicável aos training_data
parâmetros e validation_data
- validation_data
- Input
Os dados de validação a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).
Padrão como Nenhum
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação; caso contrário, defina n_cross_validations
ou validation_data_size
para extrair os dados de validação dos dados de treinamento especificados.
Para a dobra de validação cruzada personalizada, use cv_split_column_names
.
Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.
Padrão como Nenhum
Quantas validações cruzadas devem ser executadas quando os dados de validação do usuário não são especificados.
Especifique validation_data
para fornecer dados de validação; caso contrário, defina n_cross_validations
ou validation_data_size
para extrair os dados de validação dos dados de treinamento especificados.
Para a dobra de validação cruzada personalizada, use cv_split_column_names
.
Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.
Padrão como Nenhum
Lista de nomes das colunas que contêm divisão de validação cruzada personalizada. Cada uma das colunas de divisão CV representa uma divisão CV, em que cada linha é marcada como 1 para treinamento ou 0 para validação.
Padrão como Nenhum
- test_data
- Input
O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Os dados de teste a serem usados para uma execução de teste que serão iniciados automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.
Se esse parâmetro ou o parâmetro test_data_size
não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.
Os dados de teste devem conter os recursos e a coluna de rótulo.
Se test_data
for especificado, o parâmetro target_column_name
deverá ser especificado.
Padrão como Nenhum
- test_data_size
- float
O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Qual fração dos dados de treinamento deve ser mantida para dados de teste em uma execução de teste que será iniciada automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.
Isso deve estar entre 0,0 e 1,0 não inclusivo.
Se test_data_size
for especificado ao mesmo tempo que validation_data_size
, os dados de teste serão divididos de training_data
antes da divisão dos dados de validação.
Por exemplo, se validation_data_size=0.1
, test_data_size=0.1
e os dados de treinamento originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação terão 90 linhas e os dados de treinamento terão 810 linhas.
Para tarefas de regressão, usa-se a amostragem aleatória. Para tarefas de classificação, a amostragem estratificada é usada. No momento, a previsão não é compatível com a especificação de um conjunto de dados de teste usando uma divisão de treinamento/teste.
Se esse parâmetro ou o parâmetro test_data
não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.
Padrão como Nenhum
- forecasting_settings
- ForecastingSettings
As configurações da tarefa de previsão
Retornos
Um objeto de trabalho que pode ser enviado a uma computação do Azure ML para execução.
Tipo de retorno
image_classification
Cria um objeto para o trabalho classificação de várias classes de imagem autoML.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento.
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos parâmetros training_data
e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Padrões de precisão.
- validation_data
- Input
Os dados de validação a serem usados no experimento.
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de treinamento especificados.
O padrão é .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
Objeto de trabalho de classificação de imagem que pode ser enviado a uma computação do Azure ML para execução.
Tipo de retorno
image_classification_multilabel
Cria um objeto para o trabalho classificação de vários rótulos de Imagem AutoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento.
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos parâmetros training_data
e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted e Iou Defaults to Iou.
- validation_data
- Input
Os dados de validação a serem usados no experimento.
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de treinamento especificados.
O padrão é .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
Objeto de trabalho de classificação de vários rótulos de imagem que pode ser enviado para uma computação do Azure ML para execução.
Tipo de retorno
image_instance_segmentation
Cria um objeto para o trabalho de Segmentação de Instância de Imagem do AutoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento.
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos parâmetros training_data
e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Os dados de validação a serem usados no experimento.
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de treinamento especificados.
O padrão é .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
Trabalho de segmentação de instância de imagem
Tipo de retorno
image_object_detection
Cria um objeto para o trabalho de Detecção de Objeto de Imagem AutoML.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento.
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos parâmetros training_data
e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Os dados de validação a serem usados no experimento.
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de treinamento especificados.
O padrão é .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
Objeto de trabalho de detecção de objeto de imagem que pode ser enviado para uma computação do Azure ML para execução.
Tipo de retorno
regression
Função para criar um trabalho de regressão.
Um trabalho de regressão é usado para treinar um modelo para prever valores contínuos de uma variável de destino de um conjunto de dados. Vários modelos são treinados usando os dados de treinamento. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).
- target_column_name
- str
O nome da coluna de rótulo.
Esse parâmetro é aplicável aos training_data
parâmetros e validation_data
test_data
- primary_metric
A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. O padrão é normalized_root_mean_squared_error
- enable_model_explainability
- bool
Se deve habilitar a explicação do melhor modelo do AutoML no final de todas as iterações de treinamento do AutoML. A opção padrão é Nenhum. Para obter mais informações, consulte Interpretabilidade: explicações de modelo no machine learning automatizado.
- weight_column_name
- str
O nome da coluna de peso de amostra. O ML Automatizado oferece suporte a uma coluna ponderada como uma entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada são de um pandas.DataFrame que não tem nomes de coluna, os índices de coluna podem ser usados, expressos como inteiros.
Esse parâmetro é aplicável aos training_data
parâmetros e validation_data
- validation_data
- Input
Os dados de validação a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).
Padrão como Nenhum
- validation_data_size
- float
Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.
Especifique validation_data
para fornecer dados de validação; caso contrário, defina n_cross_validations
ou validation_data_size
para extrair os dados de validação dos dados de treinamento especificados.
Para a dobra de validação cruzada personalizada, use cv_split_column_names
.
Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.
Padrão como Nenhum
Quantas validações cruzadas devem ser executadas quando os dados de validação do usuário não são especificados.
Especifique validation_data
para fornecer dados de validação; caso contrário, defina n_cross_validations
ou validation_data_size
para extrair os dados de validação dos dados de treinamento especificados.
Para a dobra de validação cruzada personalizada, use cv_split_column_names
.
Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.
Padrão como Nenhum
Lista de nomes das colunas que contêm divisão de validação cruzada personalizada. Cada uma das colunas de divisão CV representa uma divisão CV, em que cada linha é marcada como 1 para treinamento ou 0 para validação.
Padrão como Nenhum
- test_data
- Input
O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Os dados de teste a serem usados para uma execução de teste que serão iniciados automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.
Se esse parâmetro ou o parâmetro test_data_size
não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.
Os dados de teste devem conter os recursos e a coluna de rótulo.
Se test_data
for especificado, o parâmetro target_column_name
deverá ser especificado.
Padrão como Nenhum
- test_data_size
- float
O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Qual fração dos dados de treinamento deve ser mantida para dados de teste em uma execução de teste que será iniciada automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.
Isso deve estar entre 0,0 e 1,0 não inclusivo.
Se test_data_size
for especificado ao mesmo tempo que validation_data_size
, os dados de teste serão divididos de training_data
antes da divisão dos dados de validação.
Por exemplo, se validation_data_size=0.1
, test_data_size=0.1
e os dados de treinamento originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação terão 90 linhas e os dados de treinamento terão 810 linhas.
Para tarefas de regressão, usa-se a amostragem aleatória. Para tarefas de classificação, a amostragem estratificada é usada. No momento, a previsão não é compatível com a especificação de um conjunto de dados de teste usando uma divisão de treinamento/teste.
Se esse parâmetro ou o parâmetro test_data
não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.
Padrão como Nenhum
Retornos
Um objeto de trabalho que pode ser enviado a uma computação do Azure ML para execução.
Tipo de retorno
text_classification
Função para criar um TextClassificationJob.
Um trabalho de classificação de texto é usado para treinar um modelo que pode prever a classe/categoria de dados de texto. Os dados de treinamento de entrada devem incluir uma coluna de destino que classifique o texto em exatamente uma classe.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.
- target_column_name
- str
Nome da coluna de destino.
- validation_data
- Input
Os dados de validação a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Métrica primária para a tarefa. Valores aceitáveis: precisão, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Nível de detalhamento de log.
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
O objeto TextClassificationJob.
Tipo de retorno
text_classification_multilabel
Função para criar um TextClassificationMultilabelJob.
Um trabalho de classificação de texto com vários rótulos é usado para treinar um modelo que pode prever as classes/categorias de dados de texto. Os dados de treinamento de entrada devem incluir uma coluna de destino que classifique o texto em class(es). Para obter mais informações sobre o formato de dados de vários rótulos, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.
- target_column_name
- str
Nome da coluna de destino.
- validation_data
- Input
Os dados de validação a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.
- primary_metric
- str
Métrica primária para a tarefa. Valores aceitáveis: precisão
- log_verbosity
- str
Nível de detalhamento de log.
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
O objeto TextClassificationMultilabelJob.
Tipo de retorno
text_ner
Função para criar um TextNerJob.
Um trabalho de reconhecimento de entidade chamado de texto é usado para treinar um modelo que pode prever as entidades nomeadas no texto. Os dados de treinamento de entrada devem ser um arquivo de texto no formato CoNLL. Para obter mais informações sobre o formato de dados NER de texto, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parâmetros
- training_data
- Input
Os dados de treinamento a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.
- validation_data
- Input
Os dados de validação a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.
- primary_metric
- str
Métrica primária para a tarefa. Valores aceitáveis: precisão
- log_verbosity
- str
Nível de detalhamento de log.
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Retornos
O objeto TextNerJob.
Tipo de retorno
Azure SDK for Python