Varredura e seleção do modelo para previsão no AutoML
Esse artigo descreve como o machine learning automatizado (AutoML) no Azure Machine Learning pesquisa e seleciona modelos de previsão. Se você estiver interessado em aprender mais sobre a metodologia de previsão no AutoML, veja Visão geral dos métodos de previsão no AutoML. Para explorar exemplos de treinamento de modelos de previsão no AutoML, veja Configurar o AutoML para treinar um modelo de previsão de séries temporais com o SDK e CLI.
Limpeza de modelos no AutoML
A tarefa central do AutoML é treinar e avaliar vários modelos e escolher o melhor em relação à métrica primária fornecida. A palavra "modelo" neste caso refere-se tanto à classe do modelo, como ARIMA ou Floresta Aleatória, quanto às configurações específicas de hiper-parâmetros que distinguem modelos dentro de uma classe. Por exemplo, ARIMA refere-se a uma classe de modelos que compartilham um modelo matemático e um conjunto de suposições estatísticas. O treinamento, ou ajuste, de um modelo ARIMA requer uma lista de números inteiros positivos que especificam a forma matemática precisa do modelo. Esses valores são os hiper-parâmetros. Os modelos ARIMA(1, 0, 1) e ARIMA(2, 1, 2) têm a mesma classe, mas diferentes hiper-parâmetros. Essas definições podem ser ajustadas separadamente com os dados de treinamento e avaliadas entre si. O AutoML localiza, ou limpa, diferentes classes de modelos e dentro das classes variando os hiper-parâmetros.
Métodos de limpeza de hiper-parâmetros
A tabela a seguir mostra os diferentes métodos de varredura de hiperparâmetro que o AutoML usa para classes de modelo diferentes:
Grupo de classes de modelo | Tipo de modelo | Método de varredura de hiperparâmetro |
---|---|---|
Naive, Seasonal Naive, Average, Seasonal Average | Série temporal | Nenhuma varredura na classe devido à simplicidade do modelo |
Ajuste exponencial, ARIMA(X) | Série temporal | Pesquisa de grade para limpeza na classe |
Prophet | Regressão | Sem varredura na classe |
Linear SGD, LARS LASSO, Elastic Net, K Nearest Neighbors, Decision Tree, Random Forest, Extremely Randomized Trees, Gradient Boosted Trees, LightGBM, XGBoost | Regressão | O serviço de recomendação de modelo do AutoML explora dinamicamente os espaços de hiperparâmetro |
ForecastTCN | Regressão | Lista estática de modelos seguida por pesquisa aleatória sobre dimensionar da rede, taxa de desistência e de aprendizado |
Para uma descrição dos diferentes tipos de modelos, veja a seção Modelos de previsão no AutoML do artigo de visão geral dos métodos de previsão.
A quantidade de limpeza pelo AutoML depende da configuração do trabalho de previsão. Você pode especificar os critérios de parada como um limite de tempo ou um limite no número de testes, ou o número equivalente de modelos. A lógica de término antecipado pode ser usada em ambos os casos para parar a limpeza se a métrica primária não estiver melhorando.
Seleção de modelos no AutoML
O AutoML segue um processo de três fases para pesquisar e selecionar modelos de previsão:
Fase 1: Limpar de modelos de série temporal e selecionar do melhor modelo de cada classe usando métodos de estimativa de máxima verossimilhança.
Fase 2: Limpar modelos de regressão e ordená-los, junto com os melhores modelos de série temporal da fase 1, de acordo com seus valores de métrica primária dos conjuntos de validação.
Fase 3: Criar um modelo de conjunto a partir dos modelos mais bem classificados, calcular sua métrica de validação e classificá-lo com os outros modelos.
O modelo com o valor de métrica mais bem classificado no final da fase 3 é designado como o melhor modelo.
Importante
Na Fase 3, o AutoML sempre calcula métricas em dados fora da amostra que não são usados para ajustar os modelos. Essa abordagem ajuda a proteger contra o sobreajuste.
Configurações de validação
O AutoML tem duas configurações de validação: validação cruzada e dados de validação explícita.
No caso de validação cruzada, o AutoML usa a configuração de entrada para criar divisões de dados em dobras de treinamento e validação. A ordem temporal deve ser preservada nessas divisões. O AutoML usa a chamada Validação Cruzada de Origem Deslizante, que divide a série em dados de treinamento e validação usando um ponto de tempo de origem. Deslizar a origem no tempo gera as dobras de validação cruzada. Cada dobra de validação contém o próximo horizonte de observações imediatamente após a posição da origem da dobra fornecida. Essa estratégia preserva a integridade dos dados de série temporal e mitiga o risco de vazamento de informações.
O AutoML segue o procedimento de validação cruzada usual, treinando um modelo separado em cada dobra e média de métricas de validação de todas as dobras.
A validação cruzada para trabalhos de previsão é configurada definindo o número de dobras de validação cruzada e, opcionalmente, o número de períodos entre duas dobras consecutivas de validação cruzada. Para obter mais informações e um exemplo de configuração de validação cruzada para previsão, confira Configurações de validação cruzada personalizadas.
Também é possível usar seus próprios dados de validação. Para mais informações, confira Configurar dados de treinamento, validação, validação cruzada e teste no AutoML (SDK v1).