Usar o ML automatizado na interface do usuário do Azure Databricks
Você pode usar a interface gráfica do usuário no portal do Azure Databricks para criar e gerenciar experimentos de ML automatizado.
Configurar um experimento de AutoML
Para configurar o experimento de ML automatizado, você deve especificar as configurações para seus requisitos específicos de treinamento de modelo, incluindo:
- O cluster no qual você executa o experimento.
- O tipo de modelo de machine learning que será treinado (clustering, regressão ou previsão).
- A tabela que contém os dados de treinamento.
- O campo de rótulo de destino para o modelo precisa prever.
- Um nome exclusivo para o experimento de ML automatizado (as execuções filho para cada avaliação de treinamento são nomeadas automaticamente).
- A métrica de avaliação que você deseja usar para determinar o modelo de melhor desempenho.
- As estruturas de treinamento de aprendizado de máquina que você deseja testar.
- O tempo máximo do experimento.
- O valor de rótulo positivo (somente para classificação binária).
- A coluna de tempo (somente para modelos de previsão).
- Onde salvar os modelos treinados (como artefatos do MLflow ou no repositório DBFS).
Examinar os resultados do ML automatizado
À medida que o experimento de Ml automatizado progride, suas execuções filho são exibidas com o experimento que produziu o modelo de melhor desempenho até o momento primeiro.
Você pode aguardar a conclusão do experimento ou explorar os modelos produzidos até o momento e interromper o experimento caso algum deles já tenha atendido suas necessidades.
Você pode explorar cada execução para exibir o notebook que foi gerado e as métricas para o modelo que ele produziu. Depois, você pode registrar o modelo e implantá-lo para inferência.