Introdução
No aprendizado de máquina, os algoritmos são usados para treinar modelos que preveem rótulos desconhecidos para novos dados com base nas correlações existentes entre os rótulos conhecidos e os recursos encontrados nos dados de treinamento. Dependendo do algoritmo usado, talvez seja necessário especificar os hiperparâmetros para configurar como o modelo será treinado. Por exemplo, o algoritmo de regressão logística usa um hiperparâmetro de taxa de regularização para neutralizar o sobreajuste; e os modelos de aprendizado profundo para redes neurais usam hiperparâmetros como a taxa de aprendizado para controlar a maneira como os pesos são ajustados durante o treinamento.
Observação
O Aprendizado de Máquina é um campo acadêmico com sua própria terminologia específica. Os cientistas de dados se referem aos valores determinados por meio dos recursos de treinamento como parâmetros, portanto, é necessário um termo diferente para os valores que são usados na configuração do comportamento de treinamento, mas que não são derivados dos dados de treinamento, daí o termo hiperparâmetro.
Os valores de hiperparâmetro selecionados para um determinado algoritmo podem ter um efeito significativo no modelo que ele treina; portanto, escolher os valores de hiperparâmetro certos pode fazer a diferença entre um modelo que prevê bem quando usado com novos dados e um modelo que não o faz.
No Azure Databricks, você pode usar a biblioteca Hyperopt para automatizar o ajuste de hiperparâmetro; um processo no qual você treina e avalia modelos repetidamente usando diferentes combinações de hiperparâmetros até encontrar os valores que funcionam melhor para seus dados.