Regressão de Poisson
Aviso
Este componente foi preterido porque sua dependência, o projeto NimbusML , não é mais mantida ativamente. Como resultado, esse componente não receberá atualizações ou patches de segurança futuros. Planejamos remover esse componente nas próximas versões. Recomenda-se aos usuários que migrem para soluções alternativas para garantir suporte e segurança contínuos.
Este artigo descreve um componente no designer do Azure Machine Learning.
Use este componente para criar um modelo de regressão de Poisson em um pipeline. A regressão de Poisson destina-se a prever valores numéricos, normalmente contagens. Portanto, você deve usar esse componente para criar seu modelo de regressão somente se os valores que você está tentando prever ajustarem as seguintes condições:
A variável resposta tem uma distribuição de Poisson.
As contagens não podem ser negativas. O método falhará completamente se você tentar usá-lo com rótulos negativos.
Uma distribuição de Poisson é uma distribuição discreta; portanto, não é significativo usar este método com números não inteiros.
Gorjeta
Se o seu alvo não for uma contagem, a regressão de Poisson provavelmente não é um método apropriado. Experimente outros componentes de regressão no designer.
Depois de configurar o método de regressão, você deve treinar o modelo usando um conjunto de dados contendo exemplos do valor que você deseja prever. O modelo treinado pode então ser usado para fazer previsões.
Mais sobre a regressão de Poisson
A regressão de Poisson é um tipo especial de análise de regressão que normalmente é usado para modelar contagens. Por exemplo, a regressão de Poisson seria útil nestes cenários:
Modelação do número de constipações associadas a voos de avião
Estimar o número de chamadas de serviço de emergência durante um evento
Projeção do número de consultas de clientes após uma promoção
Criação de tabelas de contingência
Como a variável resposta tem uma distribuição de Poisson, o modelo faz suposições diferentes sobre os dados e sua distribuição de probabilidade do que, digamos, a regressão de mínimos quadrados. Portanto, os modelos de Poisson devem ser interpretados de forma diferente de outros modelos de regressão.
Como configurar a regressão de Poisson
Adicione o componente Regressão de Poisson ao seu pipeline no designer. Você pode encontrar esse componente em Algoritmos de Aprendizado de Máquina, na categoria Regressão .
Adicione um conjunto de dados que contenha dados de treinamento do tipo correto.
Recomendamos que você use Normalize Data para normalizar o conjunto de dados de entrada antes de usá-lo para treinar o regressor.
No painel direito do componente Regressão de Poisson, especifique como deseja que o modelo seja treinado, definindo a opção Criar modo de treinador.
Parâmetro único: Se você souber como deseja configurar o modelo, forneça um conjunto específico de valores como argumentos.
Intervalo de parâmetros: Se você não tiver certeza dos melhores parâmetros, faça uma varredura de parâmetros usando o componente Tune Model Hyperparameters . O treinador itera sobre vários valores especificados para encontrar a configuração ideal.
Tolerância de otimização: digite um valor que define o intervalo de tolerância durante a otimização. Quanto menor o valor, mais lento e preciso o encaixe.
Peso de regularização L1 e peso de regularização L2: Valores de tipo a utilizar para regularização L1 e L2. A regularização adiciona restrições ao algoritmo em relação a aspetos do modelo que são independentes dos dados de treinamento. A regularização é comumente usada para evitar o overfitting.
A regularização L1 é útil se o objetivo é ter um modelo o mais esparso possível.
A regularização L1 é feita subtraindo o peso L1 do vetor de peso da expressão de perda que o aluno está tentando minimizar. A norma L1 é uma boa aproximação à norma L0, que é o número de coordenadas diferentes de zero.
A regularização L2 evita que qualquer coordenada no vetor de peso cresça demais em magnitude. A regularização L2 é útil se o objetivo for ter um modelo com pesos totais pequenos.
Neste componente, você pode aplicar uma combinação de regularizações L1 e L2. Ao combinar a regularização L1 e L2, você pode impor uma penalidade sobre a magnitude dos valores dos parâmetros. O/A aluno/a tenta minimizar a penalização, numa troca com a minimização da perda.
Para uma boa discussão sobre regularização L1 e L2, consulte Regularização L1 e L2 para Machine Learning.
Tamanho da memória para L-BFGS: especifique a quantidade de memória a ser reservada para ajuste e otimização do modelo.
L-BFGS é um método específico para otimização, baseado no algoritmo Broyden–Fletcher–Goldfarb–Shanno (BFGS). O método usa uma quantidade limitada de memória (L) para calcular a próxima direção da etapa.
Ao alterar esse parâmetro, você pode afetar o número de posições e gradientes passados armazenados para o cálculo da próxima etapa.
Conecte o conjunto de dados de treinamento e o modelo não treinado a um dos componentes de treinamento:
Se você definir Criar modo de treinamento como Parâmetro único, use o componente Modelo de trem.
Se você definir Create trainer mode como Parameter Range, use o componente Tune Model Hyperparameters .
Aviso
Se você passar um intervalo de parâmetros para Train Model, ele usará apenas o primeiro valor na lista de intervalos de parâmetros.
Se você passar um único conjunto de valores de parâmetro para o componente Tune Model Hyperparameters , quando ele espera um intervalo de configurações para cada parâmetro, ele ignora os valores e usa os valores padrão para o aluno.
Se você selecionar a opção Intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse único valor especificado será usado durante toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.
Envie o pipeline.
Resultados
Após a conclusão da formação:
- Para salvar um instantâneo do modelo treinado, selecione o componente de treinamento e alterne para a guia Saídas+logs no painel direito. Clique no ícone Registrar conjunto de dados. Você pode encontrar o modelo salvo como um componente na árvore de componentes.
Próximos passos
Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.