Partilhar via


Regressão de Poisson

Aviso

Este componente foi preterido porque sua dependência, o projeto NimbusML , não é mais mantida ativamente. Como resultado, esse componente não receberá atualizações ou patches de segurança futuros. Planejamos remover esse componente nas próximas versões. Recomenda-se aos usuários que migrem para soluções alternativas para garantir suporte e segurança contínuos.

Este artigo descreve um componente no designer do Azure Machine Learning.

Use este componente para criar um modelo de regressão de Poisson em um pipeline. A regressão de Poisson destina-se a prever valores numéricos, normalmente contagens. Portanto, você deve usar esse componente para criar seu modelo de regressão somente se os valores que você está tentando prever ajustarem as seguintes condições:

  • A variável resposta tem uma distribuição de Poisson.

  • As contagens não podem ser negativas. O método falhará completamente se você tentar usá-lo com rótulos negativos.

  • Uma distribuição de Poisson é uma distribuição discreta; portanto, não é significativo usar este método com números não inteiros.

Gorjeta

Se o seu alvo não for uma contagem, a regressão de Poisson provavelmente não é um método apropriado. Experimente outros componentes de regressão no designer.

Depois de configurar o método de regressão, você deve treinar o modelo usando um conjunto de dados contendo exemplos do valor que você deseja prever. O modelo treinado pode então ser usado para fazer previsões.

Mais sobre a regressão de Poisson

A regressão de Poisson é um tipo especial de análise de regressão que normalmente é usado para modelar contagens. Por exemplo, a regressão de Poisson seria útil nestes cenários:

  • Modelação do número de constipações associadas a voos de avião

  • Estimar o número de chamadas de serviço de emergência durante um evento

  • Projeção do número de consultas de clientes após uma promoção

  • Criação de tabelas de contingência

Como a variável resposta tem uma distribuição de Poisson, o modelo faz suposições diferentes sobre os dados e sua distribuição de probabilidade do que, digamos, a regressão de mínimos quadrados. Portanto, os modelos de Poisson devem ser interpretados de forma diferente de outros modelos de regressão.

Como configurar a regressão de Poisson

  1. Adicione o componente Regressão de Poisson ao seu pipeline no designer. Você pode encontrar esse componente em Algoritmos de Aprendizado de Máquina, na categoria Regressão .

  2. Adicione um conjunto de dados que contenha dados de treinamento do tipo correto.

    Recomendamos que você use Normalize Data para normalizar o conjunto de dados de entrada antes de usá-lo para treinar o regressor.

  3. No painel direito do componente Regressão de Poisson, especifique como deseja que o modelo seja treinado, definindo a opção Criar modo de treinador.

    • Parâmetro único: Se você souber como deseja configurar o modelo, forneça um conjunto específico de valores como argumentos.

    • Intervalo de parâmetros: Se você não tiver certeza dos melhores parâmetros, faça uma varredura de parâmetros usando o componente Tune Model Hyperparameters . O treinador itera sobre vários valores especificados para encontrar a configuração ideal.

  4. Tolerância de otimização: digite um valor que define o intervalo de tolerância durante a otimização. Quanto menor o valor, mais lento e preciso o encaixe.

  5. Peso de regularização L1 e peso de regularização L2: Valores de tipo a utilizar para regularização L1 e L2. A regularização adiciona restrições ao algoritmo em relação a aspetos do modelo que são independentes dos dados de treinamento. A regularização é comumente usada para evitar o overfitting.

    • A regularização L1 é útil se o objetivo é ter um modelo o mais esparso possível.

      A regularização L1 é feita subtraindo o peso L1 do vetor de peso da expressão de perda que o aluno está tentando minimizar. A norma L1 é uma boa aproximação à norma L0, que é o número de coordenadas diferentes de zero.

    • A regularização L2 evita que qualquer coordenada no vetor de peso cresça demais em magnitude. A regularização L2 é útil se o objetivo for ter um modelo com pesos totais pequenos.

    Neste componente, você pode aplicar uma combinação de regularizações L1 e L2. Ao combinar a regularização L1 e L2, você pode impor uma penalidade sobre a magnitude dos valores dos parâmetros. O/A aluno/a tenta minimizar a penalização, numa troca com a minimização da perda.

    Para uma boa discussão sobre regularização L1 e L2, consulte Regularização L1 e L2 para Machine Learning.

  6. Tamanho da memória para L-BFGS: especifique a quantidade de memória a ser reservada para ajuste e otimização do modelo.

    L-BFGS é um método específico para otimização, baseado no algoritmo Broyden–Fletcher–Goldfarb–Shanno (BFGS). O método usa uma quantidade limitada de memória (L) para calcular a próxima direção da etapa.

    Ao alterar esse parâmetro, você pode afetar o número de posições e gradientes passados armazenados para o cálculo da próxima etapa.

  7. Conecte o conjunto de dados de treinamento e o modelo não treinado a um dos componentes de treinamento:

    • Se você definir Criar modo de treinamento como Parâmetro único, use o componente Modelo de trem.

    • Se você definir Create trainer mode como Parameter Range, use o componente Tune Model Hyperparameters .

    Aviso

    • Se você passar um intervalo de parâmetros para Train Model, ele usará apenas o primeiro valor na lista de intervalos de parâmetros.

    • Se você passar um único conjunto de valores de parâmetro para o componente Tune Model Hyperparameters , quando ele espera um intervalo de configurações para cada parâmetro, ele ignora os valores e usa os valores padrão para o aluno.

    • Se você selecionar a opção Intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse único valor especificado será usado durante toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.

  8. Envie o pipeline.

Resultados

Após a conclusão da formação:

  • Para salvar um instantâneo do modelo treinado, selecione o componente de treinamento e alterne para a guia Saídas+logs no painel direito. Clique no ícone Registrar conjunto de dados. Você pode encontrar o modelo salvo como um componente na árvore de componentes.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.