Entender como o modelo será consumido
Imagine que você é um cientista de dados que treina modelos de machine learning. Normalmente você segue seis etapas para planejar, treinar, implantar e monitorar o modelo:
- Definir o problema: decida o que o modelo deve prever e quando ele será bem-sucedido.
- Obter os dados: localize as fontes de dados e obtenha acesso.
- Preparar os dados: explore os dados. Limpe e transforme os dados com base nos requisitos do modelo.
- Treinar o modelo: escolha um algoritmo e valores de hiperparâmetros com base em tentativa e erro.
- Integrar o modelo: implante o modelo em um ponto de extremidade para gerar as previsões.
- Monitorar o modelo: acompanhe o desempenho do modelo.
Observação
O diagrama é uma representação simplificada do processo de aprendizado de máquina. Normalmente o processo é iterativo e contínuo. Por exemplo, ao monitorar o modelo, você pode decidir voltar e novamente treinar esse modelo.
Você deve planejar como integrar o modelo, o já que isso pode afetar a forma como você treina o modelo ou quais dados de treinamento que você usa. Para integrar o modelo, você precisa implantar o modelo em um ponto de extremidade. Você pode implantar um modelo em um ponto de extremidade para previsões em tempo real ou em lote.
Implantar um modelo em um ponto de extremidade
Ao treinar um modelo, a meta geralmente é integrar o modelo a um aplicativo.
Para facilitar a integração de um modelo a um aplicativo, você pode usar pontos de extremidade. Simplificando, um ponto de extremidade pode ser um endereço web que um aplicativo pode chamar para receber uma mensagem de volta.
Com o Azure Machine Learning, você pode implantar seu modelo em um ponto de extremidade. Em seguida, você pode integrar o ponto de extremidade ao seu aplicativo e chamar o modelo para obter no aplicativo as previsões que você deseja visualizar.
Ao implantar um modelo em um ponto de extremidade, você tem duas opções:
- Obter previsões em tempo real
- Obter previsões em lote
Obter previsões em tempo real
Se você quiser que o modelo pontue os novos dados conforme forem fornecidos, você precisará de previsões em tempo real.
Previsões em tempo real geralmente são necessárias quando um modelo é usado por um aplicativo, como um aplicativo móvel ou um site.
Imagine que o seu site contém o seu catálogo de produtos:
- Um cliente seleciona um produto em seu site, como uma camisa.
- Com base na seleção do cliente, o modelo imediatamente recomenda outros itens do catálogo de produtos. O site exibe as recomendações do modelo.
O cliente pode selecionar um produto na loja online a qualquer momento. Você deseja que o modelo encontre as recomendações quase imediatamente. O tempo que a página precisa para carregar e exibir os detalhes da camisa é o tempo necessário para obter as recomendações ou previsões. Em seguida, quando a camisa é exibida, as recomendações também podem ser exibidas.
Obter previsões em lote
Se você quiser que o modelo marque novos dados em lotes e salve os resultados como um arquivo ou em um banco de dados, precisará das previsões em lote.
Por exemplo, você pode treinar um modelo que prevê as vendas de suco de laranja para cada semana futura. Com a previsão das vendas de suco de laranja, você pode garantir que a oferta seja suficiente para atender à demanda esperada.
Imagine que você está visualizando todos os dados de históricos de vendas em um relatório. Você desejará incluir as previsões de vendas no mesmo relatório.
Embora o suco de laranja seja vendido ao longo do dia, você quer calcular a previsão somente uma vez por semana. Você pode coletar os dados de vendas ao longo da semana e chamar o modelo somente quando tiver os dados de vendas de uma semana inteira. Uma coleção de pontos de dados é conhecida como lote.