Introdução

Concluído

Como cientista de dados, você gasta a maior parte do seu tempo treinando modelos de aprendizado de máquina para identificar padrões complexos em seus dados. Após o treinamento, você deseja usar os modelos para recuperar informações valiosas.

Por exemplo, depois de treinar um modelo em dados históricos de vendas, você pode gerar a previsão da próxima semana. Ou, usando dados de clientes, você treina um modelo para identificar clientes com probabilidade de rotatividade. Seja qual for o caso de uso que você tenha, depois de treinar o modelo, você deseja aplicar o modelo a um novo conjunto de dados para gerar previsões.

O Microsoft Fabric ajuda você a aplicar seu modelo depois de rastreá-lo com o MLflow.

Compreender o processo de ciência de dados

Um projeto de ciência de dados geralmente inclui as seguintes fases:

Diagram of sequential steps in the data science process.

  1. Defina o problema: Juntamente com usuários de negócios e analistas, decida o que o modelo deve prever e quando é bem-sucedido.
  2. Obter os dados: encontre fontes de dados e obtenha acesso armazenando seus dados em uma casa do lago.
  3. Preparar os dados: explore os dados lendo-os de uma casa do lago para um caderno. Limpe e transforme os dados com base nos requisitos do modelo.
  4. Treinar o modelo: escolha um algoritmo e valores de hiperparâmetros com base em tentativa e erro rastreando seus experimentos com MLflow.
  5. Gerar previsões: use a pontuação em lote do modelo para gerar as previsões solicitadas.

Neste módulo, você se concentra em como gerar previsões em lote. Para recuperar previsões de um modelo treinado, primeiro você precisa salvar o modelo no espaço de trabalho do Microsoft Fabric. Em seguida, você pode preparar seus novos dados e aplicar o modelo aos dados para gerar previsões em lote. Finalmente, você pode salvar as previsões no Microsoft Fabric para processamento posterior, como visualizar os dados em um relatório do Power BI.