Partilhar via


Geração de dados sintéticos no Azure AI Studio

No Azure AI Studio, você pode usar a geração de dados sintéticos para produzir previsões para seus conjuntos de dados de forma eficiente. Este artigo apresenta o conceito de geração de dados sintéticos e como você pode usá-lo no aprendizado de máquina.

O que é a geração de dados sintéticos?

A geração de dados sintéticos envolve a criação de dados artificiais que imitam as propriedades estatísticas dos dados do mundo real. Estes dados são gerados através de algoritmos e técnicas de aprendizagem automática. Você pode usar os dados de várias maneiras, como simulações de computador ou modelagem de eventos do mundo real.

Benefícios

No aprendizado de máquina, os dados sintéticos são valiosos para:

  • Aumento de dados: ajuda na expansão do tamanho dos conjuntos de dados de treinamento, o que é crucial para o treinamento de modelos robustos de aprendizado de máquina. Esta técnica de expansão é especialmente útil quando os dados do mundo real são escassos ou caros de obter.

  • Teste e validação: Permite testes extensivos e validação de modelos de aprendizado de máquina em vários cenários, sem a necessidade de dados do mundo real.

Exemplo de caderno

Para ver como gerar dados sintéticos, você pode usar o bloco de anotações de exemplo.