Criar um projeto de rotulagem de dados do Azure Machine Learning
Uma tarefa comum ao desenvolver um modelo de deteção de objeto personalizado é a necessidade de processar dados de imagem não rotulados para que possam ser convertidos em um conjunto de dados rotulado para fins de treinamento e validação do modelo. Os dados não rotulados geralmente apresentam várias amostras que refletem o tipo de dados que seriam capturados no local onde o modelo de deteção de objetos deve ser empregado. Esses dados podem incluir transformações sutis, por exemplo, a introdução de "ruído" nos dados de imagem para produzir um conjunto de treinamento mais robusto. As Ferramentas de Dados do Azure Machine Learning no estúdio do Azure Machine Learning permitem que as equipes gerenciem suas coleções de dados não rotulados em conjuntos de dados rotulados que acomodam as classes que seriam detetadas pelo modelo de deteção de objeto treinado.
Criar um projeto de rotulagem de dados do Azure Machine Learning
Se você ainda não iniciou o estúdio do Azure Machine Learning na Visão Geral do Machine Learning mencionada no final da seção anterior, entre no estúdio do Azure Machine Learning agora e selecione seu espaço de trabalho.
No painel esquerdo, localize a seção Gerenciar e selecione Rotulagem de dados.
Na tela resultante, selecione + Criar.
Na seção Detalhes do projeto, dê ao seu projeto um nome específico para a tarefa de deteção específica em questão, selecione Identificação de objeto (caixa delimitadora) no menu e, em seguida, selecione Avançar.
Na tela Adicionar força de trabalho (opcional), deixaremos a opção desativada e selecionaremos Avançar para continuar.
Quando solicitado a Selecionar ou criar conjunto de dados, escolha + Criar conjunto de dados e selecione a opção Do armazenamento de dados.
Dê ao seu novo conjunto de dados o nome exclusivo, por exemplo, sodaObjects que reflete as imagens capturadas em suporte à tarefa de deteção e selecione Next.
Em Seleção de armazenamento de dados, escolha o nome do armazenamento de dados que você adicionou anteriormente, que contém os dados de imagem não marcados. Aqui, você também pode fornecer um caminho curinga se desejar extrair apenas imagens de partições especificadas. Se você deseja puxar todas as imagens do contêiner, digite / como o caminho e selecione Next.
Confirme os detalhes sobre seu novo conjunto de dados e selecione Criar.
Escolha o conjunto de dados recém-criado e selecione Avançar.
Você será solicitado a Habilitar a atualização incremental em intervalos regulares. Esse recurso adicionará automaticamente imagens recém-capturadas ao seu projeto de rotulagem de dados. Habilite essa opção conforme mostrado e selecione Avançar.
No painel seguinte, adicione classes de rótulo para todos os objetos ou defeitos que deseja detetar - inclua classes positivas e negativas aqui.
Opcionalmente, você pode adicionar instruções de rotulagem na seção a seguir, deixaremos esta seção vazia e selecionaremos Avançar.
Opcionalmente, você pode usar a rotulagem assistida por ML, o que acelerará seu processo de rotulagem de dados, especialmente à medida que mais dados são capturados. Para este Módulo de Aprendizagem, não utilizaremos esta opção. Desative a opção conforme mostrado e selecione Criar projeto.