Criar um projeto de rotulagem de dados do Azure Machine Learning

Concluído

Uma tarefa comum ao desenvolver um modelo de deteção de objeto personalizado é a necessidade de processar dados de imagem não rotulados para que possam ser convertidos em um conjunto de dados rotulado para fins de treinamento e validação do modelo. Os dados não rotulados geralmente apresentam várias amostras que refletem o tipo de dados que seriam capturados no local onde o modelo de deteção de objetos deve ser empregado. Esses dados podem incluir transformações sutis, por exemplo, a introdução de "ruído" nos dados de imagem para produzir um conjunto de treinamento mais robusto. As Ferramentas de Dados do Azure Machine Learning no estúdio do Azure Machine Learning permitem que as equipes gerenciem suas coleções de dados não rotulados em conjuntos de dados rotulados que acomodam as classes que seriam detetadas pelo modelo de deteção de objeto treinado.

Criar um projeto de rotulagem de dados do Azure Machine Learning

  1. Se você ainda não iniciou o estúdio do Azure Machine Learning na Visão Geral do Machine Learning mencionada no final da seção anterior, entre no estúdio do Azure Machine Learning agora e selecione seu espaço de trabalho.

  2. No painel esquerdo, localize a seção Gerenciar e selecione Rotulagem de dados.

    Uma captura de tela mostrando a opção Rotulagem de dados é realçada.

  3. Na tela resultante, selecione + Criar.

    Uma captura de tela mostrando a opção + Criar é realçada.

  4. Na seção Detalhes do projeto, dê ao seu projeto um nome específico para a tarefa de deteção específica em questão, selecione Identificação de objeto (caixa delimitadora) no menu e, em seguida, selecione Avançar.

    Uma captura de tela mostrando as opções de Detalhes do projeto.

  5. Na tela Adicionar força de trabalho (opcional), deixaremos a opção desativada e selecionaremos Avançar para continuar.

    Uma captura de tela mostrando que Adicionar força de trabalho está desabilitada.

  6. Quando solicitado a Selecionar ou criar conjunto de dados, escolha + Criar conjunto de dados e selecione a opção Do armazenamento de dados.

    Uma captura de tela mostrando a opção do armazenamento de dados é realçada.

  7. Dê ao seu novo conjunto de dados o nome exclusivo, por exemplo, sodaObjects que reflete as imagens capturadas em suporte à tarefa de deteção e selecione Next.

    Uma captura de tela mostrando a seção de informações básicas do prompt de criação do armazenamento de dados é mostrada.

  8. Em Seleção de armazenamento de dados, escolha o nome do armazenamento de dados que você adicionou anteriormente, que contém os dados de imagem não marcados. Aqui, você também pode fornecer um caminho curinga se desejar extrair apenas imagens de partições especificadas. Se você deseja puxar todas as imagens do contêiner, digite / como o caminho e selecione Next.

    Uma captura de tela mostrando as opções de seleção do Datastore.

  9. Confirme os detalhes sobre seu novo conjunto de dados e selecione Criar.

    Uma captura de tela mostrando a seção confirmar detalhes.

  10. Escolha o conjunto de dados recém-criado e selecione Avançar.

    Uma captura de tela mostrando o conjunto de dados recém-criado foi escolhida.

  11. Você será solicitado a Habilitar a atualização incremental em intervalos regulares. Esse recurso adicionará automaticamente imagens recém-capturadas ao seu projeto de rotulagem de dados. Habilite essa opção conforme mostrado e selecione Avançar.

    Uma captura de tela mostrando a opção de atualização incremental está habilitada.

  12. No painel seguinte, adicione classes de rótulo para todos os objetos ou defeitos que deseja detetar - inclua classes positivas e negativas aqui.

    Uma captura de tela mostrando a lista de classes de rótulo.

  13. Opcionalmente, você pode adicionar instruções de rotulagem na seção a seguir, deixaremos esta seção vazia e selecionaremos Avançar.

    Uma captura de tela mostrando as opções de instruções de rotulagem.

  14. Opcionalmente, você pode usar a rotulagem assistida por ML, o que acelerará seu processo de rotulagem de dados, especialmente à medida que mais dados são capturados. Para este Módulo de Aprendizagem, não utilizaremos esta opção. Desative a opção conforme mostrado e selecione Criar projeto.

    Uma captura de tela mostrando a opção de rotulagem assistida ml como desativada.