Compartilhar via


Rotular dados de texto para treinar seu modelo para a Análise de sentimentos personalizada

Antes de treinar o modelo, é necessário rotular os documentos com os sentimentos que você deseja categorizar. Esses dados serão usados na próxima etapa ao treinar seu modelo para que o modelo possa aprender com os dados rotulados. Se já tiver dados rotulados, você poderá importá-los diretamente para o seu projeto. Certifique-se de que seus dados sigam o formato de dados aceito.

Antes de criar um modelo personalizado de análise de sentimentos, é necessário ter dados rotulados. Se os dados ainda não estão rotulados, você pode rotulá-los no Language Studio. Os dados rotulados informam ao modelo como interpretar o texto e são usados para treinamento e avaliação.

Pré-requisitos

Antes de rotular dados, você precisa:

Confira o ciclo de vida de desenvolvimento de projetos para obter mais informações.

Diretrizes de rotulagem de dados

Depois de preparar seus dados e criar seu projeto, você precisará rotular seus dados. Rotular seus dados é importante para que seu modelo saiba quais documentos serão associados aos sentimentos de que você precisa. Quando seus dados são rotulados no Language Studio (ou os dados rotulados são importados), esses rótulos serão armazenados no arquivo JSON no contêiner de armazenamento que você conectou a este projeto.

Ao rotular seus dados, tenha em mente:

  • Em geral, mais dados rotulados levam a melhores resultados, desde que os dados sejam rotulados com precisão.

  • Não há um número fixo de rótulos que possa garantir que seu modelo terá o melhor desempenho. Desempenho do modelo em relação à possível ambiguidade em seus dados e à qualidade de seus dados rotulados.

Rotular seus dados.

Use as etapas a seguir para rotular seus dados:

  1. Acesse a página do projeto no Language Studio.

  2. No menu do lado esquerdo, selecione Rotulagem de dados. Você pode encontrar uma lista de todos os documentos no contêiner de armazenamento.

    Dica

    Você pode usar os filtros no menu superior para exibir os arquivos sem rótulo para que você possa começar a rotulá-los. Você também pode utilizar os filtros para exibir os documentos que são rotulados com um sentimento específico.

  3. Altere para uma única exibição de arquivo do lado esquerdo no menu superior ou selecione um arquivo específico para iniciar a rotulagem. Você pode encontrar uma lista de todos os .txt arquivos disponíveis em seus projetos à esquerda. Você pode usar o botão Voltar e Avançar na parte inferior da página para navegar pelos documentos.

    Observação

    Se você habilitar vários idiomas para seu projeto, encontrará um menu suspenso Idioma no menu superior, que permite selecionar o idioma de cada documento.

  4. No painel do lado direito, você pode adicionar sentimentos ao seu projeto para começar a rotular seus dados com eles.

  5. No painel do lado direito, sob o pivô Rótulos, você pode encontrar todos os sentimentos em seu projeto e a contagem de instâncias rotuladas para cada um.

  6. Na seção inferior do painel direito, você pode adicionar o arquivo atual que você está exibindo ao conjunto de treinamento ou ao conjunto de testes. Por padrão, todos os documentos são adicionados ao seu conjunto de treinamento. Saiba mais sobre os conjuntos de treinamento e teste e como eles são usados para treinamento e avaliação de modelos.

    Dica

    Se estiver planejando usar a divisão de dados Automático, use a opção padrão para atribuir todos os documentos ao conjunto de treinamento.

  7. Na dinamização Distribuição, você pode exibir a distribuição de seus documentos rotulados em conjuntos de treinamento e de teste. Você tem duas opções para a exibição:

    • Total de instâncias em que você pode exibir a contagem de todas as instâncias rotuladas de um sentimento específico.
    • Documentos com pelo menos um rótulo, em que cada documento é contado se contiver pelo menos uma instância rotulada desse sentimento.
  8. Ao rotular, suas alterações serão sincronizadas periodicamente, se elas ainda não foram salvas, você encontrará um aviso na parte superior da página. Se você quiser salvar manualmente, clique no botão Salvar rótulos na parte inferior da página.

Próximas etapas

Depois de ter rotulado seus dados, você pode começar a treinar um modelo que aprenderá com base em seus dados.