Compartilhar via


Como formatar dados para Named Entity Recognition (NER)

Formas do conjunto de dados NER:

  • Arquivo de informações chave: ele contém uma lista de entidades, que serve como informação chave para os dados de treinamento.
  • Dados de treinamento: os dados de treinamento consistem em um arquivo (.txt, .tsv) contendo colunas separadas por um caractere de tabulação. Uma das colunas é uma coluna de frase, enquanto as outras representam rótulos para tokens dentro da coluna de frase.