Como formatar dados para Named Entity Recognition (NER)
Formas do conjunto de dados NER:
- Arquivo de informações chave: ele contém uma lista de entidades, que serve como informação chave para os dados de treinamento.
- Dados de treinamento: os dados de treinamento consistem em um arquivo (.txt, .tsv) contendo colunas separadas por um caractere de tabulação. Uma das colunas é uma coluna de frase, enquanto as outras representam rótulos para tokens dentro da coluna de frase.
Colaborar conosco no GitHub
A fonte deste conteúdo pode ser encontrada no GitHub, onde você também pode criar e revisar problemas e solicitações de pull. Para obter mais informações, confira o nosso guia para colaboradores.