Mise en forme des données pour la reconnaissance d’entité nommée (NER)
Formes de jeu de données NER :
- Fichier d’informations clés : le fichier d’information clé contient une liste d’entités, qui sert d’informations clés pour les données de formation.
- Données de formation : les données de formation se composent d’un fichier (.txt, .tsv) contenant des colonnes séparées par un caractère de tabulation. L’une de ces colonnes est une colonne de phrase, tandis que les autres représentent des étiquettes pour les jetons de la colonne de phrases.
Collaborer avec nous sur GitHub
La source de ce contenu se trouve sur GitHub, où vous pouvez également créer et examiner les problèmes et les demandes de tirage. Pour plus d’informations, consultez notre guide du contributeur.