Cómo dar formato a los datos para el Reconocimiento de entidades con nombre (NER)
Formas del conjunto de datos NER:
- Archivo de información de clave: el archivo de información de clave contiene una lista de entidades, que sirve como información clave para los datos de entrenamiento.
- Datos de entrenamiento: los datos de entrenamiento constan de un archivo (.txt, .tsv) que contiene columnas separadas por un tabulador. Una de las columnas es una columna de oración, mientras que las demás representan etiquetas para tokens dentro de la columna de oración.
Colaborar con nosotros en GitHub
El origen de este contenido se puede encontrar en GitHub, donde también puede crear y revisar problemas y solicitudes de incorporación de cambios. Para más información, consulte nuestra guía para colaboradores.