如何设置命名实体识别 (NER) 数据的格式

NER 数据集形状:

  • 关键信息文件:关键信息文件包含实体的列表,这可充当用于训练数据的关键信息。
  • 训练数据:训练数据由一个文件(.txt、.tsv)组成,该文件中的列由制表符分隔。 这些列中的一列是句子列,而其他列则表示此句子列内标记的标签。