Udostępnij za pośrednictwem


Jak sformatować dane dla rozpoznawania jednostek nazwanych (NER)

Kształty zestawu danych NER:

  • Plik kluczowych informacji: Plik informacji o kluczu zawiera listę jednostek, które służą jako kluczowe informacje dotyczące danych szkoleniowych.
  • Dane treningowe: dane treningowe składają się z pliku (.txt, tsv) zawierającego kolumny oddzielone znakiem tabulacji. Jedną z kolumn jest kolumna zdania, a pozostałe reprezentują etykiety tokenów w kolumnie zdania.