Jak sformatować dane dla rozpoznawania jednostek nazwanych (NER)
Kształty zestawu danych NER:
- Plik kluczowych informacji: Plik informacji o kluczu zawiera listę jednostek, które służą jako kluczowe informacje dotyczące danych szkoleniowych.
- Dane treningowe: dane treningowe składają się z pliku (.txt, tsv) zawierającego kolumny oddzielone znakiem tabulacji. Jedną z kolumn jest kolumna zdania, a pozostałe reprezentują etykiety tokenów w kolumnie zdania.
Współpracuj z nami w serwisie GitHub
Źródło tej zawartości można znaleźć w witrynie GitHub, gdzie można również tworzyć i przeglądać problemy i żądania ściągnięcia. Więcej informacji znajdziesz w naszym przewodniku dla współtwórców.