Udostępnij za pośrednictwem


Zwiększanie wydajności modelu klasyfikacji kategorii

Jeśli wydajność modelu nie jest zgodna z Twoimi oczekiwaniami, możesz wypróbować kilka rzeczy. Te porady mogą pomóc w ulepszeniu modelu w celu poprawy jego mocy predykcyjnej.

Dodaj więcej danych szkoleniowych poprawnie oznaczonych etykietami

Im dokładniej opisane dane szkoleniowe, tym lepiej model będzie wykonywany. Załóżmy, że korzystasz z etykiety Tak/Nie. Jeśli większość danych ma tylko Tak w tej kolumnie, model AI prawdopodobnie nie nauczy się wiele na podstawie tych danych. Jeśli dane użytkownika nie są oznaczone etykietami, model prawdopodobnie nie będzie się zbyt dobrze szkolił. Idealnie jest rozpocząć pracę z niewielkim zestawem poprawnie oznaczonych przykładów - może 100 lub mniej. Stamtąd możesz nadal podwoić liczbę przykładów i powtarzać szkolenie za każdym razem, zauważając zmianę wydajności. Mówiąc ogólnie, im więcej danych, tym lepiej, ale korzyści są coraz mniejsze z dodawania danych w miarę powiększania zestawu danych.

Więcej porad

  • Upewnij się, że w Twoich danych szkoleniowych tagi są używane w sposób zrównoważony. Na przykład: dla 100 elementów tekstowych zdefiniowano cztery tagi. Dwa pierwsze tagi (tag1 i tag2) są używane dla 90 elementów tekstowych, ale pozostałe dwa (tag3 i tag4) są używane tylko dla pozostałych 10 elementach tekstowych. Brak równowagi może powodować, że model ma problemy z prawidłowym przewidywaniem w przypadku tag3 lub tag4.
  • Należy się upewnić, że dany model jest przeszkolny przy użyciu danych podobnych do oczekiwanych na potrzeby korzystania z modelu.

Następny krok

Publikowanie modelu klasyfikacji kategorii

Wstępnie utworzony model klasyfikacji kategorii