Często zadawane pytania dotyczące niestandardowego rozpoznawania nazwanych jednostek

Artykuł
11/21/2024

Znajdź odpowiedzi na często zadawane pytania dotyczące pojęć i scenariuszy związanych z niestandardowym NER w języku azure AI.

Jak mogę rozpocząć pracę z usługą?

Zobacz przewodnik Szybki start, aby szybko utworzyć pierwszy projekt, lub zobacz, jak tworzyć projekty, aby uzyskać bardziej szczegółowe informacje.

Jakie są ograniczenia usługi?

Aby uzyskać więcej informacji, zobacz artykuł dotyczący limitów usług.

Ile plików oznakowanych jest potrzebnych?

Ogólnie rzecz biorąc, zróżnicowane i reprezentatywne oznakowane dane prowadzą do lepszych wyników, biorąc pod uwagę, że tagowanie odbywa się dokładnie, spójnie i całkowicie. Nie ma ustawionej liczby otagowanych wystąpień, które sprawią, że każdy model będzie działać dobrze. Wydajność jest bardzo zależna od schematu i niejednoznaczności schematu. Niejednoznaczne typy jednostek wymagają większej liczby tagów. Wydajność zależy również od jakości tagowania. Zalecana liczba otagowanych wystąpień na jednostkę wynosi 50.

Trenowanie trwa długo, czy jest to oczekiwane?

Proces trenowania może zająć dużo czasu. Zgodnie z przybliżonym oszacowaniem oczekiwany czas trenowania plików o łącznej długości 12 800 000 znaków wynosi 6 godzin.

Jak mogę programowo skompilować mój model niestandardowy?

Uwaga

Obecnie można utworzyć model tylko przy użyciu interfejsu API REST lub programu Language Studio.

Interfejsy API REST umożliwiają tworzenie modeli niestandardowych . Postępuj zgodnie z tym przewodnikiem Szybki start , aby rozpocząć tworzenie projektu i tworzenie modelu za pomocą interfejsów API, aby zapoznać się z przykładami wywoływania interfejsu API tworzenia.

Gdy wszystko będzie gotowe do rozpoczęcia korzystania z modelu w celu przewidywania, możesz użyć interfejsu API REST lub biblioteki klienta.

Jaki jest zalecany proces ciągłej integracji/ciągłego wdrażania?

W tym samym projekcie można wytrenować wiele modeli w tym samym zestawie danych. Po pomyślnym wytrenowanym modelu możesz wyświetlić jego wydajność. Model można wdrożyć i przetestować w programie Language Studio. Możesz dodawać lub usuwać etykiety z danych oraz szkolić nowy model i testować go. Wyświetl limityusług, aby dowiedzieć się więcej o maksymalnej liczbie wytrenowanych modeli z tym samym projektem. Podczas trenowania modelu można określić, w jaki sposób zestaw danych jest podzielony na zestawy trenowania i testowania. Możesz również podzielić dane losowo na zestaw treningowy i testowy, w którym nie ma żadnej gwarancji, że odzwierciedlona ocena modelu dotyczy tego samego zestawu testów, a wyniki nie są porównywalne. Zaleca się opracowanie własnego zestawu testów i użycie go do oceny obu modeli, aby można było zmierzyć poprawę.

Czy niski lub wysoki wynik modelu gwarantuje niską lub dobrą wydajność w środowisku produkcyjnym?

Ocena modelu może nie zawsze być kompleksowa. Zależy to od:

Jeśli zestaw testów jest zbyt mały, więc dobre/złe wyniki nie są reprezentatywne dla rzeczywistej wydajności modelu. Ponadto jeśli w zestawie testowym brakuje określonego typu jednostki lub jest on niedostatecznie reprezentowany, wpłynie to na wydajność modelu.
Różnorodność danych, jeśli dane obejmują tylko kilka scenariuszy/przykładów tekstu oczekiwanego w środowisku produkcyjnym, model nie będzie narażony na wszystkie możliwe scenariusze i może działać słabo w scenariuszach, na których nie został wytrenowany.
Reprezentacja danych, jeśli zestaw danych używany do trenowania modelu nie jest reprezentatywny dla danych, które zostaną wprowadzone do modelu w środowisku produkcyjnym, znacznie wpłynie to na wydajność modelu.

Aby uzyskać więcej informacji, zobacz artykuł dotyczący wyboru danych i projektowania schematu.

Jak mogę poprawić wydajność modelu?

Wyświetl macierz pomyłek modelu. Jeśli zauważysz, że określony typ jednostki jest często niepoprawnie przewidywany, rozważ dodanie kolejnych otagowanych wystąpień dla tej klasy. Jeśli zauważysz, że dwa typy jednostek są często przewidywane jako siebie, oznacza to, że schemat jest niejednoznaczny i należy rozważyć scalenie obu typów z jednym typem jednostki w celu uzyskania lepszej wydajności.
Przejrzyj przewidywania zestawu testów. Jeśli jeden z typów jednostek ma o wiele więcej otagowanych wystąpień niż inne, model może być stronniczy wobec tego typu. Dodaj więcej danych do innych typów jednostek lub usuń przykłady z dominującego typu.
Dowiedz się więcej na temat wyboru danych i projektowania schematów.
Przejrzyj zestaw testów, aby zobaczyć przewidywane i oznakowane jednostki obok siebie, aby lepiej zrozumieć wydajność modelu i zdecydować, czy są konieczne jakieś zmiany w schemacie lub tagach.

Dlaczego otrzymuję różne wyniki podczas ponownego trenowania modelu?

Podczas trenowania modelu możesz określić, czy dane mają być podzielone losowo na zestawy trenowania i testowania. W takim przypadku nie ma gwarancji, że odzwierciedlona ocena modelu znajduje się na tym samym zestawie testowym, więc wyniki nie są porównywalne.
Jeśli ponownie wytrenujesz ten sam model, zestaw testów będzie taki sam, ale może zauważyć niewielkie zmiany w przewidywaniach dokonanych przez model. Wynika to z faktu, że wytrenowany model nie jest wystarczająco niezawodny i jest to czynnik, w jaki sposób reprezentatywne i odrębne dane są oraz jakość oznakowanych danych.

Jak mogę uzyskać przewidywania w różnych językach?

Najpierw należy włączyć opcję wielojęzyczną podczas tworzenia projektu lub włączyć ją później na stronie ustawień projektu. Po wytrenowaniu i wdrożeniu modelu możesz rozpocząć wykonywanie zapytań względem niego w wielu językach. Możesz uzyskać różne wyniki dla różnych języków. Aby poprawić dokładność dowolnego języka, dodaj więcej otagowanych wystąpień do projektu w tym języku, aby wprowadzić wytrenowany model do większej składni tego języka.

Trenowałem model, ale nie mogę go przetestować

Zanim będzie można go przetestować, musisz wdrożyć model .

Jak mogę używać mojego wytrenowanego modelu do prognoz?

Po wdrożeniu modelu wywołasz interfejs API przewidywania przy użyciu interfejsu API REST lub bibliotek klienckich.

Prywatność i zabezpieczenia danych

Custom NER to podmiot przetwarzający dane do celów ogólnego rozporządzenia o ochronie danych (RODO). Zgodnie z zasadami RODO użytkownicy niestandardowych jednostek NER mają pełną kontrolę nad wyświetlaniem, eksportowaniem lub usuwaniem zawartości użytkownika za pośrednictwem programu Language Studio lub programowo przy użyciu interfejsów API REST.

Dane są przechowywane tylko na koncie usługi Azure Storage. Niestandardowy moduł NER ma dostęp tylko do odczytu z niego podczas trenowania.

Jak sklonować mój projekt?

Aby sklonować projekt, musisz użyć interfejsu API eksportu do wyeksportowania zasobów projektu, a następnie zaimportować je do nowego projektu. Zobacz dokumentację interfejsu API REST dla obu operacji.

Udostępnij za pośrednictwem