Dostosowywanie modelu językowego za pomocą usługi Azure AI Video Indexer
Usługa Azure AI Video Indexer obsługuje automatyczne rozpoznawanie mowy dzięki integracji z usługą Microsoft Custom Speech Service. Model językowy można dostosować, przekazując tekst adaptacji. Ten tekst pochodzi z domeny, której słownictwo ma być używane przez aparat do adaptacji. Po wytrenowaniu modelu nowe wyrazy pojawiające się w tekście adaptacji są rozpoznawane, przy założeniu domyślnej wymowy, a model językowy uczy się nowych prawdopodobnych sekwencji słów. Zobacz listę obsługiwanych języków usługi Azure AI Video Indexer w obsługiwanych językach.
Na przykład "Kubernetes" (w kontekście usługi Azure Kubernetes) to słowo, które jest bardzo specyficzne. Ponieważ słowo jest nowe w usłudze Azure AI Video Indexer, jest uznawane za "społeczności". Wytrenuj model, aby rozpoznał go jako "Kubernetes". W innych przypadkach słowa istnieją, ale model językowy nie oczekuje ich pojawienia się w określonym kontekście. Na przykład "usługa kontenera" nie jest sekwencją 2-wyrazową, którą niespecjalizowany model językowy rozpoznałby jako określony zestaw wyrazów.
Istnieją dwa sposoby dostosowywania modelu językowego:
- Opcja 1. Edytowanie transkrypcji wygenerowanej przez usługę Azure AI Video Indexer. Edytując i poprawiając transkrypcję, trenujesz model językowy, aby zapewnić lepsze wyniki w przyszłości.
- Opcja 2. Przekazywanie plików tekstowych w celu wytrenowania modelu językowego. Plik może zawierać listę wyrazów, tak jak chcesz, aby były wyświetlane w transkrypcji usługi Video Indexer lub odpowiednie wyrazy zawarte naturalnie w zdaniach i akapitach. W miarę jak lepsze wyniki są osiągane przy użyciu drugiego podejścia, zaleca się, aby plik przekazywania zawierał pełne zdania lub akapity związane z zawartością.
Ważne
Nie dołączaj wyrazów ani zdań jako aktualnie niepoprawnie transkrypcji (na przykład "społeczności" w pliku przekazywania, ponieważ spowoduje to negację zamierzonego wpływu. Dołącz tylko wyrazy tak, jak chcesz, aby były wyświetlane (na przykład "Kubernetes").
Optymalizowanie niestandardowego modelu językowego
Usługa Azure AI Video Indexer uczy się na podstawie prawdopodobieństwa kombinacji słów, aby dowiedzieć się najlepiej:
- Podaj wystarczająco dużo rzeczywistych przykładów zdań, jak by były wypowiadane.
- Umieść tylko jedno zdanie na wiersz, a nie więcej. W przeciwnym razie system nauczy się prawdopodobieństwa w zdaniach.
- Dobrze jest umieścić jedno słowo jako zdanie, aby zwiększyć słowo przeciwko innym, ale system uczy się najlepiej z pełnych zdań.
- W przypadku wprowadzania nowych słów lub akronimów, jeśli to możliwe, podaj jak najwięcej przykładów użycia w pełnym zdaniu, aby dać jak najwięcej kontekstu systemowi.
- Spróbuj umieścić kilka opcji adaptacji i zobaczyć, jak działają dla Ciebie.
- Unikaj wielokrotnego powtarzania tego samego zdania. Może to spowodować stronniczość względem reszty danych wejściowych.
- Unikaj dołączania nietypowych symboli (~, # @ % &), ponieważ zostaną one odrzucone. Zdania, w których się pojawią, również zostaną odrzucone.
- Unikaj umieszczania zbyt dużych danych wejściowych, takich jak setki tysięcy zdań, ponieważ spowoduje to rozcieńczenie efektu zwiększenia.
Wymagania wstępne
- Konto platformy Azure
- Konto usługi Azure AI Video Indexer
Tworzenie modelu językowego
- Przejdź do witryny internetowej usługi Azure AI Video Indexer i zaloguj się.
- Aby dostosować model na koncie, wybierz przycisk Dostosowywanie Con tryb namiotu l po lewej stronie.
- Wybierz kartę Język . Zostanie wyświetlona lista obsługiwanych języków.
- W obszarze wybranego języka wybierz pozycję Dodaj model.
- Wpisz nazwę modelu językowego i naciśnij Enter. Ten krok umożliwia utworzenie modelu i przekazanie plików tekstowych do modelu.
- Aby dodać plik tekstowy, wybierz pozycję Dodaj plik. Zostanie otwarty Eksplorator plików.
- Przejdź do pliku tekstowego i wybierz go. Do modelu językowego można dodać wiele plików tekstowych. Możesz również dodać plik tekstowy, wybierając przycisk ... po prawej stronie modelu językowego i wybierając pozycję Dodaj plik.
- Po zakończeniu przekazywania plików tekstowych wybierz zieloną opcję Train (Trenowanie ).
Proces trenowania może potrwać kilka minut. Po zakończeniu trenowania obok modelu pojawi się wytrenowany . Możesz wyświetlić podgląd, pobrać i usunąć plik z modelu.
Korzystanie z modelu językowego w nowym filmie wideo
Aby użyć modelu językowego w nowym filmie wideo, wykonaj jedną z następujących czynności:
- Wybierz przycisk Przekaż w górnej części strony.
- Upuść plik audio lub wideo lub wyszukaj plik.
- Wybierz model językowy utworzony z listy rozwijanej Język źródłowy wideo.
- Wybierz opcję Przekaż w dolnej części strony, a nowy film wideo zostanie zindeksowany przy użyciu modelu językowego.
Ponowne indeksowanie przy użyciu modelu językowego
- Zaloguj się do strony głównej usługi Azure AI Video Indexer .
- Kliknij przycisk ... na filmie wideo i wybierz pozycję Ponownie zaindeksuj.
- Wybierz listę rozwijaną Język źródłowy wideo i wybierz model językowy utworzony z listy.
- Wybierz przycisk Ponownie indeksu, a film wideo zostanie ponownie zindeksowany przy użyciu modelu językowego.
Edytowanie modelu językowego
Model językowy można edytować, zmieniając jego nazwę, dodając do niego pliki i usuwając z niego pliki. Jeśli dodasz lub usuniesz pliki z modelu językowego, musisz ponownie wytrenować model, wybierając zieloną opcję Trenowanie .
Zmienianie nazwy modelu językowego
Nazwę modelu językowego można zmienić, wybierając przycisk wielokropka (...) po prawej stronie modelu językowego i wybierając pozycję Zmień nazwę. Wprowadź nową nazwę.
Dodaj pliki
- Wybierz pozycję Dodaj plik. Zostanie otwarty Eksplorator plików.
- Przejdź do pliku tekstowego i wybierz go. Do modelu językowego można dodać wiele plików tekstowych.
Możesz również dodać plik tekstowy, wybierając przycisk wielokropka (...) po prawej stronie modelu językowego i wybierając pozycję Dodaj plik.
Usuń pliki
Ta akcja powoduje całkowite usunięcie pliku z modelu językowego.
- Wybierz przycisk wielokropka (...) po prawej stronie pliku tekstowego.
- Wybierz Usuń. Zostanie wyświetlone nowe okno z informacją, że usunięcie nie może zostać cofnięte.
- Wybierz opcję Usuń w nowym oknie.
Usuwanie modelu językowego
Ta akcja powoduje całkowite usunięcie modelu językowego z konta. Wszystkie klipy wideo, które używały modelu deletedlLanguage, zachowają ten sam indeks do momentu ponownego indeksowania wideo. Jeśli ponownie zaindeksujesz wideo, możesz przypisać nowy model językowy do wideo. W przeciwnym razie usługa Azure AI Video Indexer użyje domyślnego modelu do ponownego indeksowania wideo.
- Wybierz przycisk wielokropka (...) po prawej stronie modelu językowego.
- Wybierz Usuń. Zostanie wyświetlone nowe okno z informacją, że usunięcie nie może zostać cofnięte.
- Wybierz opcję Usuń w nowym oknie.
Dostosowywanie modeli językowych przez poprawianie transkrypcji
Usługa Azure AI Video Indexer dostosowuje modele językowe na podstawie rzeczywistych poprawek, które użytkownicy wykonują do transkrypcji swoich filmów wideo. Przechwytuje wszystkie wiersze poprawione w transkrypcji wideo i dodaje je do pliku tekstowego o nazwie From transcript edits
. Te zmiany są używane do ponownego trenowania modelu językowego, który został użyty do indeksowania wideo.
Uwzględniane są również edycje, które zostały wykonane na osi czasu widżetu.
Jeśli podczas indeksowania tego wideo nie określono modelu językowego, wszystkie edycje tego filmu wideo są przechowywane w domyślnym modelu językowym nazywanym Account adaptations
wykrytym językiem wideo.
Jeśli wiele edycji zostało wykonanych w tym samym wierszu, do aktualizowania modelu językowego jest używana tylko ostatnia wersja poprawionego wiersza.
Uwaga
Do dostosowywania są używane tylko poprawki tekstowe. Poprawki, które nie obejmują rzeczywistych wyrazów (na przykład znaków interpunkcyjnych lub spacji), nie są uwzględniane.
- Wybierz wideo, które chcesz edytować z biblioteki.
- Wybierz kartę Oś czasu .
- Wybierz ikonę ołówka, aby edytować transkrypcję transkrypcji.
- Na karcie Język na stronie dostosowywania Con tryb namiotu l zostaną wyświetlone poprawki transkrypcji. Aby wyświetlić plik "Od edycji transkrypcji" dla każdego z modeli językowych, wybierz go, aby go otworzyć.