Przewodnik konfiguracji indeksowania

Artykuł
11/04/2024

Możesz użyć domyślnych ustawień indeksowania lub dostosować je. Możesz wybrać język, indeksowanie, niestandardowe modele i ustawienia przesyłania strumieniowego, które mają wpływ na wygenerowane, koszt i wydajność szczegółowych informacji.

W tym artykule opisano każdą z opcji. Te same opcje mają zastosowanie w przypadku korzystania z witryny internetowej usługi Azure AI Video Indexer co do korzystania z interfejsu API (zobacz przewodnik po interfejsie API). Podczas indeksowania dużych woluminów postępuj zgodnie z przewodnikiem dotyczącym skalowania.

Ustawienia domyślne

Domyślnie usługa Azure AI Video Indexer jest skonfigurowana jako:

Język źródłowy: angielski
Prywatność: prywatna
Ustawienie audio i wideo: standardowe
Jakość przesyłania strumieniowego: pojedyncza szybkość transmisji bitów

Język źródłowy wideo

Jeśli znasz język używany w filmie wideo, wybierz język z listy języków źródłowych wideo. Jeśli nie masz pewności co do języka filmu wideo, wybierz pozycję Automatycznie wykrywaj pojedynczy język. Usługa Azure AI Video Indexer używa identyfikacji języka (LID) do wykrywania języka wideo i generowania transkrypcji i szczegółowych informacji za pomocą wykrytego języka.

Jeśli wideo zawiera wiele języków i nie masz pewności, które z nich są dostępne, wybierz pozycję Automatycznie wykrywaj wiele języków. W takim przypadku wykrywanie wielu języków (MLID) jest stosowane podczas przekazywania i indeksowania wideo.

Chociaż autowykrywanie jest doskonałym rozwiązaniem, gdy język w filmach wideo różni się, podczas korzystania z LID lub MLID należy wziąć pod uwagę dwa punkty:

LID/MLID nie obsługują wszystkich języków obsługiwanych przez usługę Azure AI Video Indexer.
Transkrypcja jest wyższą jakością podczas wstępnego wybierania odpowiedniego języka wideo.

Dowiedz się więcej o obsłudze języków i obsługiwanych językach.

Prywatność

Ta opcja umożliwia określenie, czy szczegółowe informacje powinny być dostępne tylko dla użytkowników na koncie usługi Azure AI Video Indexer, czy też dla każdej osoby z linkiem.

Opcje indeksowania

Każda z opcji indeksowania audio i wideo może być wyceniona inaczej w przypadku korzystania z domyślnych ustawień indeksowania. Aby uzyskać szczegółowe informacje, zobacz Cennik usługi Azure AI Video Indexer.

Poniżej przedstawiono opcje typu indeksowania ze szczegółowymi informacjami. Aby zmodyfikować typ indeksowania, wybierz pozycję Ustawienia zaawansowane.

Uwaga

Optyczne rozpoznawanie znaków (OCR) jest używane z kilkoma typami szczegółowych informacji.

Ustawienia zaawansowane

Tylko dźwięk

Podstawowe: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu tylko audio (ignorowanie wideo) i zapewnia następujące szczegółowe informacje: transkrypcja, tłumaczenie, formatowanie podpisów wyjściowych i napisów (napisy zamknięte).
Standardowa: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu tylko audio (ignorowanie wideo) i udostępniają następujące szczegółowe informacje: transkrypcja, tłumaczenie, formatowanie podpisów wyjściowych i napisów (napisów), automatyczne wykrywanie języka, emocje, słowa kluczowe, nazwane jednostki (marki, lokalizacje, osoby), tonacje, prelegenci, wyodrębnianie tematów i konwersja tekstowa tryb namiotu ration.
Zaawansowane: indeksy i wyodrębnianie szczegółowych informacji przy użyciu tylko dźwięku (ignorowanie wideo) i udostępniają następujące szczegółowe informacje: transkrypcja, tłumaczenie, formatowanie podpisów wyjściowych i napisów (napisów), automatyczne wykrywanie języka, wykrywanie zdarzeń audio, emocje, słowa kluczowe, nazwane jednostki (marki, lokalizacje, osoby), tonacje, prelegenci, wyodrębnianie tematów i konwersja tekstowa tryb namiotu ration.

Tylko wideo

Podstawowe: indeksy i wyodrębnianie szczegółowych informacji przy użyciu tylko wideo (ignorowanie dźwięku) i udostępniają następujące szczegółowe informacje: etykiety, wykrywanie obiektów, OCR, sceny (klatki kluczowe i zdjęcia) oraz wykrywanie czarnej ramki.
Standardowa: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu tylko wideo (ignorowanie dźwięku) i udostępniają następujące szczegółowe informacje: etykiety (OCR), nazwane jednostki (OCR — marki, lokalizacje, osoby), OCR, osoby, sceny (klatki kluczowe i zdjęcia), czarne ramki, con tryb namiotu ration i wyodrębnianie tematów (OCR).
Zaawansowane: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu tylko wideo (ignorowanie dźwięku) i zapewnia następujące szczegółowe informacje: etykiety (OCR), dopasowane osoby, nazwane jednostki (OCR — marki, lokalizacje, osoby), OCR, obserwowane osoby, osoby, sceny (klatki kluczowe i zdjęcia), wykrywanie tablicy clapper, wykrywanie wzorców cyfrowych, polecane szczegółowe informacje o ubraniach, wykrywanie bez tekstu łupków, wykrywanie logo tekstowego, czarne ramki, wizualne con tryb namiotu ration i wyodrębnianie tematów (OCR).

Dźwięk i wideo

Podstawowe: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu audio i wideo oraz zapewnia następujące szczegółowe informacje: transkrypcja, tłumaczenie, formatowanie podpisów wyjściowych i napisów (napisy zamknięte), wykrywanie obiektów, OCR, sceny (klatki kluczowe i zdjęcia) oraz czarne ramki.
Standardowa: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu audio i wideo oraz zapewnia następujące szczegółowe informacje: transkrypcja, tłumaczenie, formatowanie podpisów wyjściowych i napisów (napisy), automatyczne wykrywanie języka, emocje, słowa kluczowe, nazwane jednostki (marki, lokalizacje, osoby), OCR, sceny (klatki kluczowe i zdjęcia), czarne ramki, wizualizacja con tryb namiotu ration, ludzie, tonacje, prelegenci, wyodrębnianie tematów i tekstowy conual contryb namiotu ration.
Zaawansowane: Indeksy i wyodrębnianie szczegółowych informacji przy użyciu dźwięku i wideo oraz udostępniają następujące szczegółowe informacje: transkrypcja, tłumaczenie, formatowanie podpisów wyjściowych i napisów (napisy), automatyczne wykrywanie języka, con tryb namiotu ration, wykrywanie zdarzeń audio, emocje, słowa kluczowe, dopasowane osoby, nazwane jednostki (marki, lokalizacje, osoby), OCR, obserwowane osoby, wykrywanie tablicy klapper, wykrywanie wzorców cyfrowych, polecane ubrania szczegółowe informacje, wykrywanie bez tekstu łupków, tonacje, głośniki, sceny (klatki kluczowe i zdjęcia), wykrywanie logo tekstowego, czarne ramki, kon tryb namiotu ration wizualizacji i wyodrębnianie tematów.

Opcje jakości przesyłania strumieniowego

Istnieją dwie opcje przesyłania strumieniowego indeksowanych wideo:

Pojedyncza szybkość transmisji bitów: jeśli wysokość wideo jest większa lub równa 720p HD, usługa Azure AI Video Indexer koduje ją z rozdzielczością 1280 x 720. W przeciwnym razie kodowany jest jako 640 x 468.
Brak przesyłania strumieniowego: szczegółowe informacje nie są generowane, ale nie jest wykonywana żadna operacja przesyłania strumieniowego, a wideo nie jest dostępne w witrynie internetowej usługi Azure AI Video Indexer. Po wybraniu opcji Bez przesyłania strumieniowego nie są naliczane opłaty za kodowanie.

Wykluczanie modeli

Modele można wykluczyć podczas indeksowania zarówno za pomocą witryny internetowej VI, jak i interfejsu API. Podczas przekazywania wideo do indeksowania przy użyciu witryny internetowej wybierz pozycję Ustawienia>zaawansowane Ustawienia wstępne indeksowania, a następnie wybierz modele sztucznej inteligencji, które mają zostać wykluczone z wyników indeksowania. Może to umożliwić bardziej wydajne indeksowanie i wyniki VI zawierające tylko interesujące Cię szczegółowe informacje.

Dostosowywanie modeli zawartości

Usługa Azure AI Video Indexer umożliwia dostosowanie niektórych modeli do konkretnego przypadku użycia. Modele te obejmują marki, język, osobę i mowę.

Szczegółowe informacje i magazyn multimediów

Magazyn szczegółowych informacji

Wszystkie szczegółowe informacje i metadane indeksowania są przechowywane na kontach magazynu zarządzanych przez vi i nie są naliczane opłaty za ten magazyn.

Magazyn multimediów

Twoje konto VI jest połączone z kontem usługi Azure Storage. Kontrolujesz użycie tego konta magazynu i płacisz za nie. Następujące pliki są przechowywane na tym koncie podczas indeksowania wideo:

Plik źródłowy. Jest to zachowywane w przypadku ponownego indeksowania wideo w przyszłości.
Nowy zakodowany plik, gdy jakość przesyłania strumieniowego jest ustawiona na pojedynczą szybkość transmisji bitów.

Usuwanie nośnika

Zaindeksowany nośnik i wszystkie skojarzone z nim pliki i szczegółowe informacje można usunąć na trzy sposoby:

Usuń pliki za pomocą portalu usługi Video Indexer.
Użyj żądania Usuń plik wideo lub Usuń plik źródłowy wideo.
Jeśli nie musisz przechowywać oryginalnego pliku multimedialnego w magazynie, w przypadku korzystania z interfejsu API ustaw retentionPeriod parametr na 1–7. Indeksowane wideo i wszystkie powiązane z nim, plik źródłowy, szczegółowe informacje itp. są usuwane 1–7 dni po indeksowaniu.

Udostępnij za pośrednictwem