Podsumowanie tekstowe za pomocą usługi Azure AI Video Indexer (wersja zapoznawcza)
Ten artykuł zawiera omówienie podsumowania tekstowego za pomocą usługi Azure AI Video Indexer.
Co to jest tekstowe podsumowanie wideo?
Usługa Azure AI Video Indexer zawiera krótkie podsumowanie tego, co dotyczy filmu wideo bez konieczności oglądania całego filmu wideo. Zaprojektowano go tak, aby zaoszczędzić czas, szyfrując długie filmy wideo i dając ci ist w krótkim formacie. To jak posiadanie przyjaciela, który ogląda wszystkie odcinki serialu, a następnie dogoni cię na fabułę w ciągu zaledwie kilku minut.
System ma być narzędziem pomocniczym, które zwiększa produktywność i uczenie się poprzez destylowanie długich filmów wideo w zwięzłe, szyfrowane podsumowania.
Używa algorytmów podsumowania do identyfikowania najbardziej odpowiednich szczegółowych informacji dotyczących filmu wideo i ocenia szczegółowe informacje na podstawie ich znaczenia i istotności dla ogólnego motywu. Przyjazny dla użytkownika interfejs umożliwia wprowadzanie wideo i dostosowywanie potrzebnego typu podsumowania.
System udostępnia opcje opinii, dzięki czemu może uczyć się i ulepszać w czasie na podstawie interakcji z użytkownikiem.
Ważne
System nie ma na celu zastąpienia pełnego wyświetlania, zwłaszcza w przypadku zawartości, w której szczegóły i niuanse mają kluczowe znaczenie dla podejmowania odpowiedzialnych decyzji. Ponadto nie jest przeznaczony do podsumowywania wysoce poufnych filmów wideo, w których kontekst i prywatność są najważniejsze.
Podsumowanie tekstowe z ramkami kluczowymi
Tekstowe podsumowanie wideo z ramkami kluczowymi używa klatek kluczowych z filmu wideo w celu wygenerowania bardziej kompleksowego podsumowania. Ta funkcja jest szczególnie przydatna, gdy istnieje ograniczona zawartość audio, taka jak transkrypcja lub gdy wymagane jest bardziej całościowe podsumowanie.
Przypadki użycia
Celem zastosowania systemu podsumowania wideo opartego na sztucznej inteligencji jest zapewnienie użytkownikom szybkiego i wydajnego sposobu zrozumienia zawartości dłuższych filmów wideo bez konieczności oglądania ich w całości. Poniżej przedstawiono konkretne zamierzone zastosowania:
- Edukacja. Uczniowie i nauczyciele mogą używać systemu do podsumowywania wykładów, seminariów lub treści edukacyjnych, co sprawia, że materiały studyjne są bardziej dostępne i łatwiejsze do przejrzenia oraz skupienia się na kluczowych punktach szkoleniowych lub definicjach.
- Firmowe. Specjaliści mogą generować podsumowania spotkań, prezentacji lub sesji szkoleniowych, które podkreślają decyzje, elementy akcji lub kluczowe punkty spotkań. Zapewnia szybkie podsumowanie i zapewnia, że ważne informacje nie zostały pominięte.
- Multimedia. Dziennikarze i opinia publiczna mogą korzystać z systemu, aby uzyskać istotę doniesień prasowych, filmów dokumentalnych lub wywiadów, oszczędzając czas, pozostając na bieżąco. Kondensuje wiadomości lub filmy dokumentalne w kawałki wielkości ukąszenia bez utraty narracji.
- Formaty danych wyjściowych Można ustawić podsumowania, aby używać różnych stylów języka: neutralnego, casualowego lub formalnego. Można również ustawić długość podsumowania na krótki lub długi.
Podsumowanie tekstowe w vi włączone przez usługę Arc
Jeśli używasz vi enbabled przez rozszerzenie Arc, możesz wygenerować podsumowanie na stronie wideo w portalu internetowym i użyć tych samych funkcji, takich jak dostosowania, ale nie ma możliwości zmiany wdrożenia modelu. Zamiast tego każde utworzone nowe rozszerzenie zawiera lokalny model Phi-3-mini-4k-instruct opracowany przez firmę Microsoft. Za żądania do modelu nie są naliczane opłaty.
Uwagi dotyczące przezroczystości
Aby uzyskać więcej informacji na temat specyfikacji i ograniczeń, zobacz sekcję Podsumowanie tekstowe notatek przejrzystości.