Co to jest analiza wideo?

Artykuł
04/02/2025

Analiza wideo obejmuje funkcje związane z wideo, takie jak analiza przestrzenna i pobieranie wideo.

Analiza przestrzenna

Ważne

30 marca 2025 r. analiza przestrzenna usługi Azure AI Vision zostanie wycofana. Przed określoną datą przejdź do usługi Azure AI Video Indexer lub innego rozwiązania typu open source. Zachęcamy do wcześniejszego przejścia na Azure AI Video Indexer, aby uzyskać więcej korzyści. Oprócz znanych funkcji, których używasz, poniżej przedstawiono szybkie porównanie usługi Azure AI Vision Spatial Analysis i usługi Azure AI Video Indexer.

Funkcja	Analiza przestrzenna usługi Azure AI Vision	Azure AI Video Indexer
Obsługa przeglądarki Microsoft Edge	Tak	Tak
Wykrywanie obiektów	Tylko wykrywanie osób i pojazdów	Wykrywa 1000 obiektów i więcej
Przetwarzanie dźwięku/mowy	Nieobsługiwane	Obsługiwane (obejmuje transkrypcję mowy, tłumaczenie i podsumowanie) Obsługiwane >(obejmuje transkrypcję mowy i analizę nastrojów)
Wykrywanie zdarzeń i śledzenie	Obsługiwane (śledzenie osób i pojazdów, wykrywanie zdarzeń)	Nieobsługiwane jeszcze w przeglądarce Edge. Jest częściowo obsługiwana w chmurze.
Obsługa usługi Azure Arc	Nieobsługiwane	Natywna obsługa
Obszar, na którym się skupiasz	Analiza wizualna z wyspecjalizowanym śledzeniem	Kompleksowa analiza zawartości audio i wizualnej

Od teraz do 30 marca 2025 r. możesz nadal używać usługi Azure AI Vision Spatial Analysis lub przejść do usługi Azure AI Video Indexer przed określoną datą. Po 30 marca 2025 r. kontener analizy przestrzennej nie będzie już obsługiwany i przestanie przetwarzać nowe strumienie.

Analiza przestrzenna usługi Azure AI Vision umożliwia wykrywanie obecności i ruchów osób w filmie wideo. Pozyskiwanie strumieni wideo z kamer, wyodrębnianie szczegółowych informacji i generowanie zdarzeń, które mają być używane przez inne systemy. Usługa może wykonywać takie czynności, jak zliczanie liczby osób wchodzących w przestrzeń lub mierzenie zgodności z maską twarzy i wytycznymi dotyczącymi dystansowania społecznego. Przetwarzając strumienie wideo z przestrzeni fizycznych, możesz dowiedzieć się, jak ludzie z nich korzystają i maksymalizować wartość przestrzeni w organizacji.

Wypróbuj możliwości analizy przestrzennej szybko i łatwo w przeglądarce przy użyciu usługi Azure AI Vision Studio.

Wypróbuj program Vision Studio

Liczenie osób

Ta operacja zlicza liczbę osób w określonej strefie w czasie przy użyciu operacji PersonCount . Generuje niezależny licznik dla każdej przetworzonej klatki, bez próby śledzenia osób pomiędzy klatkami. Ta operacja może służyć do oszacowania liczby osób w przestrzeni lub wygenerowania powiadomienia, gdy osoba się pojawi.

Animacja przedstawiająca sposób, w jaki analiza przestrzenna zlicza liczbę osób w polu kamery widoku.

Liczenie wejść

Ta funkcja monitoruje, jak długo ludzie pozostają w okolicy lub kiedy wchodzą przez drzwi. To monitorowanie można wykonać przy użyciu operacji PersonCrossingPolygon lub PersonCrossingLine. W scenariuszach sprzedaży detalicznej te operacje mogą służyć do mierzenia czasów oczekiwania w kolejce do kasy lub zaangażowania przy ekranie. Ponadto te operacje mogą mierzyć przepływ osób w holu lub na określonym piętrze w innych scenariuszach budynków komercyjnych.

Animacja przedstawiająca ramki osób poruszających się i wychodzących z obramowanego miejsca z prostokątami narysowanymi wokół nich.

Ta funkcja analizuje, jak dobrze ludzie przestrzegają wymagań dotyczących różnic społecznych w przestrzeni. System używa operacji PersonDistance , aby automatycznie skalibrować się, gdy ludzie chodzą w przestrzeni. Następnie określa, kiedy ludzie naruszają określony próg odległości (6 stóp lub 10 stóp).

Animacja przedstawiająca, jak analiza przestrzenna wizualizuje zdarzenia naruszenia dystansu społecznego pokazujące linie między osobami pokazującymi odległość.

Analizę przestrzenną można również skonfigurować pod kątem wykrywania, czy dana osoba ma na sobie osłonę twarzy, taką jak maska. Klasyfikator maski można włączyć dla operacji PersonCount, PersonCrossingLine i PersonCrossingPolygon, konfigurując ENABLE_FACE_MASK_CLASSIFIER parametr .

Zdjęcie przedstawiające, jak analiza przestrzenna klasyfikuje, czy ludzie mają maski twarzy w windze.

Pobieranie wideo

Ważne

30 czerwca 2025 r. pobieranie wideo usługi Azure AI Vision zostanie wycofane. Decyzja o wycofaniu tej funkcji jest częścią naszych ciągłych wysiłków na rzecz poprawy i uproszczenia i ulepszenia funkcji oferowanych do przetwarzania wideo. Migrowanie do usługi Azure AI Content Understanding i Azure AI Search w celu skorzystania z dodatkowych możliwości.

#B0 przetwarzanie wideo: pobieranie wideo a usługa Azure AI Content Understanding #C1

Funkcja	Pobieranie wideo w celu uzyskania opisu wideo	Omówienie zawartości sztucznej inteligencji platformy Azure
Dopuszczalna długość wideo	Zoptymalizowany pod kątem krótkich filmów wideo, do ~3 minut	Obsługuje krótkie i długie filmy, do 4 godzin
Przetwarzanie ramek	Do 20 ramek	Przetwarzanie wsadowe, próbkowanie klatka po klatce w całym materiale wideo.
Przetwarzanie wstępne wyodrębniania treści	Transkrypcja	Transkrypcja, identyfikacja ujęć, grupowanie twarzy
Obsługa danych wyjściowych ze strukturą	Nieobsługiwane	Obsługuje dane wyjściowe ze strukturą zgodną ze schematem
Typy danych	Wideo jest obsługiwane	Obsługiwane są wideo, obrazy, dokumenty i mowa
Ceny	Zmienna oparta na tokenach	Koszt stały na minutę przetwarzania wideo

Aby przeprowadzić migrację do Azure AI Content Understanding w celu podsumowywania i opisywania wideo, zalecamy zapoznanie się z dokumentacją.

Wyszukiwanie Wideo: Odnajdywanie Wideo vs. Azure AI Search i Rozumienie Treści

Funkcja	Pobieranie wideo do wyszukiwania wideo	Azure AI Search i Rozumienie Zawartości
Typ osadzania wizualizacji	Osadzanie obrazów opartych na ramce	Osadzanie tekstu opisu wideo
Przetwarzanie wstępne ekstrakcji zawartości	Transkrypcja, OCR	Transkrypcja, identyfikacja ujęć, grupowanie twarzy
Obsługa wyszukiwania osób i obiektów	Silne wsparcie	Silne wsparcie
Obsługa akcji i zdarzeń	Ograniczony	Silne wsparcie
Dostosowanie	Żaden	Analizator usługi Content Understanding można dostosować do fokusu przy użyciu pól i opisów pól

Aby rozpocząć tworzenie przypadku użycia wyszukiwania w usłudze Content Understanding, zalecamy rozpoczęcie od tego przykładu, w którym jest pokazane, jak używać usługi Azure AI Search do wyszukiwania wideo.

Aby uniknąć przerw w działaniu usługi, należy przeprowadzić migrację do dnia 30 czerwca 2025 r.

Pobieranie wideo to usługa, która umożliwia tworzenie indeksu wyszukiwania, dodawanie do niego dokumentów (wideo i obrazów) oraz wyszukiwanie za pomocą języka naturalnego. Deweloperzy mogą definiować schematy metadanych dla każdego indeksu i pozyskiwać metadane do usługi, aby ułatwić pobieranie. Deweloperzy mogą również określić, jakie funkcje mają być wyodrębnione z indeksu (wizja, mowa) i filtrować wyszukiwanie na podstawie funkcji.

Wywoływanie interfejsów API pobierania wideo

Analiza przestrzenna działa na filmach wideo, które spełniają następujące wymagania:

Wideo musi być w formacie RTSP, rawvideo, MP4, FLV lub MKV.
Koder wideo musi być H.264, HEVC(H.265), rawvideo, VP9 lub MPEG-4.

Obsługiwane formaty

Format pliku	opis
`asf`	ASF (zaawansowany/aktywny format przesyłania strumieniowego)
`avi`	AVI (Audio Video Przeplatane)
`flv`	FLV (Flash Video)
`matroskamm`, `webm`	Matroska / WebM
`mov`,`mp4`,`m4a`,`3gp`,`3g2`,`mj2`	QuickTime / MOV

Obsługiwane koderki wideo

Koder-dekoder	Formatuj
`h264`	H.264 / AVC / MPEG-4 AVC / MPEG-4 część 10
`h265`	H.265/HEVC
`libvpx-vp9`	libvpx VP9 (codec vp9)
`mpeg4`	MPEG-4, część 2

Obsługiwane koderki audio

Kodek	Formatuj
`aac`	AAC (zaawansowane kodowanie audio)
`mp3`	MP3 (MPEG audio layer 3)
`pcm`	PCM (nieskompresowany)
`vorbis`	Vorbis
`wmav2`	Windows Media Audio 2

Odpowiedzialne korzystanie z technologii analizy przestrzennej

Aby dowiedzieć się, jak korzystać z technologii analizy przestrzennej w sposób odpowiedzialny, zobacz notę o Przejrzystości. Uwagi dotyczące przejrzystości firmy Microsoft pomagają zrozumieć, w jaki sposób działa nasza technologia sztucznej inteligencji oraz jakie wybory mogą podejmować właściciele systemów, które wpływają na wydajność i zachowanie systemu. Koncentrują się one na znaczeniu myślenia o całym systemie, w tym technologii, ludzi i środowiska.

Następny krok

Instalowanie i uruchamianie kontenera analizy przestrzennej

Udostępnij za pośrednictwem

Co to jest analiza wideo?

Analiza przestrzenna

Liczenie osób

Liczenie wejść

Pobieranie wideo

Wymagania dotyczące danych wejściowych

Obsługiwane formaty

Obsługiwane koderki wideo

Obsługiwane koderki audio

Odpowiedzialne korzystanie z technologii analizy przestrzennej

Następny krok

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Co to jest analiza wideo?

Analiza przestrzenna

Liczenie osób

Liczenie wejść

Rozpoznawanie dystansu społecznego i wykrywanie maski twarzy

Pobieranie wideo

Wymagania dotyczące danych wejściowych

Odpowiedzialne korzystanie z technologii analizy przestrzennej

Następny krok

Opinia

Dodatkowe zasoby