Uzyskiwanie obserwowanych danych wykrywania i dopasowywania twarzy
Obserwowane wykrywanie osób, dopasowane twarze, wykryta odzież
Ważne
Dostęp do funkcji identyfikacji twarzy, dostosowywania i rozpoznawania osobistości jest ograniczony w oparciu o kryteria uprawnień i użycia w celu obsługi naszych zasad odpowiedzialnej sztucznej inteligencji. Funkcje identyfikacji twarzy, dostosowywania i rozpoznawania osobistości są dostępne tylko dla klientów i partnerów zarządzanych przez firmę Microsoft. Użyj formularza do wprowadzania rozpoznawania twarzy, aby ubiegać się o dostęp.
Obserwowane wykrywanie i dopasowywanie twarzy automatycznie wykrywa i pasuje do osób w plikach multimedialnych. Obserwowane wykrywanie i dopasowywanie twarzy można ustawić w celu wyświetlania szczegółowych informacji na temat osób, ich odzieży i dokładnego przedziału czasu ich wyglądu.
W portalu internetowym wynikowe szczegółowe informacje są wyświetlane na liście podzielonej na kategorie na karcie Szczegółowe informacje, karta zawiera miniaturę każdej osoby i ich identyfikatora. Kliknięcie miniatury osoby powoduje wyświetlenie dopasowanej osoby (odpowiadającej jej twarzy w szczegółowych informacjach osób). Szczegółowe informacje są również generowane na liście podzielonej na kategorie w pliku JSON, który zawiera identyfikator miniatury osoby, procent czasu wyświetlanego w pliku, link typu wiki (jeśli są osobistościami) i poziom ufności.
Obserwowane wykrywanie osób, wykryte ubrania i dopasowane przypadki użycia twarzy
- Poprawa wydajności dzięki głębokiego wyszukiwania dopasowanych osób w archiwach organizacyjnych w celu uzyskania szczegółowych informacji na temat konkretnych osobistości, na przykład podczas tworzenia promosów i zwiastunów.
- Zwiększona wydajność podczas tworzenia historii funkcji, na przykład, wyszukiwanie osób ubranych w czerwoną koszulę w archiwach gry w piłkę nożną w agencji News lub Sports.
- Utwórz podsumowanie z długiego wideo, na przykład dowód sądowy wygląd określonej osoby w filmie wideo, używając tego samego identyfikatora wykrytej osoby.
- Dowiedz się i analizuj trendy w miarę upływu czasu — jak klienci przechodzą między przejściami w centrum handlowym lub ile czasu spędzają w liniach zakupu.
Dopasowane twarze i wykryte funkcje odzieży są dostępne podczas indeksowania pliku, wybierając ustawienie wstępne Zaawansowane ->Wideo i indeksowanie audio.
Wyświetlanie kodu JSON szczegółowych informacji za pomocą portalu internetowego
Po przekazaniu i zaindeksowaniu klipu wideo szczegółowe informacje są dostępne w formacie JSON do pobrania przy użyciu portalu internetowego.
- Wybierz kartę Biblioteka .
- Wybierz multimedia, z którym chcesz pracować.
- Wybierz pozycję Pobierz i Szczegółowe informacje (JSON). Plik JSON zostanie otwarty na nowej karcie przeglądarki.
- Poszukaj pary kluczy opisanej w przykładowej odpowiedzi.
Używanie interfejsu API
- Użyj żądania Pobierz indeks wideo. Zalecamy przekazanie
&includeSummarizedInsights=false
elementu . - Poszukaj par kluczy opisanych w przykładowej odpowiedzi.
Przykładowa odpowiedź
"observedPeople": [
{
"id": 1,
"thumbnailId": "d09ad62e-e0a4-42e5-8ca9-9a640c686596",
"clothing": [
{
"id": 1,
"type": "sleeve",
"properties": {
"length": "short"
}
},
{
"id": 2,
"type": "pants",
"properties": {
"length": "short"
}
}
],
"matchingFace": {
"id": 1310,
"confidence": 0.3819
},
"instances": [
{
"adjustedStart": "0:00:34.8681666",
"adjustedEnd": "0:00:36.0026333",
"start": "0:00:34.8681666",
"end": "0:00:36.0026333"
},
{
"adjustedStart": "0:00:36.6699666",
"adjustedEnd": "0:00:36.7367",
"start": "0:00:36.6699666",
"end": "0:00:36.7367"
},
{
"adjustedStart": "0:00:37.2038333",
"adjustedEnd": "0:00:39.6729666",
"start": "0:00:37.2038333",
"end": "0:00:39.6729666"
}
]
}
]
Ważne
Ważne jest, aby zapoznać się z omówieniem noty przejrzystości dla wszystkich funkcji VI. Każda analiza zawiera również własne uwagi dotyczące przejrzystości:
Obserwowane wykrywanie i dopasowywanie notatek twarzy
- Osoby zazwyczaj nie są wykrywane, jeśli pojawiają się małe (minimalna wysokość osoby wynosi 100 pikseli).
- Maksymalny rozmiar ramki to pełna wysoka definicja (FHD).
- Wideo o niskiej jakości (na przykład ciemne warunki oświetlenia) może mieć wpływ na wyniki wykrywania.
- Zalecana szybkość klatek na sekundę wynosi co najmniej 30 KLATEK NA SEKUNDĘ.
- Zalecane dane wejściowe wideo powinny zawierać maksymalnie 10 osób w jednej ramce. Funkcja może pracować z większą większa większa liczba osób w jednej ramce, ale wynik wykrywania pobiera maksymalnie 10 osób w ramce z najwyższym zaufaniem wykrywania.
- Osoby z podobnymi ubraniami: (na przykład osoby noszą mundury, gracze w grach sportowych) mogą być wykrywane jako ta sama osoba o tym samym numerze identyfikacyjnym.
- Przeszkoda — mogą wystąpić błędy, w których występują przeszkody (scena/samolub przeszkody przez inne osoby).
- Poz: Utwory mogą być podzielone ze względu na różne pozy (tylne/z przodu)
- Ponieważ wykrywanie odzieży zależy od widoczności ciała osoby, dokładność jest wyższa, jeśli dana osoba jest w pełni widoczna. Mogą wystąpić błędy, gdy osoba nie ma odzieży. W tym scenariuszu lub innych słabych widoczności wyniki mogą być podane, takie jak długie spodnie i spódnica lub sukienka.
Obserwowane wykrywanie i dopasowywanie składników twarzy
Składnik | Definicja |
---|---|
Plik źródłowy | Użytkownik przekazuje plik źródłowy do indeksowania. |
Detection | Plik multimedialny jest śledzony w celu wykrycia obserwowanych osób i ich odzieży. Na przykład koszula z długimi rękawami, sukienką lub długimi spodniami. Aby można było wykryć, pełne górne ciało osoby musi pojawić się w mediach. |
Grupowanie lokalne | Zidentyfikowane obserwowane twarze są filtrowane do grup lokalnych. Jeśli osoba zostanie wykryta więcej niż raz, dla tej osoby zostanie utworzonych więcej obserwowanych wystąpień twarzy. |
Dopasowywanie i klasyfikacja | Obserwowane wystąpienia osób są dopasowywane do twarzy. Jeśli istnieje znana sławna, obserwowana osoba otrzymuje swoje imię. Dowolna liczba obserwowanych wystąpień osób może być dopasowana do tej samej twarzy. |
Wartość ufności | Szacowany poziom ufności każdej obserwowanej osoby jest obliczany jako zakres od 0 do 1. Wskaźnik ufności reprezentuje pewność dokładności wyniku. Na przykład 82% pewność jest reprezentowana jako wynik 0,82. |