Udostępnij za pośrednictwem


Uzyskiwanie obserwowanych danych wykrywania i dopasowywania twarzy

Obserwowane wykrywanie osób, dopasowane twarze, wykryta odzież

Ważne

Dostęp do funkcji identyfikacji twarzy, dostosowywania i rozpoznawania osobistości jest ograniczony w oparciu o kryteria uprawnień i użycia w celu obsługi naszych zasad odpowiedzialnej sztucznej inteligencji. Funkcje identyfikacji twarzy, dostosowywania i rozpoznawania osobistości są dostępne tylko dla klientów i partnerów zarządzanych przez firmę Microsoft. Użyj formularza do wprowadzania rozpoznawania twarzy, aby ubiegać się o dostęp.

Obserwowane wykrywanie i dopasowywanie twarzy automatycznie wykrywa i pasuje do osób w plikach multimedialnych. Obserwowane wykrywanie i dopasowywanie twarzy można ustawić w celu wyświetlania szczegółowych informacji na temat osób, ich odzieży i dokładnego przedziału czasu ich wyglądu.

W portalu internetowym wynikowe szczegółowe informacje są wyświetlane na liście podzielonej na kategorie na karcie Szczegółowe informacje, karta zawiera miniaturę każdej osoby i ich identyfikatora. Kliknięcie miniatury osoby powoduje wyświetlenie dopasowanej osoby (odpowiadającej jej twarzy w szczegółowych informacjach osób). Szczegółowe informacje są również generowane na liście podzielonej na kategorie w pliku JSON, który zawiera identyfikator miniatury osoby, procent czasu wyświetlanego w pliku, link typu wiki (jeśli są osobistościami) i poziom ufności.

Obserwowane wykrywanie osób, wykryte ubrania i dopasowane przypadki użycia twarzy

  • Poprawa wydajności dzięki głębokiego wyszukiwania dopasowanych osób w archiwach organizacyjnych w celu uzyskania szczegółowych informacji na temat konkretnych osobistości, na przykład podczas tworzenia promosów i zwiastunów.
  • Zwiększona wydajność podczas tworzenia historii funkcji, na przykład, wyszukiwanie osób ubranych w czerwoną koszulę w archiwach gry w piłkę nożną w agencji News lub Sports.
  • Utwórz podsumowanie z długiego wideo, na przykład dowód sądowy wygląd określonej osoby w filmie wideo, używając tego samego identyfikatora wykrytej osoby.
  • Dowiedz się i analizuj trendy w miarę upływu czasu — jak klienci przechodzą między przejściami w centrum handlowym lub ile czasu spędzają w liniach zakupu.

Dopasowane twarze i wykryte funkcje odzieży są dostępne podczas indeksowania pliku, wybierając ustawienie wstępne Zaawansowane ->Wideo i indeksowanie audio.

Wyświetlanie kodu JSON szczegółowych informacji za pomocą portalu internetowego

Po przekazaniu i zaindeksowaniu klipu wideo szczegółowe informacje są dostępne w formacie JSON do pobrania przy użyciu portalu internetowego.

  1. Wybierz kartę Biblioteka .
  2. Wybierz multimedia, z którym chcesz pracować.
  3. Wybierz pozycję Pobierz i Szczegółowe informacje (JSON). Plik JSON zostanie otwarty na nowej karcie przeglądarki.
  4. Poszukaj pary kluczy opisanej w przykładowej odpowiedzi.

Używanie interfejsu API

  1. Użyj żądania Pobierz indeks wideo. Zalecamy przekazanie &includeSummarizedInsights=falseelementu .
  2. Poszukaj par kluczy opisanych w przykładowej odpowiedzi.

Przykładowa odpowiedź

"observedPeople": [
    {
        "id": 1,
        "thumbnailId": "d09ad62e-e0a4-42e5-8ca9-9a640c686596",
        "clothing": [
            {
                "id": 1,
                "type": "sleeve",
                "properties": {
                    "length": "short"
                }
            },
            {
                "id": 2,
                "type": "pants",
                "properties": {
                    "length": "short"
                }
            }
        ],
        "matchingFace": {
            "id": 1310,
            "confidence": 0.3819
        },
        "instances": [
            {
                "adjustedStart": "0:00:34.8681666",
                "adjustedEnd": "0:00:36.0026333",
                "start": "0:00:34.8681666",
                "end": "0:00:36.0026333"
            },
            {
                "adjustedStart": "0:00:36.6699666",
                "adjustedEnd": "0:00:36.7367",
                "start": "0:00:36.6699666",
                "end": "0:00:36.7367"
            },
            {
                "adjustedStart": "0:00:37.2038333",
                "adjustedEnd": "0:00:39.6729666",
                "start": "0:00:37.2038333",
                "end": "0:00:39.6729666"
            }
        ]
    }
]

Ważne

Ważne jest, aby zapoznać się z omówieniem noty przejrzystości dla wszystkich funkcji VI. Każda analiza zawiera również własne uwagi dotyczące przejrzystości:

Obserwowane wykrywanie i dopasowywanie notatek twarzy

  • Osoby zazwyczaj nie są wykrywane, jeśli pojawiają się małe (minimalna wysokość osoby wynosi 100 pikseli).
  • Maksymalny rozmiar ramki to pełna wysoka definicja (FHD).
  • Wideo o niskiej jakości (na przykład ciemne warunki oświetlenia) może mieć wpływ na wyniki wykrywania.
  • Zalecana szybkość klatek na sekundę wynosi co najmniej 30 KLATEK NA SEKUNDĘ.
  • Zalecane dane wejściowe wideo powinny zawierać maksymalnie 10 osób w jednej ramce. Funkcja może pracować z większą większa większa liczba osób w jednej ramce, ale wynik wykrywania pobiera maksymalnie 10 osób w ramce z najwyższym zaufaniem wykrywania.
  • Osoby z podobnymi ubraniami: (na przykład osoby noszą mundury, gracze w grach sportowych) mogą być wykrywane jako ta sama osoba o tym samym numerze identyfikacyjnym.
  • Przeszkoda — mogą wystąpić błędy, w których występują przeszkody (scena/samolub przeszkody przez inne osoby).
  • Poz: Utwory mogą być podzielone ze względu na różne pozy (tylne/z przodu)
  • Ponieważ wykrywanie odzieży zależy od widoczności ciała osoby, dokładność jest wyższa, jeśli dana osoba jest w pełni widoczna. Mogą wystąpić błędy, gdy osoba nie ma odzieży. W tym scenariuszu lub innych słabych widoczności wyniki mogą być podane, takie jak długie spodnie i spódnica lub sukienka.

Obserwowane wykrywanie i dopasowywanie składników twarzy

Składnik Definicja
Plik źródłowy Użytkownik przekazuje plik źródłowy do indeksowania.
Detection Plik multimedialny jest śledzony w celu wykrycia obserwowanych osób i ich odzieży. Na przykład koszula z długimi rękawami, sukienką lub długimi spodniami. Aby można było wykryć, pełne górne ciało osoby musi pojawić się w mediach.
Grupowanie lokalne Zidentyfikowane obserwowane twarze są filtrowane do grup lokalnych. Jeśli osoba zostanie wykryta więcej niż raz, dla tej osoby zostanie utworzonych więcej obserwowanych wystąpień twarzy.
Dopasowywanie i klasyfikacja Obserwowane wystąpienia osób są dopasowywane do twarzy. Jeśli istnieje znana sławna, obserwowana osoba otrzymuje swoje imię. Dowolna liczba obserwowanych wystąpień osób może być dopasowana do tej samej twarzy.
Wartość ufności Szacowany poziom ufności każdej obserwowanej osoby jest obliczany jako zakres od 0 do 1. Wskaźnik ufności reprezentuje pewność dokładności wyniku. Na przykład 82% pewność jest reprezentowana jako wynik 0,82.

Przykładowy kod

Zobacz wszystkie przykłady dla vi