Udostępnij za pośrednictwem


Włączanie polecanej odzieży obserwowanej osoby

Podczas indeksowania wideo przy użyciu zaawansowanych ustawień wideo usługi Azure AI Video Indexer można wyświetlić polecaną odzież obserwowanej osoby. Szczegółowe informacje udostępniają momenty w filmie, w którym kluczowe osoby są wyraźnie opisywane i widoczne, w tym współrzędne ludzi, znacznik czasu i ramka zdjęcia. Ta analiza umożliwia wysokiej jakości reklamy kontekstowe wideo, gdzie odpowiednie reklamy odzieżowe są dopasowane do określonego czasu w filmie, w którym są wyświetlane.

W tym artykule omówiono sposób wyświetlania proponowanych szczegółowych informacji dotyczących odzieży i sposobu klasyfikacji polecanych obrazów odzieży.

Wyświetlanie wideo wprowadzającego

Możesz obejrzeć poniższy krótki film wideo, w którym omówiono sposób wyświetlania i używania proponowanych szczegółowych informacji dotyczących odzieży.

Polecana analiza odzieży jest dostępna podczas indeksowania pliku, wybierając opcję Zaawansowane —> zaawansowane wideo lub Zaawansowane ustawienia wstępne wideo i audio (w obszarze Indeksowanie wideo i audio). Indeksowanie standardowe nie obejmuje tych szczegółowych informacji.

Ten zrzut ekranu przedstawia opcję indeksowania wideo.

Polecane obrazy odzieży są klasyfikowane w oparciu o niektóre z następujących czynników: kluczowe momenty filmu wideo, czas trwania pojawiania się osoby, emocje tekstowe i wydarzenia dźwiękowe. Szczegółowe informacje są prywatne najwyższą ramką klasyfikacji na scenę, która umożliwia tworzenie kontekstowych reklam na scenę w całym filmie. Plik JSON jest klasyfikowany przez sekwencję scen w filmie wideo, a każda scena ma najwyżej ocenianą ramkę.

Uwaga

Polecane szczegółowe informacje dotyczące odzieży można wyświetlać tylko z pliku artefaktu, a szczegółowe informacje nie są dostępne w witrynie internetowej usługi Azure AI Video Indexer.

  1. W prawym górnym rogu wybierz, aby pobrać plik zip artefaktu: Pobierz ->Artifact (ZIP)
  2. Otwórz featuredclothing.zip.

Plik .zip zawiera dwa obiekty:

  • featuredclothing.map.json - plik zawiera wystąpienia każdej polecanej odzieży, z następującymi właściwościami:

    • id – indeks rankingowy ("id": 1 jest najważniejszą odzieżą).
    • confidence – wynik polecanej odzieży.
    • frameIndex – najlepsza rama odzieży.
    • timestamp — odpowiadający ramkiIndex.
    • opBoundingBox – pole ograniczenia osoby.
    • faceBoundingBox – pole ograniczenia twarzy osoby, jeśli zostanie wykryta.
    • fileName – gdzie jest zapisywana najlepsza rama odzieży.
    • sceneID - scena, w której pojawia się scena.

    Przykład polecanej odzieży z elementem "sceneID": 1.

    "instances": [
      	{
        		"confidence": 0.07,
    			"faceBoundingBox": {},
    			"fileName": "frame_100.jpg",
        		"frameIndex": 100,
        		"opBoundingBox": {
            			"x": 0.09062,
            			"y": 0.4,
    				"width": 0.11302,
            			"height": 0.59722
    				},
       			 "timestamp": "0:00:04",
        		"personName": "Observed Person #1",
        		"sceneId": 1
      	}
    
  • featuredclothing.frames.map — ten folder zawiera obrazy najlepszych ramek, w których pojawiła się polecana odzież, odpowiadająca fileName właściwości w każdym wystąpieniu w featuredclothing.map.jsonprogramie .

Ograniczenia i założenia

Ważne jest, aby pamiętać o ograniczeniach polecanej odzieży, aby uniknąć lub ograniczyć skutki fałszywych wykryć obrazów o niskiej jakości lub niskiej trafności. 

  • Warunkiem wstępnym dla opisywanej odzieży jest to, że osoba ubrana w ubrania można znaleźć w obserwowanych wgląd ludzi.
  • Jeśli twarz osoby ubranej w polecaną odzież nie zostanie wykryta, wyniki nie zawierają pola ograniczenia twarzy.
  • Jeśli osoba w filmie nosi więcej niż jeden strój, algorytm wybiera swój najlepszy strój jako pojedynczy polecany obraz odzieży.
  • W przypadku postawienia utwory są zoptymalizowane pod kątem obsługi obserwowanych osób, które najczęściej pojawiają się na froncie.
  • Nieprawidłowe wykrycia mogą wystąpić, gdy ludzie nakładają się na siebie.
  • Ramki zawierające rozmyte osoby są bardziej podatne na wyniki niskiej jakości.

Aby uzyskać więcej informacji, zobacz ograniczenia obserwowanych osób.