Analyze - Image Stream

Odwołanie

Usługa:: Azure AI Services

Wersja interfejsu API:: 2024-02-01

Przeanalizuj obraz wejściowy. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ['image/*', 'application/octet-stream'].

POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01

Z parametrami opcjonalnymi:

POST /imageanalysis:analyze?overload=stream&features={features}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01

Parametry identyfikatora URI

Nazwa	W	Wymagane	Typ	Opis
api-version	query	True	string	Żądana wersja interfejsu API.
features	query		VisualFeature[]	Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.
gender-neutral-caption	query		boolean	Flaga logiczna umożliwiająca włączanie podpisów neutralnych pod względem płci dla funkcji caption i denseCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false".
language	query		string	Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Zobacz https://aka.ms/cv-languages listę obsługiwanych języków.
smartcrops-aspect-ratios	query		array[]	Lista współczynników proporcji do użycia dla funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania o wysokość. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który widzi, mieści się w zakresie od 0,5 do 2,0 (włącznie).

Treść żądania

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

Nazwa	Typ	Opis
body	string	Strumień obrazu.

Odpowiedzi

Nazwa	Typ	Opis
200 OK	ImageAnalysisResult	Powodzenie
Other Status Codes	ErrorResponse	Błąd Nagłówki x-ms-error-code: string

Nazwa

Typ

Opis

200 OK

ImageAnalysisResult

Powodzenie

Other Status Codes

ErrorResponse

Błąd

Nagłówki

x-ms-error-code: string

Przykłady

ImageAnalysis_Analyze_MaximumSet_Gen

ImageAnalysis_Analyze_MinimumSet_Gen

ImageAnalysis_Analyze_MaximumSet_Gen

Przykładowe żądanie

HTTP

POST /imageanalysis:analyze?overload=stream&features=tags&language=zizuomdsxccdx&smartcrops-aspect-ratios=vqkmzmvchiwlxdaikxqrsbrpvyq&gender-neutral-caption=True&api-version=2024-02-01

"Ynl0ZXM="

Przykładowa odpowiedź

Kod stanu:: 200

{
  "captionResult": {
    "text": "wjtogwbozwgawzxikwsvs",
    "confidence": 0
  },
  "objectsResult": {
    "values": [
      {
        "id": "bcvupjoxcviiz",
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        },
        "tags": [
          {
            "name": "ikiqzvbmyrbuskhpphgjjuzvl",
            "confidence": 0
          }
        ]
      }
    ]
  },
  "readResult": {
    "blocks": [
      {
        "lines": [
          {
            "text": "ufmjctoebx",
            "boundingPolygon": [
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              }
            ],
            "words": [
              {
                "text": "cpcsgoi",
                "boundingPolygon": [
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  }
                ],
                "confidence": 0
              }
            ]
          }
        ]
      }
    ]
  },
  "denseCaptionsResult": {
    "values": [
      {
        "text": "hgvxqwxwqgtjfippp",
        "confidence": 0,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        }
      }
    ]
  },
  "modelVersion": "lymqyonwrxckwzrsxjihbceclts",
  "metadata": {
    "width": 28,
    "height": 7
  },
  "tagsResult": {
    "values": [
      {
        "name": "ikiqzvbmyrbuskhpphgjjuzvl",
        "confidence": 0
      }
    ]
  },
  "smartCropsResult": {
    "values": [
      {
        "aspectRatio": 7,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        }
      }
    ]
  },
  "peopleResult": {
    "values": [
      {
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        },
        "confidence": 0
      }
    ]
  }
}

ImageAnalysis_Analyze_MinimumSet_Gen

Przykładowe żądanie

HTTP

POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01

"Ynl0ZXM="

Przykładowa odpowiedź

Kod stanu:: 200

{
  "modelVersion": "lymqyonwrxckwzrsxjihbceclts",
  "metadata": {
    "width": 28,
    "height": 7
  }
}

Definicje

Nazwa	Opis
BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
CaptionResult	Krótki opis obrazu.
ContentTag	Obserwacja jednostki na obrazie wraz z wynikiem ufności.
CropRegion	Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.
DenseCaption	Krótki opis obrazu.
DenseCaptionsResult	Lista podpisów.
DetectedObject	Opisuje wykryty obiekt na obrazie.
DetectedPerson	Osoba wykryta na obrazie.
DetectedTextBlock	Wykryty blok tekstu.
DetectedTextLine	Wykryty wiersz tekstu.
DetectedTextWord	Wykryte słowo składające się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.
ErrorResponse	Odpowiedź zwrócona po wystąpieniu błędu.
ErrorResponseDetails	Informacje o błędzie.
ErrorResponseInnerError	Szczegółowy błąd.
ImageAnalysisResult	Opisz połączone wyniki różnych typów analizy obrazów.
ImageMetadata	Informacje o metadanych obrazu, takie jak wysokość i szerokość.
ImagePoint	Obiekt reprezentujący punkt na obrazie.
ObjectsResult	Opisuje wykryte obiekty na obrazie.
PeopleResult	Obiekt opisujący, czy obraz zawiera osoby.
ReadResult	Wyniki operacji odczytu.
SmartCropsResult	Inteligentny wynik przycinania.
TagsResult	Lista tagów z poziomem ufności.
VisualFeature	Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

Nazwa	Typ	Opis
h	integer	Wysokość mierzona od lewego górnego punktu obszaru w pikselach.
w	integer	Szerokość mierzona od lewego górnego punktu obszaru w pikselach.
x	integer	Współrzędna lewa w lewym górnym punkcie obszaru w pikselach.
y	integer	Górna współrzędna lewego górnego punktu obszaru w pikselach.

CaptionResult

Krótki opis obrazu.

Nazwa	Typ	Opis
confidence	number	Poziom pewności, jaki usługa ma w podpisie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.
text	string	Tekst podpisu.

ContentTag

Obserwacja jednostki na obrazie wraz z wynikiem ufności.

Nazwa	Typ	Opis
confidence	number	Poziom pewności, że zaobserwowano jednostkę. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.
name	string	Nazwa jednostki.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

Nazwa	Typ	Opis
aspectRatio	number	Współczynnik proporcji regionu przycinania.
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.

DenseCaption

Krótki opis obrazu.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
confidence	number	Poziom pewności, jaki usługa ma w podpisie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.
text	string	Tekst podpisu.

DenseCaptionsResult

Lista podpisów.

Nazwa	Typ	Opis
values	DenseCaption[]	Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
id	string	Identyfikator wykrytego obiektu.
tags	ContentTag[]	Zaufania klasyfikacji wykrytego obiektu.

DetectedPerson

Osoba wykryta na obrazie.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
confidence	number	Wskaźnik ufności obserwowania osoby na obrazie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.

DetectedTextBlock

Wykryty blok tekstu.

Nazwa	Typ	Opis
lines	DetectedTextLine[]	Lista wierszy tekstowych w bloku tekstowym.

DetectedTextLine

Wykryty wiersz tekstu.

Nazwa	Typ	Opis
boundingPolygon	ImagePoint[]	Powiązanie wielokąta wiersza tekstu.
text	string	Zawartość tekstowa wykrytego wiersza tekstu.
words	DetectedTextWord[]	Lista wyrazów w wierszu tekstu.

DetectedTextWord

Wykryte słowo składające się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

Nazwa	Typ	Opis
boundingPolygon	ImagePoint[]	Wiązanie wielokąta wyrazu.
confidence	number	Poziom pewności, że słowo zostało wykryte. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.
text	string	Zawartość tekstowa wyrazu.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

Nazwa	Typ	Opis
error	ErrorResponseDetails	Informacje o błędzie.

ErrorResponseDetails

Informacje o błędzie.

Nazwa	Typ	Opis
code	string	Kod błędu.
details	ErrorResponseDetails[]	Lista szczegółowych błędów.
innererror	ErrorResponseInnerError	Szczegółowy błąd.
message	string	Komunikat o błędzie.
target	string	Element docelowy błędu.

ErrorResponseInnerError

Szczegółowy błąd.

Nazwa	Typ	Opis
code	string	Kod błędu.
innererror	ErrorResponseInnerError	Szczegółowy błąd.
message	string	Komunikat o błędzie.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

Nazwa	Typ	Opis
captionResult	CaptionResult	Krótki opis obrazu.
denseCaptionsResult	DenseCaptionsResult	Lista podpisów.
metadata	ImageMetadata	Informacje o metadanych obrazu, takie jak wysokość i szerokość.
modelVersion	string	Wersja modelu.
objectsResult	ObjectsResult	Opisuje wykryte obiekty na obrazie.
peopleResult	PeopleResult	Obiekt opisujący, czy obraz zawiera osoby.
readResult	ReadResult	Wyniki operacji odczytu.
smartCropsResult	SmartCropsResult	Inteligentny wynik przycinania.
tagsResult	TagsResult	Lista tagów z poziomem ufności.

ImageMetadata

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

Nazwa	Typ	Opis
height	integer	Wysokość obrazu w pikselach.
width	integer	Szerokość obrazu w pikselach.

ImagePoint

Obiekt reprezentujący punkt na obrazie.

Nazwa	Typ	Opis
x	integer	Współrzędna x tego punktu.
y	integer	Współrzędna y tego punktu.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

Nazwa	Typ	Opis
values	DetectedObject[]	Tablica wykrytych obiektów.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

Nazwa	Typ	Opis
values	DetectedPerson[]	Tablica wykrytych osób.

ReadResult

Wyniki operacji odczytu.

Nazwa	Typ	Opis
blocks	DetectedTextBlock[]	Lista bloków tekstowych.

SmartCropsResult

Inteligentny wynik przycinania.

Nazwa	Typ	Opis
values	CropRegion[]	Zalecane regiony do przycinania obrazu.

TagsResult

Lista tagów z poziomem ufności.

Nazwa	Typ	Opis
values	ContentTag[]	Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.

Nazwa	Typ	Opis
caption	string	Opis lub podpis podsumowujący zawartość obrazu.
denseCaptions	string	Szczegółowe podpisy zawierające szczegółowe opisy zawartości obrazu.
objects	string	Określone obiekty rozpoznane i oznaczone etykietą na obrazie.
people	string	Wykrywanie i analiza osób na obrazie.
read	string	Zawartość tekstowa wyodrębniona z obrazu, taka jak znaki lub etykiety.
smartCrops	string	Automatycznie wygenerowane przycięte wersje obrazu koncentrują się na ważnej zawartości.
tags	string	Tagi wizualne reprezentujące obiekty wykryte na obrazie.

Udostępnij za pośrednictwem

Analyze - Image Stream

Parametry identyfikatora URI

Treść żądania

Odpowiedzi

Przykłady

ImageAnalysis_Analyze_MaximumSet_Gen

Przykładowe żądanie

Przykładowa odpowiedź

ImageAnalysis_Analyze_MinimumSet_Gen

Przykładowe żądanie

Przykładowa odpowiedź

Definicje

BoundingBox

CaptionResult

ContentTag

CropRegion

DenseCaption

DenseCaptionsResult

DetectedObject

DetectedPerson

DetectedTextBlock

DetectedTextLine

DetectedTextWord

ErrorResponse

ErrorResponseDetails

ErrorResponseInnerError

ImageAnalysisResult

ImageMetadata

ImagePoint

ObjectsResult

PeopleResult

ReadResult

SmartCropsResult

TagsResult

VisualFeature

Dodatkowe zasoby