Image Analysis - Analyze Image

Odwołanie

Usługa:: Azure AI Services

Wersja interfejsu API:: 2023-04-01-preview

Przeanalizuj obraz wejściowy. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ["image/*", "application/octet-stream" lub ładunkiem JSON, który zawiera właściwość adresu URL, która ma być używana do pobierania strumienia obrazu.

POST /imageanalysis:analyze?api-version=2023-04-01-preview

Z parametrami opcjonalnymi:

POST /imageanalysis:analyze?features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

Parametry identyfikatora URI

Nazwa	W	Wymagane	Typ	Opis
api-version	query	True	string	Żądana wersja interfejsu API.
features	query		VisualFeature[]	Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".
gender-neutral-caption	query		boolean	Flaga logiczna umożliwiająca włączanie podpisów neutralnych pod względem płci dla podpisów i funkcji gęstychCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false".
language	query		string	Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Zobacz https://aka.ms/cv-languages listę obsługiwanych języków.
model-name	query		string	Nazwa niestandardowego wytrenowanego modelu. Ten parametr należy określić, jeśli nie określono parametru "features".
smartcrops-aspect-ratios	query		string	Lista współczynników proporcji do użycia dla funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania o wysokość. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który będzie widoczny w zakresie od 0,5 do 2,0 (włącznie).

Treść żądania

Nazwa	Wymagane	Typ	Opis
url	True	string	Publiczny adres URL obrazu.

Odpowiedzi

Nazwa	Typ	Opis
200 OK	ImageAnalysisResult	Powodzenie
Other Status Codes	ErrorResponse	Błąd Nagłówki x-ms-error-code: string

Nazwa

Typ

Opis

200 OK

ImageAnalysisResult

Powodzenie

Other Status Codes

ErrorResponse

Błąd

Nagłówki

x-ms-error-code: string

Przykłady

AnalyzeImage_CustomModel

Przykładowe żądanie

HTTP

POST /imageanalysis:analyze?model-name=my_model_name&api-version=2023-04-01-preview

{
  "url": "https://example.com/image.jpg"
}

Przykładowa odpowiedź

Kod stanu:: 200

{
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "modelVersion": "2023-04-01-preview",
  "metadata": {
    "width": 660,
    "height": 495
  }
}

Definicje

Nazwa	Opis
AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.
AdultResult	Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.
BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
CaptionResult	Krótki opis obrazu.
CropRegion	Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.
DenseCaption	Krótki opis obrazu.
DenseCaptionsResult	Lista podpisów.
DetectedObject	Opisuje wykryty obiekt na obrazie.
DetectedPerson	Osoba wykryta na obrazie.
DocumentLine	Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.
DocumentPage	Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.
DocumentSpan	Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.
DocumentStyle	Obiekt reprezentujący obserwowane style tekstu.
DocumentWord	Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.
ErrorResponse	Odpowiedź zwrócona po wystąpieniu błędu.
ErrorResponseDetails	Informacje o błędzie.
ErrorResponseInnerError	Szczegółowy błąd.
ImageAnalysisResult	Opisz połączone wyniki różnych typów analizy obrazów.
ImageMetadataApiModel	Informacje o metadanych obrazu, takie jak wysokość i szerokość.
ImagePredictionResult	Opisuje wynik przewidywania obrazu.
ImageUrl	Dokument JSON z adresem URL wskazującym obraz, który ma zostać przeanalizowany.
ObjectsResult	Opisuje wykryte obiekty na obrazie.
PeopleResult	Obiekt opisujący, czy obraz zawiera osoby.
ReadResult	Wyniki operacji odczytu.
SmartCropsResult	Inteligentny wynik przycinania.
Tag	Obserwacja jednostki na obrazie wraz z wynikiem ufności.
TagsResult	Lista tagów z poziomem ufności.
VisualFeature	Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

Nazwa	Typ	Opis
confidence	number	Wartość wskazująca poziom ufności dopasowanej zawartości dla dorosłych.
isMatch	boolean	Wartość wskazująca, czy obraz jest zgodny z zawartością dla dorosłych.

AdultResult

Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.

Nazwa	Typ	Opis
adult	AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.
gore	AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.
racy	AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

Nazwa	Typ	Opis
h	integer	Wysokość mierzona od lewego górnego punktu obszaru w pikselach.
w	integer	Szerokość mierzona od lewego górnego punktu obszaru w pikselach.
x	integer	Współrzędna lewa w lewym górnym punkcie obszaru w pikselach.
y	integer	Górna współrzędna lewego górnego punktu obszaru w pikselach.

CaptionResult

Krótki opis obrazu.

Nazwa	Typ	Opis
confidence	number	Poziom pewności, jaki usługa ma w podpisie.
text	string	Tekst podpisu.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

Nazwa	Typ	Opis
aspectRatio	number	Współczynnik proporcji regionu przycinania.
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.

DenseCaption

Krótki opis obrazu.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
confidence	number	Poziom pewności, jaki usługa ma w podpisie.
text	string	Tekst podpisu.

DenseCaptionsResult

Lista podpisów.

Nazwa	Typ	Opis
values	DenseCaption[]	Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
id	string	Identyfikator wykrytego obiektu.
tags	Tag[]	Zaufania klasyfikacji wykrytego obiektu.

DetectedPerson

Osoba wykryta na obrazie.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia obszaru wewnątrz obrazu.
confidence	number	Wskaźnik ufności obserwowania osoby na obrazie jako wartość z zakresu od 0 do 1.

DocumentLine

Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.

Nazwa	Typ	Opis
boundingBox	number[]	Pole ograniczenia linii.
content	string	Połączona zawartość zawartych elementów w kolejności odczytu.
spans	DocumentSpan[]	Lokalizacja wiersza w kolejności odczytu łączy zawartość.

DocumentPage

Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.

Nazwa	Typ	Opis
angle	number	Ogólna orientacja zawartości w kierunku zegara mierzona w stopniach między (-180, 180).
height	number	Wysokość obrazu/pliku PDF w pikselach/calach, odpowiednio.
lines	DocumentLine[]	Wyodrębnione wiersze ze strony, potencjalnie zawierające zarówno elementy tekstowe, jak i wizualne.
pageNumber	integer	Numer strony 1 w dokumencie wejściowym.
spans	DocumentSpan[]	Lokalizacja strony w kolejności odczytu łączy zawartość.
width	number	Szerokość obrazu/formatu PDF w pikselach/calach, odpowiednio.
words	DocumentWord[]	Wyodrębnione wyrazy ze strony.

DocumentSpan

Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

Nazwa	Typ	Opis
length	integer	Liczba znaków w zawartości reprezentowanej przez zakres.
offset	integer	Zero oparty na indeksie zawartości reprezentowanej przez zakres.

DocumentStyle

Obiekt reprezentujący obserwowane style tekstu.

Nazwa	Typ	Opis
confidence	number	Pewność prawidłowego identyfikowania stylu.
isHandwritten	boolean	To zawartość odręczna lub nie.
spans	DocumentSpan[]	Lokalizacja elementów tekstowych w powiązanej zawartości, do których ma zastosowanie styl.

DocumentWord

Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

Nazwa	Typ	Opis
boundingBox	number[]	Pole ograniczenia wyrazu.
confidence	number	Pewność prawidłowego wyodrębnienia wyrazu.
content	string	Zawartość tekstowa wyrazu.
span	DocumentSpan	Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

Nazwa	Typ	Opis
error	ErrorResponseDetails	Informacje o błędzie.

ErrorResponseDetails

Informacje o błędzie.

Nazwa	Typ	Opis
code	string	Kod błędu.
details	ErrorResponseDetails[]	Lista szczegółowych błędów.
innererror	ErrorResponseInnerError	Szczegółowy błąd.
message	string	Komunikat o błędzie.
target	string	Element docelowy błędu.

ErrorResponseInnerError

Szczegółowy błąd.

Nazwa	Typ	Opis
code	string	Kod błędu.
innererror	ErrorResponseInnerError	Szczegółowy błąd.
message	string	Komunikat o błędzie.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

Nazwa	Typ	Opis
adultResult	AdultResult	Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.
captionResult	CaptionResult	Krótki opis obrazu.
customModelResult	ImagePredictionResult	Opisuje wynik przewidywania obrazu.
denseCaptionsResult	DenseCaptionsResult	Lista podpisów.
metadata	ImageMetadataApiModel	Informacje o metadanych obrazu, takie jak wysokość i szerokość.
modelVersion	string	Wersja modelu.
objectsResult	ObjectsResult	Opisuje wykryte obiekty na obrazie.
peopleResult	PeopleResult	Obiekt opisujący, czy obraz zawiera osoby.
readResult	ReadResult	Wyniki operacji odczytu.
smartCropsResult	SmartCropsResult	Inteligentny wynik przycinania.
tagsResult	TagsResult	Lista tagów z poziomem ufności.

ImageMetadataApiModel

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

Nazwa	Typ	Opis
height	integer	Wysokość obrazu w pikselach.
width	integer	Szerokość obrazu w pikselach.

ImagePredictionResult

Opisuje wynik przewidywania obrazu.

Nazwa	Typ	Opis
objectsResult	ObjectsResult	Opisuje wykryte obiekty na obrazie.
tagsResult	TagsResult	Lista tagów z poziomem ufności.

ImageUrl

Dokument JSON z adresem URL wskazującym obraz, który ma zostać przeanalizowany.

Nazwa	Typ	Opis
url	string	Publiczny adres URL obrazu.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

Nazwa	Typ	Opis
values	DetectedObject[]	Tablica wykrytych obiektów.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

Nazwa	Typ	Opis
values	DetectedPerson[]	Tablica wykrytych osób.

ReadResult

Wyniki operacji odczytu.

Nazwa	Typ	Opis
content	string	Połącz reprezentację ciągu ze wszystkimi elementami tekstowymi i wizualnymi w kolejności odczytu.
pages	DocumentPage[]	Lista analizowanych stron.
stringIndexType	string	Metoda używana do obliczania przesunięcia i długości ciągu, możliwe wartości to: "textElements", "unicodeCodePoint", "utf16CodeUnit" itp.
styles	DocumentStyle[]	Wyodrębnione style czcionek.

SmartCropsResult

Inteligentny wynik przycinania.

Nazwa	Typ	Opis
values	CropRegion[]	Zalecane regiony do przycinania obrazu.

Tag

Obserwacja jednostki na obrazie wraz z wynikiem ufności.

Nazwa	Typ	Opis
confidence	number	Poziom pewności, że zaobserwowano jednostkę.
name	string	Nazwa jednostki.

TagsResult

Lista tagów z poziomem ufności.

Nazwa	Typ	Opis
values	Tag[]	Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

Nazwa	Typ	Opis
caption	string
denseCaptions	string
objects	string
people	string
read	string
smartCrops	string
tags	string

Udostępnij za pośrednictwem

Image Analysis - Analyze Image

Parametry identyfikatora URI

Treść żądania

Odpowiedzi

Przykłady

AnalyzeImage_CustomModel

Przykładowe żądanie

Przykładowa odpowiedź

Definicje

AdultMatch

AdultResult

BoundingBox

CaptionResult

CropRegion

DenseCaption

DenseCaptionsResult

DetectedObject

DetectedPerson

DocumentLine

DocumentPage

DocumentSpan

DocumentStyle

DocumentWord

ErrorResponse

ErrorResponseDetails

ErrorResponseInnerError

ImageAnalysisResult

ImageMetadataApiModel

ImagePredictionResult

ImageUrl

ObjectsResult

PeopleResult

ReadResult

SmartCropsResult

Tag

TagsResult

VisualFeature

Dodatkowe zasoby