Image Analysis - Analyze Stream

Odwołanie

Usługa:: Azure AI Services

Wersja interfejsu API:: 2023-04-01-preview

Analizowanie obrazu wejściowego. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ['image/*', 'application/octet-stream'] lub ładunkiem JSON, który zawiera właściwość adresu URL, która ma być używana do pobierania strumienia obrazu.

POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview

Z parametrami opcjonalnymi:

POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

Parametry identyfikatora URI

Nazwa	W	Wymagane	Typ	Opis
api-version	query	True	string	Żądana wersja interfejsu API.
features	query		VisualFeature[]	Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".
gender-neutral-caption	query		boolean	Flaga logiczna umożliwiająca włączanie podpisów neutralnych pod względem płci dla funkcji caption i denseCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false".
language	query		string	Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Zobacz https://aka.ms/cv-languages listę obsługiwanych języków.
model-name	query		string	Nazwa niestandardowego wytrenowanego modelu. Ten parametr należy określić, jeśli nie określono parametru "features".
smartcrops-aspect-ratios	query		string	Lista współczynników proporcji do użycia dla funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania o wysokość. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który widzi, mieści się w zakresie od 0,5 do 2,0 (włącznie).

Treść żądania

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

Nazwa	Typ	Opis
body	string	Strumień obrazu.

Odpowiedzi

Nazwa	Typ	Opis
200 OK	ImageAnalysisResult	Powodzenie
Other Status Codes	ErrorResponse	Błąd Nagłówki x-ms-error-code: string

Nazwa

Typ

Opis

200 OK

ImageAnalysisResult

Powodzenie

Other Status Codes

ErrorResponse

Błąd

Nagłówki

x-ms-error-code: string

Przykłady

AnalyzeImageFromImageStream_CustomModel

Przykładowe żądanie

HTTP

POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview

"Ynl0ZXM="

Przykładowa odpowiedź

Kod stanu:: 200

{
  "modelVersion": "2023-04-01-preview",
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "metadata": {
    "width": 660,
    "height": 495
  }
}

Definicje

Nazwa	Opis
AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.
AdultResult	Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.
BoundingBox	Pole ograniczenia dla obszaru wewnątrz obrazu.
CaptionResult	Krótki opis obrazu.
CropRegion	Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.
DenseCaption	Krótki opis obrazu.
DenseCaptionsResult	Lista podpisów.
DetectedObject	Opisuje wykryty obiekt na obrazie.
DetectedPerson	Osoba wykryta na obrazie.
DocumentLine	Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.
DocumentPage	Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.
DocumentSpan	Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.
DocumentStyle	Obiekt reprezentujący obserwowane style tekstu.
DocumentWord	Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.
ErrorResponse	Odpowiedź zwrócona po wystąpieniu błędu.
ErrorResponseDetails	Informacje o błędzie.
ErrorResponseInnerError	Szczegółowy błąd.
ImageAnalysisResult	Opisz połączone wyniki różnych typów analizy obrazów.
ImageMetadataApiModel	Informacje o metadanych obrazu, takie jak wysokość i szerokość.
ImagePredictionResult	Opisuje wynik przewidywania obrazu.
ObjectsResult	Opisuje wykryte obiekty na obrazie.
PeopleResult	Obiekt opisujący, czy obraz zawiera osoby.
ReadResult	Wyniki operacji odczytu.
SmartCropsResult	Wynik inteligentnego przycinania.
Tag	Obserwacja jednostki na obrazie wraz z oceną ufności.
TagsResult	Lista tagów z poziomem ufności.
VisualFeature	Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

Nazwa	Typ	Opis
confidence	number	Wartość wskazująca poziom ufności dopasowanej zawartości dla dorosłych.
isMatch	boolean	Wartość wskazująca, czy obraz jest zgodny z zawartością dla dorosłych.

AdultResult

Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.

Nazwa	Typ	Opis
adult	AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.
gore	AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.
racy	AdultMatch	Obiekt opisujący dopasowanie zawartości dla dorosłych.

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

Nazwa	Typ	Opis
h	integer	Wysokość mierzona od lewego górnego punktu obszaru w pikselach.
w	integer	Szerokość mierzona od lewego górnego punktu obszaru w pikselach.
x	integer	Współrzędna lewa górna lewa część obszaru w pikselach.
y	integer	Górna współrzędna lewego górnego punktu obszaru w pikselach.

CaptionResult

Krótki opis obrazu.

Nazwa	Typ	Opis
confidence	number	Poziom pewności, jaki usługa ma w podpisie.
text	string	Tekst podpisu.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

Nazwa	Typ	Opis
aspectRatio	number	Współczynnik proporcji regionu przycinania.
boundingBox	BoundingBox	Pole ograniczenia dla obszaru wewnątrz obrazu.

DenseCaption

Krótki opis obrazu.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia dla obszaru wewnątrz obrazu.
confidence	number	Poziom pewności, jaki usługa ma w podpisie.
text	string	Tekst podpisu.

DenseCaptionsResult

Lista podpisów.

Nazwa	Typ	Opis
values	DenseCaption[]	Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia dla obszaru wewnątrz obrazu.
id	string	Identyfikator wykrytego obiektu.
tags	Tag[]	Klasyfikacja ufności wykrytego obiektu.

DetectedPerson

Osoba wykryta na obrazie.

Nazwa	Typ	Opis
boundingBox	BoundingBox	Pole ograniczenia dla obszaru wewnątrz obrazu.
confidence	number	Współczynnik ufności obserwowania osoby na obrazie jako wartości z zakresu od 0 do 1.

DocumentLine

Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.

Nazwa	Typ	Opis
boundingBox	number[]	Pole ograniczenia wiersza.
content	string	Połączona zawartość zawartych elementów w kolejności odczytu.
spans	DocumentSpan[]	Lokalizacja wiersza w kolejności odczytu połączona zawartość.

DocumentPage

Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.

Nazwa	Typ	Opis
angle	number	Ogólna orientacja zawartości w kierunku wskazówek zegara, mierzona w stopniach między (-180, 180).
height	number	Wysokość obrazu/pliku PDF odpowiednio w pikselach/calach.
lines	DocumentLine[]	Wyodrębnione wiersze ze strony, potencjalnie zawierające elementy tekstowe i wizualne.
pageNumber	integer	Numer strony 1 w dokumencie wejściowym.
spans	DocumentSpan[]	Lokalizacja strony w kolejności odczytu połączona zawartość.
width	number	Szerokość obrazu/pliku PDF odpowiednio w pikselach/calach.
words	DocumentWord[]	Wyodrębnione wyrazy ze strony.

DocumentSpan

Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

Nazwa	Typ	Opis
length	integer	Liczba znaków w zawartości reprezentowanej przez zakres.
offset	integer	Indeks na podstawie zera zawartości reprezentowanej przez zakres.

DocumentStyle

Obiekt reprezentujący obserwowane style tekstu.

Nazwa	Typ	Opis
confidence	number	Pewność prawidłowego identyfikowania stylu.
isHandwritten	boolean	Jest odręcznym zapisem zawartości lub nie.
spans	DocumentSpan[]	Lokalizacja elementów tekstowych w łączonej zawartości, do których ma zastosowanie styl.

DocumentWord

Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

Nazwa	Typ	Opis
boundingBox	number[]	Pole ograniczenia wyrazu.
confidence	number	Pewność poprawnego wyodrębnienia wyrazu.
content	string	Zawartość tekstowa wyrazu.
span	DocumentSpan	Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

Nazwa	Typ	Opis
error	ErrorResponseDetails	Informacje o błędzie.

ErrorResponseDetails

Informacje o błędzie.

Nazwa	Typ	Opis
code	string	Kod błędu.
details	ErrorResponseDetails[]	Lista szczegółowych błędów.
innererror	ErrorResponseInnerError	Szczegółowy błąd.
message	string	Komunikat o błędzie.
target	string	Element docelowy błędu.

ErrorResponseInnerError

Szczegółowy błąd.

Nazwa	Typ	Opis
code	string	Kod błędu.
innererror	ErrorResponseInnerError	Szczegółowy błąd.
message	string	Komunikat o błędzie.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

Nazwa	Typ	Opis
adultResult	AdultResult	Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.
captionResult	CaptionResult	Krótki opis obrazu.
customModelResult	ImagePredictionResult	Opisuje wynik przewidywania obrazu.
denseCaptionsResult	DenseCaptionsResult	Lista podpisów.
metadata	ImageMetadataApiModel	Informacje o metadanych obrazu, takie jak wysokość i szerokość.
modelVersion	string	Wersja modelu.
objectsResult	ObjectsResult	Opisuje wykryte obiekty na obrazie.
peopleResult	PeopleResult	Obiekt opisujący, czy obraz zawiera osoby.
readResult	ReadResult	Wyniki operacji odczytu.
smartCropsResult	SmartCropsResult	Wynik inteligentnego przycinania.
tagsResult	TagsResult	Lista tagów z poziomem ufności.

ImageMetadataApiModel

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

Nazwa	Typ	Opis
height	integer	Wysokość obrazu w pikselach.
width	integer	Szerokość obrazu w pikselach.

ImagePredictionResult

Opisuje wynik przewidywania obrazu.

Nazwa	Typ	Opis
objectsResult	ObjectsResult	Opisuje wykryte obiekty na obrazie.
tagsResult	TagsResult	Lista tagów z poziomem ufności.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

Nazwa	Typ	Opis
values	DetectedObject[]	Tablica wykrytych obiektów.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

Nazwa	Typ	Opis
values	DetectedPerson[]	Tablica wykrytych osób.

ReadResult

Wyniki operacji odczytu.

Nazwa	Typ	Opis
content	string	Łączenie reprezentacji ciągu wszystkich elementów tekstowych i wizualnych w kolejności odczytu.
pages	DocumentPage[]	Lista analizowanych stron.
stringIndexType	string	Metoda używana do obliczania przesunięcia i długości ciągu, możliwe wartości to: "textElements", "unicodeCodePoint", "utf16CodeUnit" itp.
styles	DocumentStyle[]	Wyodrębnione style czcionek.

SmartCropsResult

Wynik inteligentnego przycinania.

Nazwa	Typ	Opis
values	CropRegion[]	Zalecane regiony do przycinania obrazu.

Tag

Obserwacja jednostki na obrazie wraz z oceną ufności.

Nazwa	Typ	Opis
confidence	number	Poziom pewności, że zaobserwowano jednostkę.
name	string	Nazwa jednostki.

TagsResult

Lista tagów z poziomem ufności.

Nazwa	Typ	Opis
values	Tag[]	Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

Nazwa	Typ	Opis
caption	string
denseCaptions	string
objects	string
people	string
read	string
smartCrops	string
tags	string

Udostępnij za pośrednictwem

Image Analysis - Analyze Stream

Parametry identyfikatora URI

Treść żądania

Odpowiedzi

Przykłady

AnalyzeImageFromImageStream_CustomModel

Przykładowe żądanie

Przykładowa odpowiedź

Definicje

AdultMatch

AdultResult

BoundingBox

CaptionResult

CropRegion

DenseCaption

DenseCaptionsResult

DetectedObject

DetectedPerson

DocumentLine

DocumentPage

DocumentSpan

DocumentStyle

DocumentWord

ErrorResponse

ErrorResponseDetails

ErrorResponseInnerError

ImageAnalysisResult

ImageMetadataApiModel

ImagePredictionResult

ObjectsResult

PeopleResult

ReadResult

SmartCropsResult

Tag

TagsResult

VisualFeature

Dodatkowe zasoby