Udostępnij za pośrednictwem


Image Analysis - Analyze Stream

Analizowanie obrazu wejściowego. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ['image/*', 'application/octet-stream'] lub ładunkiem JSON, który zawiera właściwość adresu URL, która ma być używana do pobierania strumienia obrazu.

POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview
POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

Parametry identyfikatora URI

Nazwa W Wymagane Typ Opis
api-version
query True

string

Żądana wersja interfejsu API.

features
query

VisualFeature[]

Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

gender-neutral-caption
query

boolean

Flaga logiczna umożliwiająca włączanie podpisów neutralnych pod względem płci dla funkcji caption i denseCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false".

language
query

string

Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Zobacz https://aka.ms/cv-languages listę obsługiwanych języków.

model-name
query

string

Nazwa niestandardowego wytrenowanego modelu. Ten parametr należy określić, jeśli nie określono parametru "features".

smartcrops-aspect-ratios
query

string

Lista współczynników proporcji do użycia dla funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania o wysokość. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który widzi, mieści się w zakresie od 0,5 do 2,0 (włącznie).

Treść żądania

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

Nazwa Typ Opis
body

string

Strumień obrazu.

Odpowiedzi

Nazwa Typ Opis
200 OK

ImageAnalysisResult

Powodzenie

Other Status Codes

ErrorResponse

Błąd

Nagłówki

x-ms-error-code: string

Przykłady

AnalyzeImageFromImageStream_CustomModel

Przykładowe żądanie

POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview

"Ynl0ZXM="

Przykładowa odpowiedź

{
  "modelVersion": "2023-04-01-preview",
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "metadata": {
    "width": 660,
    "height": 495
  }
}

Definicje

Nazwa Opis
AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

AdultResult

Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

CaptionResult

Krótki opis obrazu.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

DenseCaption

Krótki opis obrazu.

DenseCaptionsResult

Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

DetectedPerson

Osoba wykryta na obrazie.

DocumentLine

Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.

DocumentPage

Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.

DocumentSpan

Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

DocumentStyle

Obiekt reprezentujący obserwowane style tekstu.

DocumentWord

Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

ErrorResponseDetails

Informacje o błędzie.

ErrorResponseInnerError

Szczegółowy błąd.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

ImageMetadataApiModel

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

ImagePredictionResult

Opisuje wynik przewidywania obrazu.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

ReadResult

Wyniki operacji odczytu.

SmartCropsResult

Wynik inteligentnego przycinania.

Tag

Obserwacja jednostki na obrazie wraz z oceną ufności.

TagsResult

Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

Nazwa Typ Opis
confidence

number

Wartość wskazująca poziom ufności dopasowanej zawartości dla dorosłych.

isMatch

boolean

Wartość wskazująca, czy obraz jest zgodny z zawartością dla dorosłych.

AdultResult

Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.

Nazwa Typ Opis
adult

AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

gore

AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

racy

AdultMatch

Obiekt opisujący dopasowanie zawartości dla dorosłych.

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

Nazwa Typ Opis
h

integer

Wysokość mierzona od lewego górnego punktu obszaru w pikselach.

w

integer

Szerokość mierzona od lewego górnego punktu obszaru w pikselach.

x

integer

Współrzędna lewa górna lewa część obszaru w pikselach.

y

integer

Górna współrzędna lewego górnego punktu obszaru w pikselach.

CaptionResult

Krótki opis obrazu.

Nazwa Typ Opis
confidence

number

Poziom pewności, jaki usługa ma w podpisie.

text

string

Tekst podpisu.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

Nazwa Typ Opis
aspectRatio

number

Współczynnik proporcji regionu przycinania.

boundingBox

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

DenseCaption

Krótki opis obrazu.

Nazwa Typ Opis
boundingBox

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

confidence

number

Poziom pewności, jaki usługa ma w podpisie.

text

string

Tekst podpisu.

DenseCaptionsResult

Lista podpisów.

Nazwa Typ Opis
values

DenseCaption[]

Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

Nazwa Typ Opis
boundingBox

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

id

string

Identyfikator wykrytego obiektu.

tags

Tag[]

Klasyfikacja ufności wykrytego obiektu.

DetectedPerson

Osoba wykryta na obrazie.

Nazwa Typ Opis
boundingBox

BoundingBox

Pole ograniczenia dla obszaru wewnątrz obrazu.

confidence

number

Współczynnik ufności obserwowania osoby na obrazie jako wartości z zakresu od 0 do 1.

DocumentLine

Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.

Nazwa Typ Opis
boundingBox

number[]

Pole ograniczenia wiersza.

content

string

Połączona zawartość zawartych elementów w kolejności odczytu.

spans

DocumentSpan[]

Lokalizacja wiersza w kolejności odczytu połączona zawartość.

DocumentPage

Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.

Nazwa Typ Opis
angle

number

Ogólna orientacja zawartości w kierunku wskazówek zegara, mierzona w stopniach między (-180, 180).

height

number

Wysokość obrazu/pliku PDF odpowiednio w pikselach/calach.

lines

DocumentLine[]

Wyodrębnione wiersze ze strony, potencjalnie zawierające elementy tekstowe i wizualne.

pageNumber

integer

Numer strony 1 w dokumencie wejściowym.

spans

DocumentSpan[]

Lokalizacja strony w kolejności odczytu połączona zawartość.

width

number

Szerokość obrazu/pliku PDF odpowiednio w pikselach/calach.

words

DocumentWord[]

Wyodrębnione wyrazy ze strony.

DocumentSpan

Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

Nazwa Typ Opis
length

integer

Liczba znaków w zawartości reprezentowanej przez zakres.

offset

integer

Indeks na podstawie zera zawartości reprezentowanej przez zakres.

DocumentStyle

Obiekt reprezentujący obserwowane style tekstu.

Nazwa Typ Opis
confidence

number

Pewność prawidłowego identyfikowania stylu.

isHandwritten

boolean

Jest odręcznym zapisem zawartości lub nie.

spans

DocumentSpan[]

Lokalizacja elementów tekstowych w łączonej zawartości, do których ma zastosowanie styl.

DocumentWord

Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

Nazwa Typ Opis
boundingBox

number[]

Pole ograniczenia wyrazu.

confidence

number

Pewność poprawnego wyodrębnienia wyrazu.

content

string

Zawartość tekstowa wyrazu.

span

DocumentSpan

Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

Nazwa Typ Opis
error

ErrorResponseDetails

Informacje o błędzie.

ErrorResponseDetails

Informacje o błędzie.

Nazwa Typ Opis
code

string

Kod błędu.

details

ErrorResponseDetails[]

Lista szczegółowych błędów.

innererror

ErrorResponseInnerError

Szczegółowy błąd.

message

string

Komunikat o błędzie.

target

string

Element docelowy błędu.

ErrorResponseInnerError

Szczegółowy błąd.

Nazwa Typ Opis
code

string

Kod błędu.

innererror

ErrorResponseInnerError

Szczegółowy błąd.

message

string

Komunikat o błędzie.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

Nazwa Typ Opis
adultResult

AdultResult

Obiekt opisujący, czy obraz zawiera zawartość zorientowaną na dorosłych i/lub jest rasistą.

captionResult

CaptionResult

Krótki opis obrazu.

customModelResult

ImagePredictionResult

Opisuje wynik przewidywania obrazu.

denseCaptionsResult

DenseCaptionsResult

Lista podpisów.

metadata

ImageMetadataApiModel

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

modelVersion

string

Wersja modelu.

objectsResult

ObjectsResult

Opisuje wykryte obiekty na obrazie.

peopleResult

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

readResult

ReadResult

Wyniki operacji odczytu.

smartCropsResult

SmartCropsResult

Wynik inteligentnego przycinania.

tagsResult

TagsResult

Lista tagów z poziomem ufności.

ImageMetadataApiModel

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

Nazwa Typ Opis
height

integer

Wysokość obrazu w pikselach.

width

integer

Szerokość obrazu w pikselach.

ImagePredictionResult

Opisuje wynik przewidywania obrazu.

Nazwa Typ Opis
objectsResult

ObjectsResult

Opisuje wykryte obiekty na obrazie.

tagsResult

TagsResult

Lista tagów z poziomem ufności.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

Nazwa Typ Opis
values

DetectedObject[]

Tablica wykrytych obiektów.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

Nazwa Typ Opis
values

DetectedPerson[]

Tablica wykrytych osób.

ReadResult

Wyniki operacji odczytu.

Nazwa Typ Opis
content

string

Łączenie reprezentacji ciągu wszystkich elementów tekstowych i wizualnych w kolejności odczytu.

pages

DocumentPage[]

Lista analizowanych stron.

stringIndexType

string

Metoda używana do obliczania przesunięcia i długości ciągu, możliwe wartości to: "textElements", "unicodeCodePoint", "utf16CodeUnit" itp.

styles

DocumentStyle[]

Wyodrębnione style czcionek.

SmartCropsResult

Wynik inteligentnego przycinania.

Nazwa Typ Opis
values

CropRegion[]

Zalecane regiony do przycinania obrazu.

Tag

Obserwacja jednostki na obrazie wraz z oceną ufności.

Nazwa Typ Opis
confidence

number

Poziom pewności, że zaobserwowano jednostkę.

name

string

Nazwa jednostki.

TagsResult

Lista tagów z poziomem ufności.

Nazwa Typ Opis
values

Tag[]

Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne: tagi, obiekty, podpis, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".

Nazwa Typ Opis
caption

string

denseCaptions

string

objects

string

people

string

read

string

smartCrops

string

tags

string