Udostępnij za pośrednictwem


Analyze - Image

Przeanalizuj obraz wejściowy. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ["image/*", "application/octet-stream" lub ładunkiem JSON, który zawiera właściwość adresu URL, która ma być używana do pobierania strumienia obrazu.

POST /imageanalysis:analyze?api-version=2024-02-01
POST /imageanalysis:analyze?features={features}&language={language}&model-version={model-version}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01

Parametry identyfikatora URI

Nazwa W Wymagane Typ Opis
api-version
query True

string

Żądana wersja interfejsu API.

features
query

VisualFeature[]

Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.

gender-neutral-caption
query

boolean

Flaga logiczna umożliwiająca włączanie podpisów neutralnych pod względem płci dla funkcji caption i denseCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false".

language
query

string

Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Zobacz https://aka.ms/cv-languages listę obsługiwanych języków.

model-version
query

string

Wersja modelu.

smartcrops-aspect-ratios
query

array[]

Lista współczynników proporcji do użycia dla funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania o wysokość. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który widzi, mieści się w zakresie od 0,5 do 2,0 (włącznie).

Treść żądania

Nazwa Wymagane Typ Opis
url True

string

Publiczny adres URL obrazu.

Odpowiedzi

Nazwa Typ Opis
200 OK

ImageAnalysisResult

Powodzenie

Other Status Codes

ErrorResponse

Błąd

Nagłówki

x-ms-error-code: string

Przykłady

ImageAnalysis_Analyze_MaximumSet_Gen
ImageAnalysis_Analyze_MinimumSet_Gen

ImageAnalysis_Analyze_MaximumSet_Gen

Przykładowe żądanie

POST /imageanalysis:analyze?features=tags&language=hduryxtlvjjvwnmpjiojibvjy&model-version=kkblitshktun&smartcrops-aspect-ratios=&gender-neutral-caption=True&api-version=2024-02-01

{
  "url": "https://microsoft.com/a"
}

Przykładowa odpowiedź

{
  "captionResult": {
    "text": "azcggjzjuvbytsq",
    "confidence": 0
  },
  "objectsResult": {
    "values": [
      {
        "id": "iaofvdltgfjrsffgltupmo",
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        },
        "tags": [
          {
            "name": "expoctetvqe",
            "confidence": 0
          }
        ]
      }
    ]
  },
  "readResult": {
    "blocks": [
      {
        "lines": [
          {
            "text": "npk",
            "boundingPolygon": [
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              }
            ],
            "words": [
              {
                "text": "wljuxeeadklupdpxgcinka",
                "boundingPolygon": [
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  }
                ],
                "confidence": 0
              }
            ]
          }
        ]
      }
    ]
  },
  "denseCaptionsResult": {
    "values": [
      {
        "text": "pqrcyrtz",
        "confidence": 0,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        }
      }
    ]
  },
  "modelVersion": "hslbdtpcuyabri",
  "metadata": {
    "width": 10,
    "height": 27
  },
  "tagsResult": {
    "values": [
      {
        "name": "expoctetvqe",
        "confidence": 0
      }
    ]
  },
  "smartCropsResult": {
    "values": [
      {
        "aspectRatio": 23,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        }
      }
    ]
  },
  "peopleResult": {
    "values": [
      {
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 27,
          "h": 13
        },
        "confidence": 0
      }
    ]
  }
}

ImageAnalysis_Analyze_MinimumSet_Gen

Przykładowe żądanie

POST /imageanalysis:analyze?api-version=2024-02-01

{
  "url": "https://www.abc.com"
}

Przykładowa odpowiedź

{
  "modelVersion": "cvhbhwpfswz",
  "metadata": {
    "width": 10,
    "height": 23
  }
}

Definicje

Nazwa Opis
BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

CaptionResult

Krótki opis obrazu.

ContentTag

Obserwacja jednostki na obrazie wraz z wynikiem ufności.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

DenseCaption

Krótki opis obrazu.

DenseCaptionsResult

Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

DetectedPerson

Osoba wykryta na obrazie.

DetectedTextBlock

Wykryty blok tekstu.

DetectedTextLine

Wykryty wiersz tekstu.

DetectedTextWord

Wykryte słowo składające się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

ErrorResponseDetails

Informacje o błędzie.

ErrorResponseInnerError

Szczegółowy błąd.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

ImageMetadata

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

ImagePoint

Obiekt reprezentujący punkt na obrazie.

ImageUrl

Dokument JSON z adresem URL wskazującym na publicznie dostępny obraz do przeanalizowania.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

ReadResult

Wyniki operacji odczytu.

SmartCropsResult

Inteligentny wynik przycinania.

TagsResult

Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

Nazwa Typ Opis
h

integer

Wysokość mierzona od lewego górnego punktu obszaru w pikselach.

w

integer

Szerokość mierzona od lewego górnego punktu obszaru w pikselach.

x

integer

Współrzędna lewa w lewym górnym punkcie obszaru w pikselach.

y

integer

Górna współrzędna lewego górnego punktu obszaru w pikselach.

CaptionResult

Krótki opis obrazu.

Nazwa Typ Opis
confidence

number

Poziom pewności, jaki usługa ma w podpisie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.

text

string

Tekst podpisu.

ContentTag

Obserwacja jednostki na obrazie wraz z wynikiem ufności.

Nazwa Typ Opis
confidence

number

Poziom pewności, że zaobserwowano jednostkę. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.

name

string

Nazwa jednostki.

CropRegion

Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.

Nazwa Typ Opis
aspectRatio

number

Współczynnik proporcji regionu przycinania.

boundingBox

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

DenseCaption

Krótki opis obrazu.

Nazwa Typ Opis
boundingBox

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

confidence

number

Poziom pewności, jaki usługa ma w podpisie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.

text

string

Tekst podpisu.

DenseCaptionsResult

Lista podpisów.

Nazwa Typ Opis
values

DenseCaption[]

Lista podpisów.

DetectedObject

Opisuje wykryty obiekt na obrazie.

Nazwa Typ Opis
boundingBox

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

id

string

Identyfikator wykrytego obiektu.

tags

ContentTag[]

Zaufania klasyfikacji wykrytego obiektu.

DetectedPerson

Osoba wykryta na obrazie.

Nazwa Typ Opis
boundingBox

BoundingBox

Pole ograniczenia obszaru wewnątrz obrazu.

confidence

number

Wskaźnik ufności obserwowania osoby na obrazie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.

DetectedTextBlock

Wykryty blok tekstu.

Nazwa Typ Opis
lines

DetectedTextLine[]

Lista wierszy tekstowych w bloku tekstowym.

DetectedTextLine

Wykryty wiersz tekstu.

Nazwa Typ Opis
boundingPolygon

ImagePoint[]

Powiązanie wielokąta wiersza tekstu.

text

string

Zawartość tekstowa wykrytego wiersza tekstu.

words

DetectedTextWord[]

Lista wyrazów w wierszu tekstu.

DetectedTextWord

Wykryte słowo składające się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.

Nazwa Typ Opis
boundingPolygon

ImagePoint[]

Wiązanie wielokąta wyrazu.

confidence

number

Poziom pewności, że słowo zostało wykryte. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania.

text

string

Zawartość tekstowa wyrazu.

ErrorResponse

Odpowiedź zwrócona po wystąpieniu błędu.

Nazwa Typ Opis
error

ErrorResponseDetails

Informacje o błędzie.

ErrorResponseDetails

Informacje o błędzie.

Nazwa Typ Opis
code

string

Kod błędu.

details

ErrorResponseDetails[]

Lista szczegółowych błędów.

innererror

ErrorResponseInnerError

Szczegółowy błąd.

message

string

Komunikat o błędzie.

target

string

Element docelowy błędu.

ErrorResponseInnerError

Szczegółowy błąd.

Nazwa Typ Opis
code

string

Kod błędu.

innererror

ErrorResponseInnerError

Szczegółowy błąd.

message

string

Komunikat o błędzie.

ImageAnalysisResult

Opisz połączone wyniki różnych typów analizy obrazów.

Nazwa Typ Opis
captionResult

CaptionResult

Krótki opis obrazu.

denseCaptionsResult

DenseCaptionsResult

Lista podpisów.

metadata

ImageMetadata

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

modelVersion

string

Wersja modelu.

objectsResult

ObjectsResult

Opisuje wykryte obiekty na obrazie.

peopleResult

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

readResult

ReadResult

Wyniki operacji odczytu.

smartCropsResult

SmartCropsResult

Inteligentny wynik przycinania.

tagsResult

TagsResult

Lista tagów z poziomem ufności.

ImageMetadata

Informacje o metadanych obrazu, takie jak wysokość i szerokość.

Nazwa Typ Opis
height

integer

Wysokość obrazu w pikselach.

width

integer

Szerokość obrazu w pikselach.

ImagePoint

Obiekt reprezentujący punkt na obrazie.

Nazwa Typ Opis
x

integer

Współrzędna x tego punktu.

y

integer

Współrzędna y tego punktu.

ImageUrl

Dokument JSON z adresem URL wskazującym na publicznie dostępny obraz do przeanalizowania.

Nazwa Typ Opis
url

string

Publiczny adres URL obrazu.

ObjectsResult

Opisuje wykryte obiekty na obrazie.

Nazwa Typ Opis
values

DetectedObject[]

Tablica wykrytych obiektów.

PeopleResult

Obiekt opisujący, czy obraz zawiera osoby.

Nazwa Typ Opis
values

DetectedPerson[]

Tablica wykrytych osób.

ReadResult

Wyniki operacji odczytu.

Nazwa Typ Opis
blocks

DetectedTextBlock[]

Lista bloków tekstowych.

SmartCropsResult

Inteligentny wynik przycinania.

Nazwa Typ Opis
values

CropRegion[]

Zalecane regiony do przycinania obrazu.

TagsResult

Lista tagów z poziomem ufności.

Nazwa Typ Opis
values

ContentTag[]

Lista tagów z poziomem ufności.

VisualFeature

Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.

Nazwa Typ Opis
caption

string

Opis lub podpis podsumowujący zawartość obrazu.

denseCaptions

string

Szczegółowe podpisy zawierające szczegółowe opisy zawartości obrazu.

objects

string

Określone obiekty rozpoznane i oznaczone etykietą na obrazie.

people

string

Wykrywanie i analiza osób na obrazie.

read

string

Zawartość tekstowa wyodrębniona z obrazu, taka jak znaki lub etykiety.

smartCrops

string

Automatycznie wygenerowane przycięte wersje obrazu koncentrują się na ważnej zawartości.

tags

string

Tagi wizualne reprezentujące obiekty wykryte na obrazie.