Sdílet prostřednictvím


Analyze - Image Stream

Analyzujte vstupní obrázek. Požadavek obsahuje datový proud obrázků s libovolným typem obsahu ['image/*', 'application/octet-stream'].

POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01
POST /imageanalysis:analyze?overload=stream&features={features}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
api-version
query True

string

Požadovaná verze rozhraní API

features
query

VisualFeature[]

Požadované funkce vizuálu Musí být zadána alespoň jedna vizuální funkce.

gender-neutral-caption
query

boolean

Logický příznak pro povolení genderově neutrálních titulků pro funkce titulků a funkce denseCaptions Pokud tento parametr není zadaný, výchozí hodnota je "false".

language
query

string

Požadovaný jazyk pro generování výstupu. Pokud tento parametr není zadaný, výchozí hodnota je "en". Podívejte https://aka.ms/cv-languages se na seznam podporovaných jazyků.

smartcrops-aspect-ratios
query

array[]

Seznam poměrů stran, které se mají použít pro funkci smartCrops. Poměry stran se počítají vydělením cílové šířky oříznutí výškou. Podporované hodnoty jsou mezi 0,75 a 1,8 (včetně). Více hodnot by mělo být oddělené čárkami. Pokud tento parametr není zadaný, služba vrátí jeden návrh oříznutí s poměrem stran, který je podle ní vhodný od 0,5 do 2,0 (včetně).

Text požadavku

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

Name Typ Description
body

string

Datový proud obrázku.

Odpovědi

Name Typ Description
200 OK

ImageAnalysisResult

Success

Other Status Codes

ErrorResponse

Chybová

Hlavičky

x-ms-error-code: string

Příklady

ImageAnalysis_Analyze_MaximumSet_Gen
ImageAnalysis_Analyze_MinimumSet_Gen

ImageAnalysis_Analyze_MaximumSet_Gen

Ukázkový požadavek

POST /imageanalysis:analyze?overload=stream&features=tags&language=zizuomdsxccdx&smartcrops-aspect-ratios=vqkmzmvchiwlxdaikxqrsbrpvyq&gender-neutral-caption=True&api-version=2024-02-01

"Ynl0ZXM="

Ukázková odpověď

{
  "captionResult": {
    "text": "wjtogwbozwgawzxikwsvs",
    "confidence": 0
  },
  "objectsResult": {
    "values": [
      {
        "id": "bcvupjoxcviiz",
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        },
        "tags": [
          {
            "name": "ikiqzvbmyrbuskhpphgjjuzvl",
            "confidence": 0
          }
        ]
      }
    ]
  },
  "readResult": {
    "blocks": [
      {
        "lines": [
          {
            "text": "ufmjctoebx",
            "boundingPolygon": [
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              },
              {
                "x": 0,
                "y": 0
              }
            ],
            "words": [
              {
                "text": "cpcsgoi",
                "boundingPolygon": [
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  },
                  {
                    "x": 0,
                    "y": 0
                  }
                ],
                "confidence": 0
              }
            ]
          }
        ]
      }
    ]
  },
  "denseCaptionsResult": {
    "values": [
      {
        "text": "hgvxqwxwqgtjfippp",
        "confidence": 0,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        }
      }
    ]
  },
  "modelVersion": "lymqyonwrxckwzrsxjihbceclts",
  "metadata": {
    "width": 28,
    "height": 7
  },
  "tagsResult": {
    "values": [
      {
        "name": "ikiqzvbmyrbuskhpphgjjuzvl",
        "confidence": 0
      }
    ]
  },
  "smartCropsResult": {
    "values": [
      {
        "aspectRatio": 7,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        }
      }
    ]
  },
  "peopleResult": {
    "values": [
      {
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 24,
          "h": 5
        },
        "confidence": 0
      }
    ]
  }
}

ImageAnalysis_Analyze_MinimumSet_Gen

Ukázkový požadavek

POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01

"Ynl0ZXM="

Ukázková odpověď

{
  "modelVersion": "lymqyonwrxckwzrsxjihbceclts",
  "metadata": {
    "width": 28,
    "height": 7
  }
}

Definice

Name Description
BoundingBox

Ohraničující rámeček pro oblast uvnitř obrázku.

CaptionResult

Stručný popis toho, co obrázek znázorňuje.

ContentTag

Pozorování entity na obrázku spolu se skóre spolehlivosti.

CropRegion

Oblast určená pro inteligentní oříznutí. Pro každý požadovaný poměr stran se vrátí jedna oblast.

DenseCaption

Stručný popis toho, co obrázek znázorňuje.

DenseCaptionsResult

Seznam titulků.

DetectedObject

Popisuje zjištěný objekt na obrázku.

DetectedPerson

Osoba detekovaná na obrázku.

DetectedTextBlock

Zjištěný blok textu.

DetectedTextLine

Zjištěný textový řádek.

DetectedTextWord

Rozpoznané slovo skládající se z souvislé posloupnosti znaků. U jazyků, které nejsou oddělené mezerami, jako je čínština, japonština a korejština, je každý znak reprezentován jako vlastní slovo.

ErrorResponse

Odpověď vrácená, když dojde k chybě.

ErrorResponseDetails

Informace o chybě.

ErrorResponseInnerError

Podrobná chyba

ImageAnalysisResult

Popište kombinované výsledky různých typů analýzy obrázků.

ImageMetadata

Informace o metadatech obrázku, jako je výška a šířka.

ImagePoint

Objekt představující bod na obrázku.

ObjectsResult

Popisuje zjištěné objekty na obrázku.

PeopleResult

Objekt popisující, jestli obrázek obsahuje osoby.

ReadResult

Výsledky operace čtení.

SmartCropsResult

Výsledek inteligentního oříznutí.

TagsResult

Seznam značek s úrovní spolehlivosti

VisualFeature

Požadované funkce vizuálu Musí být zadána alespoň jedna vizuální funkce.

BoundingBox

Ohraničující rámeček pro oblast uvnitř obrázku.

Name Typ Description
h

integer

Výška měřená od levého horního bodu oblasti v pixelech.

w

integer

Šířka měřená od levého horního bodu oblasti v pixelech.

x

integer

Levá souřadnice levého horního bodu oblasti v pixelech

y

integer

Souřadnice horního levého horního bodu oblasti v pixelech

CaptionResult

Stručný popis toho, co obrázek znázorňuje.

Name Typ Description
confidence

number

Úroveň spolehlivosti, které má služba v titulku. Skóre spolehlivosti zahrnují rozsah od 0,0 do 1,0 (včetně), přičemž vyšší hodnoty označují vyšší spolehlivost shody.

text

string

Text titulku.

ContentTag

Pozorování entity na obrázku spolu se skóre spolehlivosti.

Name Typ Description
confidence

number

Úroveň spolehlivosti, kterou entita zaznamenala. Skóre spolehlivosti zahrnují rozsah od 0,0 do 1,0 (včetně), přičemž vyšší hodnoty označují vyšší spolehlivost shody.

name

string

Název entity.

CropRegion

Oblast určená pro inteligentní oříznutí. Pro každý požadovaný poměr stran se vrátí jedna oblast.

Name Typ Description
aspectRatio

number

Poměr stran oblasti oříznutí.

boundingBox

BoundingBox

Ohraničující rámeček pro oblast uvnitř obrázku.

DenseCaption

Stručný popis toho, co obrázek znázorňuje.

Name Typ Description
boundingBox

BoundingBox

Ohraničující rámeček pro oblast uvnitř obrázku.

confidence

number

Úroveň spolehlivosti, které má služba v titulku. Skóre spolehlivosti zahrnují rozsah od 0,0 do 1,0 (včetně), přičemž vyšší hodnoty označují vyšší spolehlivost shody.

text

string

Text titulku.

DenseCaptionsResult

Seznam titulků.

Name Typ Description
values

DenseCaption[]

Seznam titulků.

DetectedObject

Popisuje zjištěný objekt na obrázku.

Name Typ Description
boundingBox

BoundingBox

Ohraničující rámeček pro oblast uvnitř obrázku.

id

string

ID zjištěného objektu.

tags

ContentTag[]

Klasifikace spolehlivosti zjištěného objektu.

DetectedPerson

Osoba detekovaná na obrázku.

Name Typ Description
boundingBox

BoundingBox

Ohraničující rámeček pro oblast uvnitř obrázku.

confidence

number

Skóre spolehlivosti pozorování osoby na obrázku Skóre spolehlivosti zahrnují rozsah od 0,0 do 1,0 (včetně), přičemž vyšší hodnoty označují vyšší spolehlivost shody.

DetectedTextBlock

Zjištěný blok textu.

Name Typ Description
lines

DetectedTextLine[]

Seznam textových řádků v bloku textu

DetectedTextLine

Zjištěný textový řádek.

Name Typ Description
boundingPolygon

ImagePoint[]

Ohraničující mnohoúhelník textového řádku.

text

string

Textový obsah rozpoznaného řádku textu.

words

DetectedTextWord[]

Seznam slov v řádku textu

DetectedTextWord

Rozpoznané slovo skládající se z souvislé posloupnosti znaků. U jazyků, které nejsou oddělené mezerami, jako je čínština, japonština a korejština, je každý znak reprezentován jako vlastní slovo.

Name Typ Description
boundingPolygon

ImagePoint[]

Ohraničující mnohoúhelník slova.

confidence

number

Úroveň spolehlivosti, kterou bylo slovo zjištěno. Skóre spolehlivosti zahrnují rozsah od 0,0 do 1,0 (včetně), přičemž vyšší hodnoty označují vyšší spolehlivost shody.

text

string

Textový obsah slova.

ErrorResponse

Odpověď vrácená, když dojde k chybě.

Name Typ Description
error

ErrorResponseDetails

Informace o chybě.

ErrorResponseDetails

Informace o chybě.

Name Typ Description
code

string

Kód chyby

details

ErrorResponseDetails[]

Seznam podrobných chyb

innererror

ErrorResponseInnerError

Podrobná chyba

message

string

Chybová zpráva.

target

string

Cíl chyby.

ErrorResponseInnerError

Podrobná chyba

Name Typ Description
code

string

Kód chyby

innererror

ErrorResponseInnerError

Podrobná chyba

message

string

Chybová zpráva.

ImageAnalysisResult

Popište kombinované výsledky různých typů analýzy obrázků.

Name Typ Description
captionResult

CaptionResult

Stručný popis toho, co obrázek znázorňuje.

denseCaptionsResult

DenseCaptionsResult

Seznam titulků.

metadata

ImageMetadata

Informace o metadatech obrázku, jako je výška a šířka.

modelVersion

string

Verze modelu.

objectsResult

ObjectsResult

Popisuje zjištěné objekty na obrázku.

peopleResult

PeopleResult

Objekt popisující, jestli obrázek obsahuje osoby.

readResult

ReadResult

Výsledky operace čtení.

smartCropsResult

SmartCropsResult

Výsledek inteligentního oříznutí.

tagsResult

TagsResult

Seznam značek s úrovní spolehlivosti

ImageMetadata

Informace o metadatech obrázku, jako je výška a šířka.

Name Typ Description
height

integer

Výška obrázku v pixelech

width

integer

Šířka obrázku v pixelech.

ImagePoint

Objekt představující bod na obrázku.

Name Typ Description
x

integer

Souřadnice x tohoto bodu.

y

integer

Souřadnice y tohoto bodu.

ObjectsResult

Popisuje zjištěné objekty na obrázku.

Name Typ Description
values

DetectedObject[]

Pole zjištěných objektů.

PeopleResult

Objekt popisující, jestli obrázek obsahuje osoby.

Name Typ Description
values

DetectedPerson[]

Pole zjištěných lidí.

ReadResult

Výsledky operace čtení.

Name Typ Description
blocks

DetectedTextBlock[]

Seznam textových bloků.

SmartCropsResult

Výsledek inteligentního oříznutí.

Name Typ Description
values

CropRegion[]

Doporučené oblasti pro oříznutí obrázku

TagsResult

Seznam značek s úrovní spolehlivosti

Name Typ Description
values

ContentTag[]

Seznam značek s úrovní spolehlivosti

VisualFeature

Požadované funkce vizuálu Musí být zadána alespoň jedna vizuální funkce.

Name Typ Description
caption

string

Popis nebo titulek shrnující obsah obrázku.

denseCaptions

string

Podrobné titulky poskytují podrobné popisy obsahu obrázku.

objects

string

Konkrétní objekty rozpoznané a označené na obrázku

people

string

Detekce a analýza lidí na obrázku

read

string

Textový obsah extrahovaný z obrázku, jako jsou značky nebo popisky.

smartCrops

string

Automaticky vygenerované oříznuté verze obrázku se zaměřením na důležitý obsah.

tags

string

Vizuální značky představující objekty zjištěné na obrázku.