Analyze - Image Stream
Przeanalizuj obraz wejściowy. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ['image/*', 'application/octet-stream'].
POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01
POST /imageanalysis:analyze?overload=stream&features={features}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2024-02-01
Parametry identyfikatora URI
Nazwa | W | Wymagane | Typ | Opis |
---|---|---|---|---|
api-version
|
query | True |
string |
Żądana wersja interfejsu API. |
features
|
query |
Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji. |
||
gender-neutral-caption
|
query |
boolean |
Flaga logiczna umożliwiająca włączanie podpisów neutralnych pod względem płci dla funkcji caption i denseCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false". |
|
language
|
query |
string |
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Zobacz https://aka.ms/cv-languages listę obsługiwanych języków. |
|
smartcrops-aspect-ratios
|
query |
array[] |
Lista współczynników proporcji do użycia dla funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania o wysokość. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który widzi, mieści się w zakresie od 0,5 do 2,0 (włącznie). |
Treść żądania
Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"
Nazwa | Typ | Opis |
---|---|---|
body |
string |
Strumień obrazu. |
Odpowiedzi
Nazwa | Typ | Opis |
---|---|---|
200 OK |
Powodzenie |
|
Other Status Codes |
Błąd Nagłówki x-ms-error-code: string |
Przykłady
Image |
Image |
ImageAnalysis_Analyze_MaximumSet_Gen
Przykładowe żądanie
POST /imageanalysis:analyze?overload=stream&features=tags&language=zizuomdsxccdx&smartcrops-aspect-ratios=vqkmzmvchiwlxdaikxqrsbrpvyq&gender-neutral-caption=True&api-version=2024-02-01
"Ynl0ZXM="
Przykładowa odpowiedź
{
"captionResult": {
"text": "wjtogwbozwgawzxikwsvs",
"confidence": 0
},
"objectsResult": {
"values": [
{
"id": "bcvupjoxcviiz",
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
},
"tags": [
{
"name": "ikiqzvbmyrbuskhpphgjjuzvl",
"confidence": 0
}
]
}
]
},
"readResult": {
"blocks": [
{
"lines": [
{
"text": "ufmjctoebx",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"words": [
{
"text": "cpcsgoi",
"boundingPolygon": [
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
},
{
"x": 0,
"y": 0
}
],
"confidence": 0
}
]
}
]
}
]
},
"denseCaptionsResult": {
"values": [
{
"text": "hgvxqwxwqgtjfippp",
"confidence": 0,
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
}
}
]
},
"modelVersion": "lymqyonwrxckwzrsxjihbceclts",
"metadata": {
"width": 28,
"height": 7
},
"tagsResult": {
"values": [
{
"name": "ikiqzvbmyrbuskhpphgjjuzvl",
"confidence": 0
}
]
},
"smartCropsResult": {
"values": [
{
"aspectRatio": 7,
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
}
}
]
},
"peopleResult": {
"values": [
{
"boundingBox": {
"x": 0,
"y": 0,
"w": 24,
"h": 5
},
"confidence": 0
}
]
}
}
ImageAnalysis_Analyze_MinimumSet_Gen
Przykładowe żądanie
POST /imageanalysis:analyze?overload=stream&api-version=2024-02-01
"Ynl0ZXM="
Przykładowa odpowiedź
{
"modelVersion": "lymqyonwrxckwzrsxjihbceclts",
"metadata": {
"width": 28,
"height": 7
}
}
Definicje
Nazwa | Opis |
---|---|
Bounding |
Pole ograniczenia obszaru wewnątrz obrazu. |
Caption |
Krótki opis obrazu. |
Content |
Obserwacja jednostki na obrazie wraz z wynikiem ufności. |
Crop |
Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region. |
Dense |
Krótki opis obrazu. |
Dense |
Lista podpisów. |
Detected |
Opisuje wykryty obiekt na obrazie. |
Detected |
Osoba wykryta na obrazie. |
Detected |
Wykryty blok tekstu. |
Detected |
Wykryty wiersz tekstu. |
Detected |
Wykryte słowo składające się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz. |
Error |
Odpowiedź zwrócona po wystąpieniu błędu. |
Error |
Informacje o błędzie. |
Error |
Szczegółowy błąd. |
Image |
Opisz połączone wyniki różnych typów analizy obrazów. |
Image |
Informacje o metadanych obrazu, takie jak wysokość i szerokość. |
Image |
Obiekt reprezentujący punkt na obrazie. |
Objects |
Opisuje wykryte obiekty na obrazie. |
People |
Obiekt opisujący, czy obraz zawiera osoby. |
Read |
Wyniki operacji odczytu. |
Smart |
Inteligentny wynik przycinania. |
Tags |
Lista tagów z poziomem ufności. |
Visual |
Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji. |
BoundingBox
Pole ograniczenia obszaru wewnątrz obrazu.
Nazwa | Typ | Opis |
---|---|---|
h |
integer |
Wysokość mierzona od lewego górnego punktu obszaru w pikselach. |
w |
integer |
Szerokość mierzona od lewego górnego punktu obszaru w pikselach. |
x |
integer |
Współrzędna lewa w lewym górnym punkcie obszaru w pikselach. |
y |
integer |
Górna współrzędna lewego górnego punktu obszaru w pikselach. |
CaptionResult
Krótki opis obrazu.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Poziom pewności, jaki usługa ma w podpisie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania. |
text |
string |
Tekst podpisu. |
ContentTag
Obserwacja jednostki na obrazie wraz z wynikiem ufności.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Poziom pewności, że zaobserwowano jednostkę. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania. |
name |
string |
Nazwa jednostki. |
CropRegion
Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.
Nazwa | Typ | Opis |
---|---|---|
aspectRatio |
number |
Współczynnik proporcji regionu przycinania. |
boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
DenseCaption
Krótki opis obrazu.
Nazwa | Typ | Opis |
---|---|---|
boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
confidence |
number |
Poziom pewności, jaki usługa ma w podpisie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania. |
text |
string |
Tekst podpisu. |
DenseCaptionsResult
Lista podpisów.
Nazwa | Typ | Opis |
---|---|---|
values |
Lista podpisów. |
DetectedObject
Opisuje wykryty obiekt na obrazie.
Nazwa | Typ | Opis |
---|---|---|
boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
id |
string |
Identyfikator wykrytego obiektu. |
tags |
Zaufania klasyfikacji wykrytego obiektu. |
DetectedPerson
Osoba wykryta na obrazie.
Nazwa | Typ | Opis |
---|---|---|
boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
confidence |
number |
Wskaźnik ufności obserwowania osoby na obrazie. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania. |
DetectedTextBlock
Wykryty blok tekstu.
Nazwa | Typ | Opis |
---|---|---|
lines |
Lista wierszy tekstowych w bloku tekstowym. |
DetectedTextLine
Wykryty wiersz tekstu.
Nazwa | Typ | Opis |
---|---|---|
boundingPolygon |
Powiązanie wielokąta wiersza tekstu. |
|
text |
string |
Zawartość tekstowa wykrytego wiersza tekstu. |
words |
Lista wyrazów w wierszu tekstu. |
DetectedTextWord
Wykryte słowo składające się z ciągłej sekwencji znaków. W przypadku języków rozdzielonych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.
Nazwa | Typ | Opis |
---|---|---|
boundingPolygon |
Wiązanie wielokąta wyrazu. |
|
confidence |
number |
Poziom pewności, że słowo zostało wykryte. Wyniki ufności obejmują zakres od 0,0 do 1,0 (włącznie) z wyższymi wartościami wskazującymi większą pewność dopasowania. |
text |
string |
Zawartość tekstowa wyrazu. |
ErrorResponse
Odpowiedź zwrócona po wystąpieniu błędu.
Nazwa | Typ | Opis |
---|---|---|
error |
Informacje o błędzie. |
ErrorResponseDetails
Informacje o błędzie.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Kod błędu. |
details |
Lista szczegółowych błędów. |
|
innererror |
Szczegółowy błąd. |
|
message |
string |
Komunikat o błędzie. |
target |
string |
Element docelowy błędu. |
ErrorResponseInnerError
Szczegółowy błąd.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Kod błędu. |
innererror |
Szczegółowy błąd. |
|
message |
string |
Komunikat o błędzie. |
ImageAnalysisResult
Opisz połączone wyniki różnych typów analizy obrazów.
Nazwa | Typ | Opis |
---|---|---|
captionResult |
Krótki opis obrazu. |
|
denseCaptionsResult |
Lista podpisów. |
|
metadata |
Informacje o metadanych obrazu, takie jak wysokość i szerokość. |
|
modelVersion |
string |
Wersja modelu. |
objectsResult |
Opisuje wykryte obiekty na obrazie. |
|
peopleResult |
Obiekt opisujący, czy obraz zawiera osoby. |
|
readResult |
Wyniki operacji odczytu. |
|
smartCropsResult |
Inteligentny wynik przycinania. |
|
tagsResult |
Lista tagów z poziomem ufności. |
ImageMetadata
Informacje o metadanych obrazu, takie jak wysokość i szerokość.
Nazwa | Typ | Opis |
---|---|---|
height |
integer |
Wysokość obrazu w pikselach. |
width |
integer |
Szerokość obrazu w pikselach. |
ImagePoint
Obiekt reprezentujący punkt na obrazie.
Nazwa | Typ | Opis |
---|---|---|
x |
integer |
Współrzędna x tego punktu. |
y |
integer |
Współrzędna y tego punktu. |
ObjectsResult
Opisuje wykryte obiekty na obrazie.
Nazwa | Typ | Opis |
---|---|---|
values |
Tablica wykrytych obiektów. |
PeopleResult
Obiekt opisujący, czy obraz zawiera osoby.
Nazwa | Typ | Opis |
---|---|---|
values |
Tablica wykrytych osób. |
ReadResult
Wyniki operacji odczytu.
Nazwa | Typ | Opis |
---|---|---|
blocks |
Lista bloków tekstowych. |
SmartCropsResult
Inteligentny wynik przycinania.
Nazwa | Typ | Opis |
---|---|---|
values |
Zalecane regiony do przycinania obrazu. |
TagsResult
Lista tagów z poziomem ufności.
Nazwa | Typ | Opis |
---|---|---|
values |
Lista tagów z poziomem ufności. |
VisualFeature
Żądane funkcje wizualne. Należy określić co najmniej jedną funkcję wizualizacji.
Nazwa | Typ | Opis |
---|---|---|
caption |
string |
Opis lub podpis podsumowujący zawartość obrazu. |
denseCaptions |
string |
Szczegółowe podpisy zawierające szczegółowe opisy zawartości obrazu. |
objects |
string |
Określone obiekty rozpoznane i oznaczone etykietą na obrazie. |
people |
string |
Wykrywanie i analiza osób na obrazie. |
read |
string |
Zawartość tekstowa wyodrębniona z obrazu, taka jak znaki lub etykiety. |
smartCrops |
string |
Automatycznie wygenerowane przycięte wersje obrazu koncentrują się na ważnej zawartości. |
tags |
string |
Tagi wizualne reprezentujące obiekty wykryte na obrazie. |