Analýza obrázku

3 min

K analýze obrázku můžete použít metodu Analyze Image REST nebo ekvivalentní metodu v sadě SDK pro preferovaný programovací jazyk a určit vizuální funkce, které chcete zahrnout do analýzy (a pokud vyberete kategorie, ať už chcete zahrnout podrobnosti o celebritách nebo orientačních bodech). Tato metoda vrátí dokument JSON obsahující požadované informace.

Poznámka

Detekce celebrit bude vyžadovat schválení prostřednictvím zásady omezeného přístupu. Další informace o začlenění této zásady do našeho Standardu pro zodpovědnou AI. Rozpoznávání celebrit je vidět na některých snímcích obrazovky, ale není součástí testovacího prostředí.

using Azure.AI.Vision.ImageAnalysis;

ImageAnalysisClient client = new ImageAnalysisClient(
    Environment.GetEnvironmentVariable("ENDPOINT"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));

ImageAnalysisResult result = client.Analyze(
    new Uri("<url>"),
    VisualFeatures.Caption | VisualFeatures.Read,
    new ImageAnalysisOptions { GenderNeutralCaption = true });

from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential

client = ImageAnalysisClient(
    endpoint=os.environ["ENDPOINT"],
    credential=AzureKeyCredential(os.environ["KEY"])
)

result = client.analyze(
    image_url="<url>",
    visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
    gender_neutral_caption=True,
    language="en",
)

Dostupné vizuální funkce jsou obsaženy v VisualFeatures enumeraci:

VisualFeatures.Tags: Identifikuje štítky k obrázku, včetně objektů, krajiny, prostředí a akcí.
VisualFeatures.Objects: Vrátí ohraničující rámeček pro každý zjištěný objekt.
VisualFeatures.Caption: Vygeneruje titulek obrázku v přirozeném jazyce.
VisualFeatures.DenseCaptions: Vygeneruje podrobnější titulky pro zjištěné objekty.
VisualFeatures.People: Vrátí ohraničující rámeček pro zjištěné osoby.
VisualFeatures.SmartCrops: Vrátí ohraničující rámeček zadaného poměru stran pro oblast zájmu.
VisualFeatures.Read: Extrahuje čitelný text.

VisualFeatures.TAGS: Identifikuje štítky k obrázku, včetně objektů, scény, nastavení a akce.
VisualFeatures.OBJECTS: Vrátí ohraničující rámeček pro každý detekovaný objekt.
VisualFeatures.CAPTION: Vygeneruje titulek obrázku v přirozeném jazyce.
VisualFeatures.DENSE_CAPTIONS: Vygeneruje podrobnější titulky pro zjištěné objekty.
VisualFeatures.PEOPLE: Vrátí ohraničující rámeček pro zjištěné osoby.
VisualFeatures.SMART_CROPS: Vrátí ohraničující rámeček zadaného poměru stran pro oblast zájmu.
VisualFeatures.READ: Extrahuje čitelný text.

Určení vizuálních funkcí, které chcete analyzovat na obrázku, určuje, jaké informace bude odpověď obsahovat. Většina odpovědí bude obsahovat ohraničující rámeček (pokud je umístění na obrázku přiměřené) nebo skóre spolehlivosti (pro funkce, jako jsou značky nebo titulky).

Odpověď JSON pro analýzu obrázků vypadá podobně jako v tomto příkladu v závislosti na požadovaných funkcích:

{
  "apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
  "modelVersion": "<version>",
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a house in the woods",
        "confidence": 0.7055229544639587,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 640,
          "h": 640
        }
      },
      {
        "text": "a trailer with a door and windows",
        "confidence": 0.6675070524215698,
        "boundingBox": {
          "x": 214,
          "y": 434,
          "w": 154,
          "h": 108
        }
      }
    ]
  },
  "metadata": {
    "width": 640,
    "height": 640
  }
}

Analýza obrázku

Váš názor