Analisar uma imagem
Para analisar uma imagem, você pode usar o método REST Analisar Imagem ou o método equivalente no SDK para sua linguagem de programação preferida, especificando os recursos visuais que você deseja incluir na análise (e se você selecionar categorias, incluir ou não detalhes de celebridades ou pontos de referência). Esse método retorna um documento JSON que contém as informações solicitadas.
Observação
A detecção de celebridades exigirá que seja aprovada por meio de uma política de Acesso Limitado. Leia mais sobre a adição de dessa política ao nosso padrão de IA Responsável. O reconhecimento de celebridades é visto em algumas capturas de tela, no entanto, não está incluído no laboratório.
using Azure.AI.Vision.ImageAnalysis;
ImageAnalysisClient client = new ImageAnalysisClient(
Environment.GetEnvironmentVariable("ENDPOINT"),
new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));
ImageAnalysisResult result = client.Analyze(
new Uri("<url>"),
VisualFeatures.Caption | VisualFeatures.Read,
new ImageAnalysisOptions { GenderNeutralCaption = true });
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential
client = ImageAnalysisClient(
endpoint=os.environ["ENDPOINT"],
credential=AzureKeyCredential(os.environ["KEY"])
)
result = client.analyze(
image_url="<url>",
visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
gender_neutral_caption=True,
language="en",
)
Os recursos visuais disponíveis estão contidos na enumeração VisualFeatures
:
- VisualFeatures.Tags: Identifica marcas sobre a imagem, incluindo objetos, cenário, configuração e ações
- VisualFeatures.Objects: Retorna a caixa delimitadora para cada objeto detectado
- VisualFeatures.Caption: Gera uma legenda da imagem em linguagem natural
- VisualFeatures.DenseCaptions: Gera legendas mais detalhadas para os objetos detectados
- VisualFeatures.People: Retorna a caixa delimitadora para pessoas detectadas
- VisualFeatures.SmartCrops: Retorna a caixa delimitadora da taxa de proporção especificada para a área de interesse
- VisualFeatures.Read: Extrai texto legível
- VisualFeatures.TAGS: Identifica marcas sobre a imagem, incluindo objetos, cenário, configuração e ações
- VisualFeatures.OBJECTS: Retorna a caixa delimitadora para cada objeto detectado
- VisualFeatures.CAPTION: Gera uma legenda da imagem em linguagem natural
- VisualFeatures.DENSE_CAPTIONS: Gera legendas mais detalhadas para os objetos detectados
- VisualFeatures.PEOPLE: Retorna a caixa delimitadora para pessoas detectadas
- VisualFeatures.SMART_CROPS: Retorna a caixa delimitadora da taxa de proporção especificada para a área de interesse
- VisualFeatures.READ: Extrai texto legível
Especificar os recursos visuais que você deseja analisar na imagem determina quais informações a resposta conterá. A maioria das respostas conterá uma caixa delimitadora (se um local na imagem for razoável) ou uma pontuação de confiança (para recursos como marcas ou legendas).
A resposta JSON para análise de imagem é semelhante a este exemplo, dependendo dos recursos solicitados:
{
"apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
"modelVersion": "<version>",
"denseCaptionsResult": {
"values": [
{
"text": "a house in the woods",
"confidence": 0.7055229544639587,
"boundingBox": {
"x": 0,
"y": 0,
"w": 640,
"h": 640
}
},
{
"text": "a trailer with a door and windows",
"confidence": 0.6675070524215698,
"boundingBox": {
"x": 214,
"y": 434,
"w": 154,
"h": 108
}
}
]
},
"metadata": {
"width": 640,
"height": 640
}
}