Azure AI Vision
Du kan träna dina egna maskininlärningsmodeller för visuellt innehåll, men arkitekturen för modeller för visuellt innehåll kan vara komplex. och du behöver betydande mängder träningsbilder och beräkningskraft för att utföra träningsprocessen.
Microsofts Azure AI Vision-tjänst tillhandahåller fördefinierade och anpassningsbara modeller för visuellt innehåll som baseras på Grundmodellen i Florens och som ger olika kraftfulla funktioner. Med Azure AI Vision kan du snabbt och enkelt skapa avancerade lösningar för visuellt innehåll. dra nytta av "off-the-shelf"-funktioner för många vanliga scenarier för visuellt innehåll, samtidigt som du behåller möjligheten att skapa anpassade modeller med dina egna bilder.
Azure-resurser för Azure AI Vision-tjänsten
Om du vill använda Azure AI Vision måste du skapa en resurs för den i din Azure-prenumeration. Du kan använda någon av följande resurstyper:
- Azure AI Vision: En specifik resurs för Azure AI Vision-tjänsten. Använd den här resurstypen om du inte tänker använda andra Azure AI-tjänster, eller om du vill spåra användning och kostnader för din Azure AI Vision-resurs separat.
- Azure AI-tjänster: En allmän resurs som omfattar Azure AI Vision tillsammans med många andra Azure AI-tjänster. till exempel Azure AI Language, Azure AI Custom Vision, Azure AI Translator och andra. Använd den här resurstypen om du planerar att använda flera AI-tjänster och vill förenkla administration och utveckling.
Analysera bilder med Azure AI Vision-tjänsten
När du har skapat en lämplig resurs i din prenumeration kan du skicka bilder till Azure AI Vision-tjänsten för att utföra en mängd olika analytiska uppgifter.
Azure AI Vision har stöd för flera funktioner för bildanalys, inklusive:
- Optisk teckenigenkänning (OCR) – extrahera text från bilder.
- Generera bildtexter och beskrivningar av bilder.
- Identifiering av tusentals vanliga objekt i bilder.
- Tagga visuella funktioner i bilder
Dessa uppgifter kan med mera utföras i Azure AI Vision Studio.
Optisk teckenigenkänning
Tjänsten Azure AI Vision kan använda funktioner för optisk teckenigenkänning (OCR) för att identifiera text i bilder. Tänk till exempel på följande bild av en näringsetikett på en produkt i en livsmedelsbutik:
Tjänsten Azure AI Vision kan analysera den här bilden och extrahera följande text:
Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet
Tips
Du kan utforska OCR-funktionerna i Azure AI Vision ytterligare i modulen Läsa text med Azure AI Vision på Microsoft Learn.
Beskriva en bild med bildtexter
Azure AI Vision har möjlighet att analysera en bild, utvärdera de objekt som identifieras och generera en mänsklig läsbar fras eller mening som kan beskriva vad som upptäcktes i bilden. Tänk till exempel på följande bild:
Azure AI Vision returnerar följande bildtext för den här bilden:
En man hoppar på en skateboard
Identifiera vanliga objekt i en bild
Azure AI Vision kan identifiera tusentals vanliga objekt i bilder. När det till exempel används för att identifiera objekt i skateboarder-avbildningen som beskrevs tidigare returnerar Azure AI Vision följande förutsägelser:
- Skateboard (90,40%)
- person (95,5%)
Förutsägelserna innehåller en konfidenspoäng som anger sannolikheten som modellen har beräknat för de förutsagda objekten.
Förutom de identifierade objektetiketterna och deras sannolikheter returnerar Azure AI Vision avgränsningsruta koordinater som anger objektets övre, vänstra, bredd och höjd. Du kan använda dessa koordinater för att avgöra var i bilden varje objekt identifierades, så här:
Tagga visuella egenskaper
Azure AI Vision kan föreslå etiketter för en bild baserat på dess innehåll. Dessa taggar kan associeras med bilden som metadata som sammanfattar attribut för bilden och kan vara användbara om du vill indexering av en bild tillsammans med en uppsättning viktiga termer som kan användas för att söka efter bilder med specifika attribut eller innehåll.
Taggarna som returneras för skateboarder-avbildningen (med associerade konfidenspoäng) inkluderar till exempel:
- sport (99,60%)
- person (99,56%)
- skor (98,05%)
- skridskoåkning (96,27%)
- boardsport (95,58%)
- skateboardutrustning (94,43%)
- kläder (94.02%)
- vägg (93,81%)
- skateboarding (93,78%)
- skateboardåkare (93,25%)
- individuella sporter (92,80%)
- street stunts (90,81%)
- saldo (90,81%)
- hoppar (89,87%)
- sportutrustning (88,61%)
- extremsport (88,35%)
- kickflip (88,18%)
- stunt (87,27%)
- skateboard (86,87%)
- stuntartist (85,83%)
- knä (85,30%)
- sport (85,24%)
- longboard (84,61%)
- longboarding (84.45%)
- ridning (73,37%)
- skridsko (67,27%)
- luft (64,83%)
- ung (63,29%)
- utomhus (61,39%)
Träna anpassade modeller
Om de inbyggda modellerna som tillhandahålls av Azure AI Vision inte uppfyller dina behov kan du använda tjänsten för att träna en anpassad modell för bildklassificering eller objektidentifiering. Azure AI Vision bygger anpassade modeller på den förtränade grundmodellen, vilket innebär att du kan träna avancerade modeller med hjälp av relativt få träningsbilder.
Bildklassificering
En bildklassificeringsmodell används för att förutsäga kategorin eller klass av en bild. Du kan till exempel träna en modell för att avgöra vilken typ av frukt som visas i en bild, så här:
Äpple | Banan | Apelsin |
---|---|---|
![]() |
![]() |
![]() |
Objektidentifiering
Objektidentifieringsmodeller identifierar och klassificerar objekt i en bild och returnerar koordinater för avgränsningsrutor för att hitta varje objekt. Förutom de inbyggda objektidentifieringsfunktionerna i Azure AI Vision kan du träna en anpassad objektidentifieringsmodell med dina egna bilder. Du kan till exempel använda fotografier av frukt för att träna en modell som identifierar flera frukter i en bild, så här:
Obs
Information om hur du använder Azure AI Vision för att träna en anpassad modell ligger utanför omfånget för den här modulen. Du hittar information om anpassad modellträning i dokumentationen Azure AI Vision.