Co to jest usługa Azure AI Vision?
Usługa Azure AI Vision zapewnia dostęp do zaawansowanych algorytmów, które przetwarzają obrazy i zwracają informacje na podstawie interesujących Cię funkcji wizualnych. W poniższej tabeli wymieniono główne kategorie produktów.
Usługa | opis |
---|---|
Optyczne rozpoznawanie znaków (OCR) | Usługa optycznego rozpoznawania znaków (OCR) wyodrębnia tekst z obrazów. Interfejs API odczytu umożliwia wyodrębnianie tekstu drukowanego i odręcznego ze zdjęć i dokumentów. Używa modeli opartych na uczeniu głębokim i współpracuje z tekstem na różnych powierzchniach i tłach. Należą do nich dokumenty biznesowe, faktury, paragony, plakaty, wizytówki, listy i tablice. Interfejsy API OCR obsługują wyodrębnianie tekstu drukowanego w kilku językach. Postępuj zgodnie z przewodnikiem Szybki start usługi OCR, aby rozpocząć pracę. |
Analiza obrazu | Usługa Analiza obrazów wyodrębnia wiele funkcji wizualnych z obrazów, takich jak obiekty, twarze, zawartość dla dorosłych i automatycznie generowane opisy tekstu. Postępuj zgodnie z przewodnikiem Szybki start Analizy obrazów, aby rozpocząć pracę. |
Rozpoznawanie twarzy | Usługa rozpoznawania twarzy udostępnia algorytmy sztucznej inteligencji, które wykrywają, rozpoznawają i analizują ludzkie twarze na obrazach. Oprogramowanie do rozpoznawania twarzy jest ważne w wielu różnych scenariuszach, takich jak identyfikacja, bezobsługowa kontrola dostępu i rozmycie twarzy w celu zachowania prywatności. Postępuj zgodnie z przewodnikiem Szybki start rozpoznawania twarzy, aby rozpocząć pracę. |
Analiza wideo | Analiza wideo obejmuje funkcje związane z wideo, takie jak analiza przestrzenna i pobieranie wideo. Analiza przestrzenna analizuje obecność i ruch osób w kanale wideo i generuje zdarzenia, na które mogą reagować inne systemy. Zainstaluj kontener Analizy przestrzennej, aby rozpocząć pracę. Pobieranie wideo umożliwia utworzenie indeksu filmów wideo, które można wyszukiwać za pomocą języka naturalnego. |
Usługa Azure AI Vision na potrzeby zarządzania zasobami cyfrowymi
Usługa Azure AI Vision może zasilać wiele scenariuszy zarządzania zasobami cyfrowymi (DAM). DAM to proces biznesowy organizowania, przechowywania i pobierania bogatych zasobów multimedialnych oraz zarządzania prawami cyfrowymi i uprawnieniami. Na przykład firma może chcieć grupować i identyfikować obrazy na podstawie widocznych logo, twarzy, obiektów, kolorów itd. Możesz też automatycznie generować podpisy dla obrazów i dołączać słowa kluczowe, aby można je było przeszukiwać. Aby zapoznać się z rozwiązaniem all-in-one DAM korzystającym z usług Azure AI, Azure AI Search i inteligentnego raportowania, zobacz Przewodnik po akceleratorze rozwiązań do wyszukiwania wiedzy w witrynie GitHub. Aby zapoznać się z innymi przykładami dam, zobacz repozytorium Szablony rozwiązań usługi Azure AI Vision.
Rozpocznij
Użyj programu Vision Studio , aby szybko wypróbować funkcje usługi Azure AI Vision w przeglądarce internetowej.
Aby rozpocząć tworzenie usługi Azure AI Vision w aplikacji, postępuj zgodnie z przewodnikiem Szybki start.
- Szybki start: optyczne rozpoznawanie znaków (OCR)
- Szybki start: analiza obrazów
- Szybki start: rozpoznawanie twarzy platformy Azure
- Szybki start: kontener analizy przestrzennej
Wymagania dotyczące obrazu
Usługa Azure AI Vision może analizować obrazy spełniające następujące wymagania:
- Obraz musi być w formacie JPEG, PNG, GIF lub BMP
- Rozmiar pliku obrazu musi być mniejszy niż 4 megabajty (MB)
- Wymiary obrazu muszą być większe niż 50 x 50 pikseli
- W przypadku interfejsu API odczytu wymiary obrazu muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.
Prywatność i zabezpieczenia danych
Podobnie jak we wszystkich usługach azure AI, deweloperzy korzystający z usługi Azure AI Vision powinni mieć świadomość zasad firmy Microsoft dotyczących danych klientów. Aby dowiedzieć się więcej, zobacz stronę usługi Azure AI w Centrum zaufania firmy Microsoft.
Następne kroki
Postępuj zgodnie z przewodnikiem Szybki start, aby zaimplementować i uruchomić usługę w preferowanym języku programowania.