Eksplorowanie opcji usługi Azure AI Vision na potrzeby odczytywania tekstu

3 min

Usługa Azure AI udostępnia dwie różne funkcje odczytujące tekst z dokumentów i obrazów, jedną w usłudze Azure AI Vision Service, drugą w usłudze Azure AI Document Intelligence. Każda usługa jest jednak zoptymalizowana pod kątem wyników w zależności od danych wejściowych.

Optyczne rozpoznawanie znaków analizy obrazów (OCR):
- Ta funkcja służy do ogólnych, nieustrukturyzowanych dokumentów z mniejszą ilością tekstu lub obrazów zawierających tekst.
- Wyniki są zwracane natychmiast (synchronicznie) z jednego wywołania interfejsu API.
- Ma funkcje analizowania obrazów wklejanych podczas wyodrębniania tekstu, w tym wykrywania obiektów, opisywania lub kategoryzowania obrazu, generowania inteligentnych przyciętych miniatur i nie tylko.
- Przykłady to: znaki uliczne, notatki odręczne i znaki sklepu.
Analiza dokumentów:
- Ta usługa służy do odczytywania małych i dużych ilości tekstu z obrazów i dokumentów PDF.
- Ta usługa używa kontekstu i struktury dokumentu w celu zwiększenia dokładności.
- Wywołanie funkcji początkowej zwraca identyfikator operacji asynchronicznej, który musi być używany w kolejnym wywołaniu w celu pobrania wyników.
- Przykłady to: paragony, artykuły i faktury.

Dostęp do obu technologii można uzyskać za pośrednictwem interfejsu API REST lub biblioteki klienta. W tym module skoncentrujemy się na funkcji OCR w analizie obrazów. Jeśli chcesz dowiedzieć się więcej na temat analizy dokumentów, przeczytanie tego modułu zapewni dobre wprowadzenie.

Eksplorowanie opcji usługi Azure AI Vision na potrzeby odczytywania tekstu

Opinia