Eksplorowanie opcji usługi Azure AI Vision na potrzeby odczytywania tekstu

Ukończone

Usługa Azure AI udostępnia dwie różne funkcje odczytujące tekst z dokumentów i obrazów, jedną w usłudze Azure AI Vision Service, drugą w usłudze Azure AI Document Intelligence. Każda usługa jest jednak zoptymalizowana pod kątem wyników w zależności od danych wejściowych.

  • Optyczne rozpoznawanie znaków analizy obrazów (OCR):
    • Ta funkcja służy do ogólnych, nieustrukturyzowanych dokumentów z mniejszą ilością tekstu lub obrazów zawierających tekst.
    • Wyniki są zwracane natychmiast (synchronicznie) z jednego wywołania interfejsu API.
    • Ma funkcje analizowania obrazów wklejanych podczas wyodrębniania tekstu, w tym wykrywania obiektów, opisywania lub kategoryzowania obrazu, generowania inteligentnych przyciętych miniatur i nie tylko.
    • Przykłady to: znaki uliczne, notatki odręczne i znaki sklepu.
  • Analiza dokumentów:
    • Ta usługa służy do odczytywania małych i dużych ilości tekstu z obrazów i dokumentów PDF.
    • Ta usługa używa kontekstu i struktury dokumentu w celu zwiększenia dokładności.
    • Wywołanie funkcji początkowej zwraca identyfikator operacji asynchronicznej, który musi być używany w kolejnym wywołaniu w celu pobrania wyników.
    • Przykłady to: paragony, artykuły i faktury.

Dostęp do obu technologii można uzyskać za pośrednictwem interfejsu API REST lub biblioteki klienta. W tym module skoncentrujemy się na funkcji OCR w analizie obrazów. Jeśli chcesz dowiedzieć się więcej na temat analizy dokumentów, przeczytanie tego modułu zapewni dobre wprowadzenie.