Prozkoumání možností služby Azure AI Vision pro čtení textu

Dokončeno

Azure AI nabízí dvě různé funkce, které čtou text z dokumentů a obrázků– jednu ve službě Azure AI Vision Service, druhou ve službě Azure AI Document Intelligence. Jednotlivé služby se překrývají, ale každá je optimalizovaná pro výsledky v závislosti na tom, co je vstup.

  • Optické rozpoznávání znaků ( OCR):
    • Tuto funkci použijte pro obecné, nestrukturované dokumenty s menším množstvím textu nebo obrázky, které obsahují text.
    • Výsledky se vrátí okamžitě (synchronně) z jednoho volání rozhraní API.
    • Obsahuje funkce pro analýzu obrázků po extrahování textu, včetně rozpoznávání objektů, popisu nebo kategorizace obrázku, generování chytře oříznutých miniatur a dalších.
    • Mezi příklady patří: pouliční značky, ručně psané poznámky a značky obchodu.
  • Funkce Document Intelligence:
    • Pomocí této služby můžete číst malé až velké objemy textu z obrázků a dokumentů PDF.
    • Tato služba používá ke zlepšení přesnosti kontext a strukturu dokumentu.
    • Počáteční volání funkce vrátí ASYNCHRONNÍ ID operace, které se musí použít v následném volání k načtení výsledků.
    • Mezi příklady patří: účtenky, články a faktury.

K oběma technologiím můžete přistupovat přes rozhraní REST API nebo klientskou knihovnu. V tomto modulu se zaměříme na funkci OCR v analýze obrázků. Pokud se chcete dozvědět více o funkci Document Intelligence, přečtěte si tento modul , který vám poskytne dobrý úvod.