Prozkoumání možností služby Azure AI Vision pro čtení textu
Azure AI nabízí dvě různé funkce, které čtou text z dokumentů a obrázků– jednu ve službě Azure AI Vision Service, druhou ve službě Azure AI Document Intelligence. Jednotlivé služby se překrývají, ale každá je optimalizovaná pro výsledky v závislosti na tom, co je vstup.
- Optické rozpoznávání znaků ( OCR):
- Tuto funkci použijte pro obecné, nestrukturované dokumenty s menším množstvím textu nebo obrázky, které obsahují text.
- Výsledky se vrátí okamžitě (synchronně) z jednoho volání rozhraní API.
- Obsahuje funkce pro analýzu obrázků po extrahování textu, včetně rozpoznávání objektů, popisu nebo kategorizace obrázku, generování chytře oříznutých miniatur a dalších.
- Mezi příklady patří: pouliční značky, ručně psané poznámky a značky obchodu.
- Funkce Document Intelligence:
- Pomocí této služby můžete číst malé až velké objemy textu z obrázků a dokumentů PDF.
- Tato služba používá ke zlepšení přesnosti kontext a strukturu dokumentu.
- Počáteční volání funkce vrátí ASYNCHRONNÍ ID operace, které se musí použít v následném volání k načtení výsledků.
- Mezi příklady patří: účtenky, články a faktury.
K oběma technologiím můžete přistupovat přes rozhraní REST API nebo klientskou knihovnu. V tomto modulu se zaměříme na funkci OCR v analýze obrázků. Pokud se chcete dozvědět více o funkci Document Intelligence, přečtěte si tento modul , který vám poskytne dobrý úvod.