Úvod
Předpokládejme, že máte tisíce obrázků a zobrazí se výzva k přenosu textu na obrázcích do počítačové databáze. Naskenované obrázky mají text uspořádaný v různých formátech a obsahují více jazyků. Jaké jsou některé způsoby, jak můžete projekt dokončit v přiměřeném časovém rámci a ujistit se, že jsou data zadaná s vysokou mírou přesnosti?
Společnosti po celém světě řeší podobné scénáře každý den. Bez služeb AI by bylo náročné projekt dokončit, zejména pokud by se změnilo škálování.
Pomocí služeb AI můžeme s tímto projektem zacházet jako se scénářem azure AI Vision a použít optické rozpoznávání znaků (OCR). OCR umožňuje extrahovat text z obrázků, jako jsou fotky pouličních znaménka a produktů, a také z dokumentů , jako jsou rukou psané nebo nestrukturované dokumenty.
Pokud chcete vytvořit automatizované řešení AI, musíte trénovat modely strojového učení tak, aby zahrnovaly mnoho případů použití. Služba Azure AI Vision poskytuje přístup k pokročilým algoritmům pro zpracování obrázků a vrací data do zabezpečeného úložiště.
V tomto modulu:
- Identifikace způsobu, jakým služba Azure AI Vision umožňuje číst text z obrázků
- Použití služby Azure AI Vision se sadami SDK a rozhraním REST API
- Vývoj aplikace, která dokáže číst tištěný a ručně psaný text