Úvod

Dokončeno

Předpokládejme, že máte tisíce obrázků a zobrazí se výzva k přenosu textu na obrázcích do počítačové databáze. Naskenované obrázky mají text uspořádaný v různých formátech a obsahují více jazyků. Jaké jsou některé způsoby, jak můžete projekt dokončit v přiměřeném časovém rámci a ujistit se, že jsou data zadaná s vysokou mírou přesnosti?

Společnosti po celém světě řeší podobné scénáře každý den. Bez služeb AI by bylo náročné projekt dokončit, zejména pokud by se změnilo škálování.

Pomocí služeb AI můžeme s tímto projektem zacházet jako se scénářem azure AI Vision a použít optické rozpoznávání znaků (OCR). OCR umožňuje extrahovat text z obrázků, jako jsou fotky pouličních znaménka a produktů, a také z dokumentů , jako jsou rukou psané nebo nestrukturované dokumenty.

Pokud chcete vytvořit automatizované řešení AI, musíte trénovat modely strojového učení tak, aby zahrnovaly mnoho případů použití. Služba Azure AI Vision poskytuje přístup k pokročilým algoritmům pro zpracování obrázků a vrací data do zabezpečeného úložiště.

V tomto modulu:

  • Identifikace způsobu, jakým služba Azure AI Vision umožňuje číst text z obrázků
  • Použití služby Azure AI Vision se sadami SDK a rozhraním REST API
  • Vývoj aplikace, která dokáže číst tištěný a ručně psaný text