Sdílet prostřednictvím


Odesílání dat do rozhraní API pro rozpoznávání rukopisu

Poznámka

Rozhraní API rozpoznávání rukopisu skončilo ve verzi Preview 26. srpna 2020. Pokud máte existující prostředky rozpoznávání rukopisu, můžete je dál používat, dokud se služba plně vyřadí z provozu 31. ledna 2021.

Termín digitální rukopis označuje technologie, které umožňují digitální reprezentaci výstupu, jako jsou rukopis a kresby. Toho se obvykle dosahuje pomocí digitizátoru, který zachycuje pohyby vstupních zařízení, jako je pero. Zařízení stále víc podporují bohatá prostředí digitálních rukopisů a umělá inteligence a strojové učení umožňují rozpoznávání psaných tvarů a textu v libovolném kontextu. Rozhraní API rozpoznávání rukopisu umožňuje odesílat tahy rukopisu a získat podrobné informace o nich.

Rozhraní API pro rozpoznávání rukopisu vs. služby OCR

Rozhraní API rozpoznávání rukopisu nepoužívá optické rozpoznávání znaků (OCR). Služby OCR zpracovávají data pixelů z obrázků, aby poskytovaly rukopis a rozpoznávání textu. Někdy se tomu říká offline rozpoznávání. Místo toho rozhraní API rozpoznávání rukopisu vyžaduje data tahu rukopisu zachycená při použití vstupního zařízení. Zpracování digitálních rukopisných dat tímto způsobem může vést k přesnějším výsledkům rozpoznávání ve srovnání se službami OCR.

Odesílání rukopisných dat

Rozhraní API rozpoznávání rukopisu vyžaduje souřadnice X a Y, které představují tahy rukopisu vytvořené vstupním zařízením, od okamžiku, kdy se dotkne povrchu detekce, až se zvedne. Body každého tahu musí být řetězec hodnot oddělených čárkami a musí být formátován ve formátu JSON, jako je příklad níže. Kromě toho musí mít každý tah rukopisu v každém požadavku jedinečné ID. Pokud se ID opakuje ve stejném požadavku, rozhraní API vrátí chybu. Pro nejpřesnější výsledky rozpoznávání mají alespoň osm číslic za desetinnou čárkou. Původ plátna (0,0) se předpokládá jako levý horní roh plátna rukopisu.

Poznámka

Následující příklad není platný JSON. Úplný požadavek JSON pro rozpoznávání rukopisu najdete na GitHubu.

{
  "language": "en-US",
  "strokes": [
   {
    "id": 43,
    "points": 
        "5.1365, 12.3845,
        4.9534, 12.1301,
        4.8618, 12.1199,
        4.7906, 12.2217,
        4.7906, 12.5372,
        4.8211, 12.9849,
        4.9534, 13.6667,
        5.0958, 14.4503,
        5.3299, 15.2441,
        5.6555, 16.0480,
        ..."
   },
    ...
  ]
}

Odpověď rozpoznávání rukopisu

Rozhraní API rozpoznávání rukopisu vrátí odpověď na analýzu objektů, které rozpoznal z obsahu rukopisu. Odpověď obsahuje jednotky rozpoznávání, které popisují vztahy mezi různými tahy rukopisu. Například tahy, které vytvářejí odlišné, budou samostatné obrazce obsaženy v různých jednotkách. Každá jednotka obsahuje podrobné informace o svých rukopisných tahech, včetně rozpoznaných objektů, jeho souřadnic a dalších atributů kreslení.

Obrazce rozpoznané rozhraním API pro rozpoznávání rukopisu

Rozhraní API rozpoznávání rukopisu dokáže identifikovat nejčastěji používané obrazce při pořizování poznámek. Následující obrázek ukazuje několik základních příkladů. Úplný seznam obrazců a dalšího rukopisného obsahu rozpoznaného rozhraním API najdete v referenčním článku k rozhraní API.

Seznam obrazců rozpoznaných rozhraním API rozpoznávání rukopisu

Rozhraní REST API služby Rozpoznávání rukopisu můžete volat v různých vzorech podle vaší aplikace.

Volání rozhraní API iniciovaná uživatelem

Pokud vytváříte aplikaci, která přijímá uživatelský vstup (například aplikaci pro pořizování poznámek nebo poznámky), můžete jim dát kontrolu nad tím, kdy a který rukopis se odešle do rozhraní API rozpoznávání rukopisu. Tato funkce je užitečná zejména v případě, že text a obrazce jsou přítomné na plátně, a uživatelé chtějí pro každou z nich provádět různé akce. Zvažte přidání funkcí výběru (jako je laso nebo jiný nástroj pro geometrický výběr), které uživatelům umožňují zvolit, co se odešle do rozhraní API.

Volání rozhraní API iniciovaná aplikací

Aplikaci můžete také po vypršení časového limitu volat rozhraní API rozpoznávání rukopisu. Odesláním aktuálních tahů rukopisu do rozhraní API můžete pravidelně ukládat výsledky rozpoznávání při jejich vytváření při vylepšování doby odezvy rozhraní API. Můžete například odeslat řádek rukou psaného textu do rozhraní API po zjištění, že uživatel ho dokončil.

Když budete mít výsledky rozpoznávání předem, získáte informace o vlastnostech tahů rukopisu, jak se vzájemně souvisí. Které tahy jsou například seskupené tak, aby se vytvořily stejné slovo, čára, seznam, odstavec nebo obrazec. Tyto informace můžou vylepšit funkce výběru rukopisu vaší aplikace tím, že můžou vybrat skupiny tahů najednou, například.

Integrace rozhraní API rozpoznávání rukopisu s Windows Ink

Windows Ink poskytuje nástroje a technologie, které umožňují digitální rukopisné prostředí na různých zařízeních. Platformu Windows Ink můžete kombinovat s rozhraním API rozpoznávání rukopisu a vytvářet aplikace, které zobrazují a interpretují tahy digitálních rukopisů.

Další kroky