Tipy pro vytváření datových sad s popisky
Tento článek popisuje nejlepší metody označování datových sad vlastních modelů v nástroji Document Intelligence Studio. Popisování dokumentů může být časově náročné, pokud máte velký počet štítků, dlouhých dokumentů nebo dokumentů s různou strukturou. Tyto tipy by vám měly pomoct efektivněji označovat dokumenty.
Video: Osvědčené postupy pro vlastní popisky
Následující video je druhé ze dvou prezentací, které vám pomůžou vytvářet vlastní modely s vyšší přesností (první prezentace zkoumá , jak vytvořit vyváženou datovou sadu).
Prověříme osvědčené postupy pro označování vybraných dokumentů. U sémanticky relevantních a konzistentních popisků byste měli vidět zlepšení výkonu modelu.
Hledání
Studio teď obsahuje vyhledávací pole pro instance, když víte, že potřebujete najít konkrétní slova popisku, ale prostě nevíte, kde je v dokumentu najít. Jednoduše vyhledejte slovo nebo frázi a přejděte do konkrétního oddílu v dokumentu, abyste označili výskyt.
Automatické popisky tabulek
Tabulky můžou být náročné popisovat, pokud mají mnoho řádků nebo zhuštěný text. Pokud tabulka rozložení extrahuje požadovaný výsledek, měli byste tento výsledek použít a přeskočit proces popisování. V případech, kdy tabulka rozložení není přesně to, co potřebujete, můžete začít generováním pole tabulky z extrahování rozložení hodnot. Začněte tím, že na stránce vyberete ikonu tabulky a vyberete tlačítko automatického popisku. Hodnoty pak můžete podle potřeby upravit. Automatický popisek aktuálně podporuje pouze jednostrákové tabulky.
Shift select
Při označování velkého rozsahu textu místo označení každého slova v rozsahu podržte stisknutou klávesu Shift, když vyberete slova, abyste urychlili popisování, a ujistěte se, že v rozsahu textu nezmeškáte žádná slova.
Popisování oblastí
Druhou možností pro popisování větších rozsahů textu je použití popisků oblastí. Při použití OCR
popisků oblastí se výsledky vyplní v hodnotě v době trénování. Rozdíl mezi popisky výběru směny a oblastí je pouze ve vizuální zpětné vazbě, který nabízí přístup popisování směn.
Překrývající se pole popisků
Překrývající se pole jsou podporována pro pole a buňky tabulky. Pokud očekáváte, že výsledky analýzy budou obsahovat překrývající se pole, měli byste do trénovací datové sady přidat aspoň jednu ukázku s popiskem překrytí konkrétních polí. Chcete-li označit překrývající se pole, použijte funkci popisování oblastí k výběru oblastí pro každé pole. Podporují se úplné i částečné překrývání. Všechna jednotlivá slova v dokumentu mohou být označena pouze pro dvě pole.
Podtypy polí
Při vytváření pole vyberte správný podtyp pro minimalizaci následného zpracování, například vyberte dmy
možnost pro data pro extrahování hodnot ve dd-mm-yyyy
formátu.
Další kroky
Další informace o vlastním popisování:
Další informace o vlastních modelech šablon: