Sdílet prostřednictvím


Přehled nestrukturovaného zpracování dokumentů v Microsoft Syntex

Poznámka

Až do června 2025 si můžete zdarma vyzkoušet omezené množství nestrukturovaného zpracování dokumentů a dalších vybraných služeb Syntex, pokud máte nastavené průběžné platby . Informace a omezení najdete v tématu Vyzkoušení Microsoft Syntex a prozkoumání jejích služeb.

Pomocí modelu nestrukturovaného zpracování dokumentů (metoda výuky) můžete automaticky klasifikovat soubory a extrahovat informace. Nejvhodnější je pro nestrukturované dokumenty, jako jsou dopisy nebo smlouvy.

Poznámka

Společnost Microsoft respektuje ochranu osobních údajů a vlastnictví dat, která používáte k trénování a zpracování modelů v syntexu. Microsoft nepoužívá ani nepřenese žádná data vaší organizace k trénování modelů AI, velkojazyčných modelů ani jiných modelů. Vaše data zůstanou bezpečně v tenantovi vaší organizace. Další informace najdete v tématu Ochrana osobních údajů a ochrana osobních údajů společnosti Microsoft.

Úvod do nestrukturovaných modelů

Model nestrukturovaného zpracování dokumentů (dříve označovaný jako model porozumění dokumentům) používá ke zpracování dokumentů umělou inteligenci (AI). Tyto dokumenty musí obsahovat text, který lze identifikovat na základě frází nebo vzorů. Identifikovaný text označuje jak typ souboru (jeho klasifikaci), tak to, co chcete extrahovat (jeho extrahovací moduly).

Poznámka

Další informace o tom, jak používat syntex a příklady scénářů, najdete v tématu Začínáme s přijetím Microsoft Syntex a scénářů a případů použití pro Microsoft Syntex.

Nestrukturované modely zpracování dokumentů se vytvářejí a spravují na typu sharepointového webu označovaného jako centrum obsahu. Při použití na knihovnu dokumentů Služby SharePoint je model přidružený k typu obsahu obsahuje sloupce pro uložení extrahovaných informací. Typ obsahu, který vytvoříte, je uložený v galerii typů obsahu SharePointu. Můžete se také rozhodnout použít existující typy obsahu k použití jejich schématu.

Poznámka

Typy obsahu jen pro čtení nebo zapečetěné typy obsahu nelze aktualizovat, takže je nelze použít v modelu.

Přidáním klasifikátorů a extraktorů do nestrukturovaných modelů zpracování dokumentů proveďte následující akce:

  • Klasifikátory slouží k identifikaci a klasifikaci dokumentů, které se nahrají do knihovny dokumentů. Klasifikátor může být například "vytrénován" tak, aby identifikoval všechny dokumenty pro prodloužení smlouvy , které se nahrají do knihovny. Typ obsahu pro prodloužení platnosti smlouvy definujete při vytváření klasifikátoru.

  • Extrahovací moduly získávají informace z těchto dokumentů. Například pro každý dokument pro prodloužení platnosti smlouvy, který je v knihovně dokumentů identifikován, se zobrazí sloupce, které pro každý dokument zobrazují datum zahájení služby a Klient .

Ukázkové soubory můžete použít k trénování a testování klasifikátorů a extraktorů ve vašem modelu. Ukázkové soubory poskytují příklady modelu, co hledat při pokusu o identifikaci a extrahování dat ze souborů. Například byste vytrénovali klasifikátory a extraktory pro prodloužení smlouvy s příklady dokumentů pro prodloužení smlouvy, se kterými vaše společnost pracuje. K otestování efektivity modelu můžete také použít ukázkové soubory.

Po publikování modelu ho použijte v centru obsahu na libovolnou knihovnu dokumentů SharePointu, ke které máte přístup.

Požadavky a omezení

Informace o požadavcích, které je potřeba zvážit při výběru tohoto modelu, najdete v tématu Požadavky a omezení pro modely v Microsoft Syntex.