Sdílet prostřednictvím


Přehled předem připraveného zpracování dokumentů v Microsoft Syntex

Poznámka

Až do června 2025 si můžete zdarma vyzkoušet omezené množství předem připraveného zpracování dokumentů a dalších vybraných služeb Syntex, pokud máte nastavené účtování s průběžným platbou . Informace a omezení najdete v tématu Vyzkoušení Microsoft Syntex a prozkoumání jejích služeb.

Kromě vlastních modelů Microsoft Syntex poskytuje předem připravené modely pro automatizaci extrakce informací.

Poznámka

Společnost Microsoft respektuje ochranu osobních údajů a vlastnictví dat, která používáte k trénování a zpracování modelů v syntexu. Microsoft nepoužívá ani nepřenese žádná data vaší organizace k trénování modelů AI, velkojazyčných modelů ani jiných modelů. Vaše data zůstanou bezpečně v tenantovi vaší organizace. Další informace najdete v tématu Ochrana osobních údajů a ochrana osobních údajů společnosti Microsoft.

Úvod do předem připravených modelů

Předem připravené zpracování dokumentů používá předem připravené modely , které jsou předem nakonfigurované tak, aby rozpoznaly dokumenty a strukturované informace v dokumentech. Nemusíte vytvářet nový vlastní model úplně od začátku, ale můžete iterovat stávající předem vytrénovaný model a přidat konkrétní pole, která vyhovují potřebám vaší organizace.

Předem připravené modely používají optické rozpoznávání znaků (OCR) v kombinaci s modely hlubokého učení k identifikaci a extrakci předdefinovaných textových a datových polí společných pro konkrétní typy dokumentů. Začnete analýzou jednoho ze souborů s předem připraveným modelem. Pak vyberete zjištěná pole, která mají smysl pro váš účel. Pokud model nerozpozná pole, která potřebujete, můžete znovu analyzovat pomocí jiného souboru.

Podobně jako ostatní modely se předem připravené modely vytvářejí a spravují v centru obsahu. Při použití na knihovnu dokumentů SharePointu je model přidružený k typu obsahu a obsahuje sloupce pro uložení extrahovaných informací.

Po publikování modelu ho použijte v centru obsahu na libovolnou knihovnu dokumentů SharePointu, ke které máte přístup.

Dostupné předem připravené modely

V současné době je k dispozici pět předem připravených modelů zpracování: kontrakty, faktury, účtenky, citlivé informace a jednoduché dokumenty.

  • Smlouvy. Předem vytvořený model zpracování kontraktů analyzuje a extrahuje klíčové informace z dokumentů kontraktů. Rozhraní API analyzuje kontrakty v různých formátech a extrahuje informace o klíčových kontraktech, jako je název a adresa klienta, doba trvání smlouvy a datum prodloužení platnosti.

  • Faktury. Model zpracování faktur analyzuje a extrahuje klíčové informace z prodejních faktur. Rozhraní API analyzuje faktury v různých formátech a extrahuje klíčové informace o faktuře , jako je jméno zákazníka, fakturační adresa, datum splatnosti a splatná částka.

  • Účtenky. Model zpracování účtenek analyzuje a extrahuje klíčové informace z prodejních tržeb. Rozhraní API analyzuje tištěné a ručně psané účtenky a extrahuje klíčové informace o účtenkách , jako je jméno obchodníka, telefonní číslo obchodníka, datum transakce, daň a celkový počet transakcí.

  • Citlivé informace. Model citlivých informací analyzuje, detekuje a extrahuje klíčové informace z dokumentů. Rozhraní API analyzuje dokumenty v různých formátech a detekuje a extrahuje klíčové citlivé informace, jako jsou osobní a finanční identifikační čísla, fyzické a e-mailové adresy a telefonní čísla.

  • Jednoduchý dokument. Jednoduchý model zpracování dokumentů nabízí flexibilní předem vytrénované řešení pro extrahování párů klíč-hodnota, výběrových značek a pojmenovaných entit ze základních strukturovaných dokumentů. Tento model také podporuje čárové kódy a rozpoznávání jazyka.

Další předem připravené modely budou k dispozici v budoucích verzích.

Požadavky a omezení

Informace o požadavcích, které je potřeba zvážit při výběru tohoto modelu, najdete v požadavcích a omezeních pro předem připravené zpracování dokumentů.