Co je nového v Azure AI Document Intelligence
Tento obsah se vztahuje na: v4.0 (GA) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Služba Document Intelligence se průběžně aktualizuje. Přidejte si tuto stránku do záložek a mějte přehled o poznámkách k verzi, vylepšeních funkcí a nejnovější dokumentaci.
Důležité
Verze rozhraní API ve verzi Preview se po vydání rozhraní API hosta vyřadí z platnosti. Verze rozhraní API verze 2023-02-28-preview se vyřazuje, pokud stále používáte rozhraní API verze Preview nebo přidružené verze SADY SDK, aktualizujte kód tak, aby cílil na nejnovější verzi rozhraní API 2024-11-30 (GA).
Prosince 2024
Sady SDK programovacího jazyka Document Intelligence v4.0 jsou nyní obecně dostupné (GA)!
Nejnovější klientské sady SDK jsou ve výchozím nastavení verze rozhraní REST API (GA) 2024-11-30.
Další informace najdete v klientských knihovnách pro následující podporované programovací jazyky:
Listopad 2024
Rozhraní REST API document Intelligence verze 4.0: 2024-11-30 REST API (GA) je nyní obecně dostupné (GA)! Rozhraní REST API verze 4.0 zahrnuje následující změny:
-
- Rozhraní API služby Batch teď podporuje všechny modely, včetně všech čtení, rozložení, předem připravených svislých a vlastních modelů.
- Rozhraní API služby Batch podporuje funkci LIST, která uživatelům umožňuje vypsat dávkové úlohy během posledních sedmi dnů.
- Rozhraní API služby Batch podporuje funkci DELETE pro explicitní odstranění dávkové úlohy pro dodržování předpisů GDPR a dodržování předpisů v oblasti ochrany osobních údajů.
- GetAnalyzeBatchResult podporuje resultId v odpovědi na LIST všechny id výsledku.
🆕 Prohledávatelný SOUBOR PDF. Předem vytvořený model pro čtení teď podporuje formáty obrázků (JPEG/JPG, PNG, BMP, TIFF, HEIF) a rozšíření jazyka, aby zahrnovaly čínštinu, japonštinu a korejštinu pro výstup PDF.
-
- Vlastní klasifikační model podporuje přírůstkové trénování. Nové ukázky můžete přidat do tříd exisisting nebo přidat nové třídy odkazováním na existující klasifikátor.
- V případě verze 4.0 vlastní klasifikační model ve výchozím nastavení nedělí dokumenty během analýzy. Abyste zachovali starší chování, musíte explicitně nastavit vlastnost splitMode na automatické.
- Vlastní klasifikační model teď jako nový limit trénovacích stránek podporuje 25 000 stránek.
-
- Vlastní neurální model teď podporuje detekci podpisů.
-
- Model bankovního výpisu USA teď podporuje extrakci kontrolních tabulek.
-
- Podporuje extrakci podpisů plátce.
-
- Model hypotéky nyní podporuje detekci podpisů pro formuláře 1003, 1004, 1005 a závěrečné zveřejnění.
-
- Model účtenek teď podporuje další pole, včetně položky ReceiptType, Tax Rate, CountryRegion, net amount and description.
-
- Nové předem vytvořené daňové modely přidané pro 1095A, 1095C, 1099SSA a W4.
Rozhraní API verze 4.0 zahrnuje kumulativní aktualizace z verzí Preview, jak je uvedeno níže:
Srpen 2024
Rozhraní REST API document Intelligence 2024-07-31-preview je nyní k dispozici. Toto rozhraní API ve verzi Preview představuje nové a aktualizované funkce:
Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Nový model extrakce polí dokumentu na portálu Azure AI Foundry je k dispozici pouze v oblasti USA – středosever:
USA – východ
USA – západ 2
Západní Evropa
USA – středosever
🆕 Vytváření modelů s vlastními klasifikátory
- Funkce Document Intelligence teď přidává podporu pro psaní modelu s explicitním vlastním klasifikačním modelem. Přečtěte si další informace o výhodách používání nové funkce pro psaní zpráv.
-
- Vlastní klasifikační model teď podporuje také místní aktualizaci modelu.
- Vlastní klasifikační model přidává podporu operace kopírování modelu, která umožňuje zálohování a zotavení po havárii.
- Vlastní klasifikační model teď podporuje explicitní zadání stránek, které se mají klasifikovat ze vstupního dokumentu.
-
- Extrahujte informace z Appraisal (formulář 1004).
- Extrahujte informace z ověření zaměstnání (formulář 1005).
-
- Extrahujte příjemce, částku, datum a další důležité informace z kontrol.
-
- Nové předem připravené ke zpracování plateb za účelem extrakce mezd, hodin, odpočtů, čistých plateb a dalších.
-
- Nové předem připravené pro extrakci informací o účtech, včetně počátečních a koncových zůstatků, podrobností o transakcích z bankovních výpisů.
-
- Nový jednotný daňový model USA, který může extrahovat z formulářů, jako jsou W-2, 1098, 1099 a 1040.
🆕 Prohledávatelný SOUBOR PDF. Předem vytvořený model čtení teď podporuje výstup PDF pro stahování souborů PDF s vloženým textem z výsledků extrakce, což umožňuje využít PDF ve scénářích, jako je například vyhledávání kopie obsahu.
Model rozložení teď podporuje vylepšenou detekci obrázků, kde se obrázky z dokumentů teď dají stáhnout jako soubor obrázku, který se má použít k dalšímu pochopení obrázku. Model rozložení také nabízí vylepšení modelu OCR pro vylepšení cílení na naskenovaný text pro jednotlivé znaky, text v rámečku a zhuštěné textové dokumenty.
-
- Funkce Document Intelligence teď přidává podporu operace dávkové analýzy, která podporuje analýzu sady dokumentů za účelem zjednodušení vývojářského prostředí a zvýšení efektivity.
Květen 2024
Document Intelligence Studio přidává podporu pro ověřování Microsoft Entra (dříve Azure Active Directory). Další informace najdete v tématu Ověřování v nástroji Document Intelligence Studio.
Únor 2024
Rozhraní REST API document Intelligence 2024-07-31-preview je nyní k dispozici. Toto rozhraní API ve verzi Preview představuje nové a aktualizované funkce:
Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure:
- USA – východ
- USA – západ 2
- Západní Evropa
Model rozložení teď podporuje detekci obrázků a hierarchickou analýzu struktury dokumentů (oddíly a pododdíly). Vylepšili jsme také kvalitu umělé inteligence pro pořadí čtení a detekci logických rolí.
-
- Vlastní modely extrakce teď podporují skóre spolehlivosti na úrovni buněk, řádků a tabulek. Přečtěte si další informace o spolehlivosti tabulek, řádků a buněk.
- Vlastní modely extrakce mají vylepšení kvality AI pro extrakci polí.
- Model extrakce vlastních šablon teď podporuje extrahování překrývajících se polí. Přečtěte si další informace o překrývajících se polích a jejich používání.
-
- Vlastní klasifikační model teď podporuje přírůstkové trénování pro scénáře, ve kterých potřebujete aktualizovat model klasifikátoru s přidanými ukázkami nebo třídami. Přečtěte si další informace o přírůstkovém trénování.
- Vlastní klasifikační model přidává podporu pro typy dokumentů Office (.docx, .pptx a .xls). Přečtěte si další informace o podpoře rozšířeného typu dokumentu.
-
- Podpora nových národních prostředí:
Národní prostředí Kód Arabština ( ar
)Bulharština ( bg
)Řečtina ( el
)Hebrejština ( he
)Makedonština ( mk
)Ruština ( ru
)Srbština cyrilice ( sr-cyrl
)Ukrajinština ( uk
)Thajština ( th
)Turečtina ( tr
)Vietnamština ( vi
)- Podpora nových kódů měn:
Měna Národní prostředí Kód BAM
Bosenská sklápěcí značka ( ba
)BGN
Bulharský lev ( bg
)ILS
Izraelská nová šekelová ( il
)MKD
Makedonský denár ( mk
)RUB
Ruský rubl ( ru
)THB
Thai Baht ( th
)TRY
Turecká Lira ( tr
)UAH
Ukrajinská hřivna ( ua
)VND
Vietnamský dong ( vn
)- Daňové položky podporují rozšíření Pro Německo (
de
), Španělsko (es
), Portugalsko (pt
), Angličtina Kanadaen-CA
.
-
- Rozšířená podpora pro ID a řidičské licence Evropské unie.
-
- Extrahování informací z jednotné žádosti o půjčku na bydlení (formulář 1003).
- Extrahujte informace z jednotného přepisování a přenosu nebo formuláře 1008.
- Extrahujte informace z uzavření hypotéky.
🆕 Model kreditní/debetní karty
- Extrahujte informace z bankovních karet.
-
- Nové předem připravené pro extrakci informací z manželství certifikátů.
Prosinec 2023
Klientské knihovny Document Intelligence, které cílí na rozhraní REST API 2023-10-31-preview , jsou teď k dispozici pro použití.
Listopad 2023
Rozhraní REST API document Intelligence 2023-10-31-preview je teď k dispozici. Toto rozhraní API ve verzi Preview představuje nové a aktualizované funkce:
Verze Public Preview 2023-10-31-preview je aktuálně dostupná jenom v následujících oblastech Azure:
- USA – východ
- USA – západ 2
- Západní Evropa
-
- Rozšíření jazyka pro rukopis: ruština(
ru
), arabština(ar
), thajština(th
). - Dodržování předpisů eO (Cyber Executive Order).
- Rozšíření jazyka pro rukopis: ruština(
-
- Podpora souborů Office a HTML
- Podpora výstupu Markdownu
- Vylepšení detekce nadpisů oddílů, extrakce, pořadí čtení a oddílů
- Díky verzi Document Intelligence 2023-10-31-preview je obecný model dokumentu (předem připravený dokument) zastaralý. Pokud chcete extrahovat páry klíč-hodnota z dokumentů, použijte
prebuilt-layout
model s povoleným volitelným parametremfeatures=keyValuePairs
řetězce dotazu.
-
- Teď extrahuje měnu pro všechna pole související s cenou.
-
- Nová podpora pro medicare a Medicaid informace.
-
- Nový daňový model 1099. Podporuje základní formát 1099 a následující varianty: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Podpora pro
KVK
pole - Podpora pro
BPAY
pole - Řadu vylepšení polí.
- Podpora pro
-
- Podpora vícejazyčných dokumentů
- Nové možnosti rozdělení stránky: automatické rozdělení, vždy rozděleno podle stránky, bez rozdělení.
Poznámka:
V případě obecné dostupnosti rozhraní API (GA) z 2022-08-31 se přidružená rozhraní API ve verzi Preview přestanou používat. Pokud používáte verze rozhraní API z 2021-09-30 preview, verze API z 2022-01-30 nebo 2022-06-30-preview, aktualizujte aplikace tak, aby cílily na verzi rozhraní API z 2022-08-31. Existuje několik menších změn, kde najdete další informace v průvodci migrací.
Červenec 2023
Poznámka:
Rozpoznávání formulářů je teď Azure AI Document Intelligence!
- Dokument, služby Azure AI zahrnují všechny dříve známé služby Cognitive Services a Aplikace Azure lied AI Services.
- Ceny se nemění.
- Názvy služeb Cognitive Services a Aplikace Azure lied AI se nadále používají ve fakturaci Azure, analýze nákladů, ceníku a cenových rozhraních API.
- V aplikačních programovacích rozhraních (API) ani klientských knihovnách nedošlo k žádným zásadním změnám.
- Některé platformy stále čekají na aktualizaci přejmenování. Všechny zmínky o Rozpoznávání formulářů nebo funkci Document Intelligence v naší dokumentaci odkazují na stejnou službu Azure.
Document Intelligence v3.1 (GA)
Rozhraní API Document Intelligence verze 3.1 je nyní obecně dostupné (GA)! Verze rozhraní API odpovídá 2023-07-31
.
Rozhraní API verze 3.1 zavádí nové a aktualizované funkce:
- Rozhraní API pro funkci Document Intelligence jsou teď modulární a podporují volitelné funkce. Teď můžete výstup přizpůsobit tak, aby obsahoval funkce, které potřebujete. Přečtěte si další informace o volitelných parametrech.
- Rozhraní API pro klasifikaci dokumentů pro rozdělení jednoho souboru na jednotlivé dokumenty Přečtěte si další informace o klasifikaci dokumentů.
- Předem připravený model kontraktu.
- Předem připravená daňová forma USA 1098 model.
- Podpora typů souborů Office pomocí rozhraní API pro čtení
- Rozpoznávání čárových kódů v dokumentech
- Funkce doplňku pro rozpoznávání vzorců
- Funkce doplňku pro rozpoznávání písem
- Podpora dokumentů s vysokým rozlišením
- Vlastní neurální modely teď k trénování vyžadují jednu ukázku s popiskem.
- Rozšíření jazyka vlastních neurálních modelů Trénování neurálního modelu pro dokumenty v 30 jazycích Úplný seznam podporovaných jazyků najdete v podpoře jazyků.
- 🆕 Předem připravený model zdravotní karty.
- Předem připravené rozšíření národního prostředí modelu faktury
- Předem připravený jazyk modelu příjmu a rozšíření národního prostředí s více než 100 podporovanými jazyky.
- Předem vytvořený model ID teď podporuje evropská ID.
Aktualizace uživatelského rozhraní nástroje Document Intelligence Studio
✔️ Možnosti analýzy
Funkce Document Intelligence teď podporuje sofistikovanější možnosti analýzy a Studio umožňuje snadno konfigurovat možnosti doplňku jedním vstupním bodem (tlačítko Analyzovat možnosti).
V závislosti na scénáři extrakce dokumentů nakonfigurujte rozsah analýzy, rozsah stránek dokumentu, volitelnou detekci a prémiové funkce detekce.
Poznámka:
Extrakce písem není vizualizována v nástroji Document Intelligence Studio. Můžete ale zkontrolovat část stylů výstupu JSON pro výsledky detekce písem.
✔️ Automatické označování dokumentů pomocí předem připravených modelů nebo jednoho z vašich vlastních modelů
Na stránce popisování vlastního modelu extrakce teď můžete dokumenty automaticky označovat pomocí některého z předem připravených modelů nebo modelů služby Document Intelligent Service, které jste dříve natrénovali.
U některých dokumentů můžou být po spuštění automatického popisku duplicitní popisky. Nezapomeňte popisky upravit tak, aby na stránce popisků nebyly žádné duplicitní popisky.
✔️ Automatické popisování tabulek
Na stránce popisování vlastního modelu extrakce teď můžete tabulky v dokumentu automaticky označovat, aniž byste museli tabulky označovat ručně.
✔️ Přidání testovacích souborů přímo do trénovací datové sady
Jakmile vytrénujete vlastní model extrakce, využijte testovací stránku ke zlepšení kvality modelu tak, že v případě potřeby nahrajete testovací dokumenty do trénovací datové sady.
Pokud se u některých popisků vrátí skóre nízké spolehlivosti, ujistěte se, že jsou popisky správné. Pokud ne, přidejte je do trénovací datové sady a znovu oznamte, aby se zlepšila kvalita modelu.
✔️ Použití možností a filtrů seznamu dokumentů ve vlastních projektech
Použijte stránku popisování vlastního modelu extrakce. Trénovací dokumenty teď můžete snadno procházet pomocí funkce vyhledávání, filtrování a řazení.
Zobrazení mřížky můžete využít k zobrazení náhledu dokumentů nebo k snadnějšímu procházení dokumentů pomocí zobrazení seznamu.
✔️ Sdílení projektů
- Snadno sdílejte vlastní projekty extrakce. Další informace najdete v tématu Sdílení projektu s vlastními modely.
Květen 2023
Představení aktualizované dokumentace k buildu 2023
🆕 Přehled funkce Document Intelligence – vylepšená navigace, strukturované přístupové body a rozšířené obrázky
🆕 Volba modelu Document Intelligence poskytuje pokyny pro výběr nejlepšího řešení Document Intelligence pro vaše projekty a pracovní postupy.
Duben 2023
Oznámení nejnovější verze Public Preview klientské knihovny Document Intelligence
Rozhraní DOCUMENT Intelligence REST API verze 2023-02-28-preview podporuje klientské knihovny verzí Public Preview. Tato verze zahrnuje následující nové funkce a možnosti dostupné pro .NET/C# (4.1.0-beta-1), Javu (4.1.0-beta-1), JavaScript (4.1.0-beta-1) a klientské knihovny Pythonu (3.3.0b.1):
Další informace najdete ve zprávě k vydání sady Document Intelligence SDK (Public Preview) a březen 2023.
Březen 2023
Důležité
2023-02-28-preview
možnosti jsou aktuálně dostupné pouze v následujících oblastech:
- Západní Evropa
- USA – západ 2
- USA – východ
- Vlastní klasifikační model je nová funkce v rámci funkce Document Intelligence počínaje rozhraním
2023-02-28-preview
API. - Možnosti dotazování polí přidaných do obecného modelu dokumentů používají modely Azure OpenAI k extrahování konkrétních polí z dokumentů. Vyzkoušejte funkci Obecné dokumenty s poli dotazu pomocí nástroje Document Intelligence Studio. Pole dotazu jsou aktuálně aktivní pouze pro prostředky v
East US
dané oblasti. - Možnosti doplňku:
- Aktualizace vlastního modelu extrakce:
- Vlastní neurální model teď podporuje přidané jazyky pro trénování a analýzu. Trénujte neurální modely pro holandštinu, francouzštinu, němčinu, italštinu a španělštinu.
- Vlastní model šablony má nyní vylepšenou funkci detekce podpisů.
- Aktualizace sady Document Intelligence Studio :
- Kromě podpory všech nových funkcí, jako jsou klasifikace a pole dotazů, teď Studio umožňuje sdílení projektů pro projekty vlastních modelů.
- Nové doplňky modelu ve verzi Preview: vakcinační karty, smlouvy, daň z USA 1098, US Tax 1098-E a US Tax 1098-T. Pokud chcete požádat o přístup k vrátovaným modelům Preview, vyplňte a odešlete formulář žádosti o privátní náhled funkce Document Intelligence.
- Aktualizace modelu účtenek:
- Model účtenek přidává podporu pro tepelné účtenky.
- Model účtenek teď přidává podporu jazyků pro 18 jazyků a tři regionální jazyky (angličtina, francouzština, portugalština).
- Model účtenek teď podporuje
TaxDetails
extrakci.
- Model rozložení teď vylepšuje rozpoznávání tabulek.
- Model pro čtení teď přidává vylepšení pro rozpoznávání jednociferných znaků.
2023. únor
Vyberte kontejnery Document Intelligence pro verzi 3.0, které můžete použít.
Aktuálně jsou k dispozici kontejnery Read v3.0 a Layout v3.0 .
Další informace najdete v tématu Instalace a spouštění kontejnerů Document Intelligence.
Leden 2023
Předem připravený model účtenek – přidání podporovaných jazyků Model účtenek teď podporuje tyto přidané jazyky a národní prostředí.
- Japonština – Japonsko (ja-JP)
- Francouzština – Kanada (fr-CA)
- Nizozemština – Nizozemsko (nl-NL)
- Angličtina - Spojené arabské emiráty (en-AE)
- Portugalština – Brazílie (pt-BR)
Předem připravený model faktury – přidání podporovaných jazyků Model faktury teď podporuje tyto přidané jazyky a národní prostředí.
- Angličtina - USA (en-US), Austrálie (en-AU), Kanada (en-CA), Velká Británie (en-UK), Indie (en-IN)
- Španělština - Španělsko (es-ES)
- Francouzština - Francie (fr-FR)
- Italština - Itálie (it-IT)
- Portugalština – Portugalsko (pt-PT)
- Nizozemština – Nizozemsko (nl-NL)
Předem připravený model faktury – byla rozpoznána přidaná pole. Model faktury teď rozpozná tato přidaná pole.
- Kód měny
- Možnosti platby
- Celková sleva
- Daňové položky (pouze en-IN)
Předem vytvořený model ID – přidání podporovaných typů dokumentů Model ID teď podporuje tyto přidané typy dokumentů.
- AMERICKÉ vojenské ID
Tip
Všechny aktualizace z ledna 2023 jsou k dispozici s rozhraním REST API verze 2022-08-31 (GA).
Předem připravený model účtenek – další podpora jazyků:
Předem připravený model účtenek přidává podporu pro následující jazyky:
- Angličtina - Spojené arabské emiráty (en-AE)
- Nizozemština – Nizozemsko (nl-NL)
- Francouzština – Kanada (fr-CA)
- Němčina - (de-DE)
- Italština - (it-IT)
- Japonština – Japonsko (ja-JP)
- Portugalština – Brazílie (pt-BR)
Předem připravený model faktury – další podpora jazyka a extrakce polí
Předem připravený model faktury přidává podporu pro následující jazyky:
- Angličtina - Austrálie (en-AU), Kanada (en-CA), Spojené království (en-UK), Indie (en-IN)
- Portugalština – Brazílie (pt-BR)
Předem připravený model faktury teď přidává podporu pro následující extrakce polí:
- Kód měny
- Možnosti platby
- Celková sleva
- Daňové položky (pouze en-IN)
Předem vytvořený model dokumentu ID – podpora dalších typů dokumentů
Předem vytvořený model dokumentu ID teď přidává podporu pro následující typy dokumentů:
- Rozšíření řidičského průkazu podporující Indii, Kanadu, Spojené království a Austrálii
- Americké vojenské identifikační karty a dokumenty
- Karty a dokumenty ID Indie (PAN a Aadhaar)
- Vizitky a dokumenty austrálie (fotokarta, ID klíče)
- Identifikační karty a dokumenty Kanady (identifikační karta, maple card)
- Průkazy a doklady spojeného království (národní/regionální průkaz totožnosti)
Prosinec 2022
Aktualizace nástroje Document Intelligence Studio
Verze nástroje Document Intelligence Studio z prosince zahrnuje nejnovější aktualizace sady Document Intelligence Studio. Existují významná vylepšení uživatelského prostředí, především s podporou popisků vlastních modelů.
Rozsah stránek Studio teď podporuje analýzu zadaných stránek z dokumentu.
Popisky vlastního modelu:
Automatické spuštění rozhraní API rozložení Můžete se rozhodnout spustit rozhraní API rozložení pro všechny dokumenty automaticky v úložišti objektů blob během procesu nastavení vlastního modelu.
Vyhledat Studio teď obsahuje funkci vyhledávání pro vyhledání slov v dokumentu. Toto vylepšení umožňuje snadnější navigaci při označování.
Navigace Můžete vybrat popisky, které budou cílit na slova označená v dokumentu.
Automatické popisování tabulek Po výběru ikony tabulky v dokumentu se můžete rozhodnout automaticky oznamovat extrahoovanou tabulku v zobrazení popisků.
Podtypy popisků a podtypy druhé úrovně Studio teď podporuje podtypy pro sloupce tabulky, řádky tabulky a podtypy druhé úrovně pro typy, jako jsou kalendářní data a čísla.
Vytváření vlastních neurálních modelů je nyní podporováno v oblasti US Gov Virginia.
Verze
2022-01-30-preview
rozhraní API verze Preview a2021-09-30-preview
budou vyřazeny z 31. ledna 2023. Aktualizujte na2022-08-31
verzi rozhraní API, abyste se vyhnuli přerušení služeb.
Listopad 2022
- Oznámení nejnovější stabilní verze knihoven Azure AI Document Intelligence
- Tato verze obsahuje důležité změny a aktualizace pro klientské knihovny .NET, Java, JavaScript a Python. Další informace najdete v tématu Azure SDK DevBlog.
- Nejvýznamnějším vylepšením jsou zavedení dvou nových klientů, a
DocumentAnalysisClient
DocumentModelAdministrationClient
také .
Říjen 2022
Obsah ve verzi Document Intelligence
Dokumentace k funkci Document Intelligence je aktualizovaná tak, aby představila prostředí s verzí. Teď se můžete rozhodnout zobrazit obsah, který cílí na
v3.0 GA
prostředí nebo prostředív2.1 GA
. Prostředí verze 3.0 je výchozí.
Ukázkový kód nástroje Document Intelligence Studio
- Vzorový kód pro prostředí popisků Document Intelligence Studio je teď k dispozici na GitHubu. Zákazníci můžou vyvíjet a integrovat funkci Document Intelligence do vlastního uživatelského prostředí nebo vytvářet vlastní nové uživatelské rozhraní pomocí ukázkového kódu nástroje Document Intelligence Studio.
Rozšíření jazyka
- S nejnovější verzí Preview podporují modely šablon Document Intelligence pro čtení (OCR), Layout a Custom template 134 nových jazyků. Mezi tyto jazykové doplňky patří řečtina, lotyština, srbština, thajština, ukrajinština a vietnamština spolu s několika jazyky latinky a cyrilice. Funkce Document Intelligence teď obsahuje celkem 299 podporovaných jazyků v nejnovější verzi GA a nových verzích Preview. Všechny podporované jazyky najdete na stránkách podporovaných jazyků.
- Parametr REST API
api-version=2022-06-30-preview
použijte při použití rozhraní API nebo odpovídající sady SDK pro podporu nových jazyků ve vašich aplikacích.
Nový předem připravený model kontraktu
- Nový předem připravený, který extrahuje informace ze smluv, jako jsou strany, titul, ID smlouvy, datum provedení a další. model kontraktů je aktuálně ve verzi Preview a požádejte o přístup sem.
Rozšíření oblasti pro trénování vlastních neurálních modelů
- Trénování vlastních neurálních modelů se teď podporuje v přidaných oblastech.
- USA – východ
- USA – východ 2
- US Gov – Arizona
- Trénování vlastních neurálních modelů se teď podporuje v přidaných oblastech.
2022. září
Poznámka:
Od verze 4.0.0 byla zavedena nová sada klientů, která využívá nejnovější funkce služby Document Intelligence.
Verze GA sady SDK verze 4.0.0 zahrnuje následující aktualizace:
- Verze 4.0.0 GA (2022-09-08)
- Podporuje klienty REST API verze 3.0 a v2.0.
Rozšíření oblastí pro trénování vlastních neurálních modelů se teď podporuje v šesti nových oblastech.
- Austrálie – východ
- USA – střed
- Východní Asie
- Francie – střed
- Velká Británie – jih
- USA – západ 2
Úplný seznam oblastí, ve kterých se trénování podporuje, najdete ve vlastních neurálních modelech.
Verze
4.0.0 GA
sady Document Intelligence SDK:- Klientské knihovny Document Intelligence verze 4.0.0 (.NET/C#, Java, JavaScript) a verze 3.2.0 (Python) jsou obecně dostupné a připravené k použití v produkčních aplikacích!.
- Další informace o klientských knihovnách Document Intelligence najdete v přehledu sady SDK.
- Aktualizujte aplikace pomocí průvodce migrací programovacího jazyka.
Srpen 2022
Verze Document Intelligence SDK beta ze srpna 2022 preview obsahuje následující aktualizace:
Verze 4.0.0-beta.5 (2022-08-09)
Obecně dostupné funkce Document Intelligence v3.0
- Rozhraní DOCUMENT Intelligence REST API verze 3.0 je teď obecně dostupné a připravené k použití v produkčních aplikacích! Aktualizujte aplikace pomocí rozhraní REST API verze 2022-08-31.
Aktualizace nástroje Document Intelligence Studio
- Další kroky. Na každé stránce modelu teď studio obsahuje další kroky. Uživatelé můžou rychle odkazovat na ukázkový kód, pokyny pro řešení potíží a informace o cenách.
- Vlastní modely. Studio teď zahrnuje možnost změnit pořadí popisků v projektech vlastních modelů, aby se zlepšila efektivita označování.
- Vlastní modely kopírování je možné zkopírovat napříč službami Document Intelligence v rámci studia. Tato operace umožňuje povýšení natrénovaného modelu do jiných prostředí a oblastí.
- Odstraňte dokumenty. Studio teď podporuje odstraňování dokumentů z datové sady s popiskem v rámci vlastních projektů.
Aktualizace služby Document Intelligence
- předem sestavené čtení. Model OCR pro čtení je teď k dispozici také ve funkci Document Intelligence s odstavci a rozpoznáváním jazyka jako dvě nové funkce. Funkce Document Intelligence Read cílí na pokročilé scénáře dokumentů v souladu s širšími možnostmi analýzy dokumentů v nástroji Document Intelligence.
- předem připravené rozložení. Model rozložení extrahuje odstavce a zda je extrahovaný text odstavcem, nadpisem, nadpisem oddílu, poznámkou pod čarou, záhlavím stránky, zápatím stránky nebo číslem stránky.
- předem připravená faktura. Pole TotalVAT a Line/VAT se teď přeloží na existující pole TotalTax a Line/Tax.
- prebuilt-idDocument. Podpora extrakce dat pro ID státu USA, sociální zabezpečení a zelené karty Podpora informací o cestovním vízu.
- předem připravená účtenka. Rozšířená podpora národního prostředí pro francouzštinu (fr-FR), španělštinu (es-ES), portugalštinu (pt-PT), italštinu (it-IT) a němčinu (de-DE).
- předem připravená vizitka. Analýza adres podporuje extrahování dílčích polí pro komponenty adres, jako jsou adresa, město, stát, země/oblast a PSČ.
Vylepšení kvality AI
- předem sestavené čtení. Vylepšená podpora pro jednotlivé znaky, ručně psaná data, částky, názvy, další klíčová data, která se běžně vyskytují v účtech a fakturách a vylepšeném zpracování digitálních dokumentů PDF.
- předem připravené rozložení. Podpora pro lepší detekci oříznutých tabulek, okrajových tabulek a lepšího rozpoznávání dlouhých buněk, které pokrývají buňky.
- předem připravený dokument. Vylepšená detekce hodnot a zaškrtávacích políček
- vlastní neurální. Vylepšená přesnost detekce a extrakce tabulek.
Červen 2022
- Verze Document Intelligence SDK beta z června 2022 ve verzi Preview obsahuje následující aktualizace:
Verze 4.0.0-beta.4 (2022-06-08)
Vydání sady Document Intelligence Studio z června je nejnovější aktualizací sady Document Intelligence Studio. Tato aktualizace řeší značné uživatelské prostředí a vylepšení přístupnosti:
- Ukázka kódu pro JavaScript a C#. Karta Kód sady Studio teď přidává ukázky kódu JavaScriptu a jazyka C# kromě existujícího kódu Pythonu.
- Nové uživatelské rozhraní pro nahrání dokumentu Studio teď podporuje nahrávání dokumentu přetažením do nového uživatelského rozhraní pro nahrávání.
- Nová funkce pro vlastní projekty Vlastní projekty teď podporují vytváření účtu úložiště a objektů blob při konfiguraci projektu. Vlastní projekt teď navíc podporuje nahrávání trénovacích souborů přímo v sadě Studio a kopírování existujícího vlastního modelu.
Document Intelligence verze 3.0 2022-06-30-preview představuje rozsáhlé aktualizace napříč rozhraními API funkcí:
- Rozložení rozšiřuje extrakci struktury. Rozložení teď obsahuje přidané prvky struktury včetně oddílů, záhlaví oddílů a odstavců. Tato aktualizace umožňuje jemně odstupňované scénáře segmentace dokumentů. Úplný seznam identifikovaných prvků struktury najdete v rozšířené struktuře.
- Vlastní tabulková pole neurálního modelu podporují. Vlastní modely dokumentů teď podporují tabulková pole. Tabulková pole jsou ve výchozím nastavení také vícestráková. Další informace o tabulkových polích ve vlastních neurálních modelech najdete v tabulkových polích.
- Podpora tabulkových polí modelu vlastní šablony pro tabulky napříč stránkami Vlastní modely formulářů teď podporují tabulková pole napříč stránkami. Další informace o tabulkových polích ve vlastních modelech šablon najdete v tabulkových polích.
- Výstup modelu faktury teď zahrnuje obecné páry klíč-hodnota dokumentu. Pokud faktury obsahují požadovaná pole nad rámec polí zahrnutých v předem připraveném modelu, doplňuje obecný model dokumentu výstup dvojicemi klíč-hodnota. Viz páry klíč-hodnota.
- Rozšíření jazyka faktury Model faktury zahrnuje rozšířenou podporu jazyka. Viz podporované jazyky.
- Předem připravená vizitka teď zahrnuje podporu japonského jazyka. Viz podporované jazyky.
- Předem vytvořený model dokumentu ID Model dokumentu ID teď extrahuje DateOfIssue, Height, Weight, EyeColor, HairColor a DocumentNodeor z licencí řidiče v USA. Viz extrakce polí.
- Model pro čtení teď podporuje běžné typy dokumentů systém Microsoft Office. Typy dokumentů, jako jsou Word (docx), Excel (xlsx) a PowerPoint (pptx), se teď podporují v rozhraní API pro čtení. Viz Extrakce dat pro čtení.
2022. únor
Verze 4.0.0-beta.3 (2022-02-10)
Verze Document Intelligence v3.0 Preview přináší několik nových funkcí, možností a vylepšení:
- Vlastní neurální model nebo vlastní model dokumentu je nový vlastní model, který extrahuje text a značky výběru ze strukturovaných formulářů, částečně strukturovaných a nestrukturovaných dokumentů.
- Předem vytvořený model W-2 je nový předem vytvořený model pro extrakci polí z formulářů W-2 pro scénáře daňového hlášení a ověřování příjmů.
- Rozhraní API pro čtení extrahuje tištěné textové řádky, slova, umístění textu, zjištěné jazyky a rukou psaný text, pokud je zjištěn.
- Obecný model předtrénovaného dokumentu je teď aktualizovaný tak, aby podporoval značky výběru kromě textu rozhraní API, tabulek, struktury a párů klíč-hodnota z formulářů a dokumentů.
- Předem vytvořený model faktury rozhraní API pro faktury rozšiřuje podporu na španělské faktury.
- Document Intelligence Studio přidává nové ukázky pro čtení, W2, ukázky účtenek hotelu a podporu pro trénování nových vlastních neurálních modelů.
- Rozšíření jazyka Document Intelligence Read, Layout a Custom Form add support for 42 new languages including Arabic, Hindi, and other languages using Arabic and Devanagari scripts to expand the coverage to 164 languages. Podpora ručně psaného jazyka se rozšiřuje na japonštinu a korejštinu.
Začínáme s novým rozhraním API verze 3.0 Preview
Extrakce dat modelu Document Intelligence:
Model Extrakce textu Páry klíč-hodnota Značky výběru Tabulky Signatury Čteno ✓ Obecný dokument ✓ ✓ ✓ ✓ Rozložení ✓ ✓ ✓ Faktura ✓ ✓ ✓ ✓ Potvrzení ✓ ✓ ✓ Průkaz totožnosti ✓ ✓ Vizitka ✓ ✓ Vlastní šablona ✓ ✓ ✓ ✓ ✓ Vlastní neurální ✓ ✓ ✓ ✓ Verze Document Intelligence SDK beta verze Preview obsahuje následující aktualizace:
Vlastní modely a režimy dokumentů:
- Vlastní šablona (dříve vlastní formulář).
- Vlastní neurální.
- Vlastní model – režim sestavení
Předem vytvořený model W-2 (předem připravený-tax.us.w2).
Předpřipravený model pro čtení (předem připravená čtení)
Předem připravený model faktury (španělština) (předem připravená faktura).
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.
Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.