Sdílet prostřednictvím


Co je nového v Azure AI Document Intelligence

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (GA)Zaškrtnutí v3.1 (GA) Zaškrtnutí v3.0 (GA) Zaškrtnutí v2.1 (GA)

Služba Document Intelligence se průběžně aktualizuje. Přidejte si tuto stránku do záložek a mějte přehled o poznámkách k verzi, vylepšeních funkcí a nejnovější dokumentaci.

Důležité

Verze rozhraní API ve verzi Preview se po vydání rozhraní API hosta vyřadí z platnosti. Verze rozhraní API verze 2023-02-28-preview se vyřazuje, pokud stále používáte rozhraní API verze Preview nebo přidružené verze SADY SDK, aktualizujte kód tak, aby cílil na nejnovější verzi rozhraní API 2024-11-30 (GA).

Prosince 2024

Sady SDK programovacího jazyka Document Intelligence v4.0 jsou nyní obecně dostupné (GA)!

Nejnovější klientské sady SDK jsou ve výchozím nastavení verze rozhraní REST API (GA) 2024-11-30.

Další informace najdete v klientských knihovnách pro následující podporované programovací jazyky:

Listopad 2024

Rozhraní REST API document Intelligence verze 4.0: 2024-11-30 REST API (GA) je nyní obecně dostupné (GA)! Rozhraní REST API verze 4.0 zahrnuje následující změny:

  • 🆕 Rozhraní API služby Batch

    • Rozhraní API služby Batch teď podporuje všechny modely, včetně všech čtení, rozložení, předem připravených svislých a vlastních modelů.
    • Rozhraní API služby Batch podporuje funkci LIST, která uživatelům umožňuje vypsat dávkové úlohy během posledních sedmi dnů.
    • Rozhraní API služby Batch podporuje funkci DELETE pro explicitní odstranění dávkové úlohy pro dodržování předpisů GDPR a dodržování předpisů v oblasti ochrany osobních údajů.
    • GetAnalyzeBatchResult podporuje resultId v odpovědi na LIST všechny id výsledku.
  • 🆕 Prohledávatelný SOUBOR PDF. Předem vytvořený model pro čtení teď podporuje formáty obrázků (JPEG/JPG, PNG, BMP, TIFF, HEIF) a rozšíření jazyka, aby zahrnovaly čínštinu, japonštinu a korejštinu pro výstup PDF.

  • Vlastní klasifikační model

    • Vlastní klasifikační model podporuje přírůstkové trénování. Nové ukázky můžete přidat do tříd exisisting nebo přidat nové třídy odkazováním na existující klasifikátor.
    • V případě verze 4.0 vlastní klasifikační model ve výchozím nastavení nedělí dokumenty během analýzy. Abyste zachovali starší chování, musíte explicitně nastavit vlastnost splitMode na automatické.
    • Vlastní klasifikační model teď jako nový limit trénovacích stránek podporuje 25 000 stránek.
  • Vlastní neurální model

    • Vlastní neurální model teď podporuje detekci podpisů.
  • Model bankovního výpisu USA

    • Model bankovního výpisu USA teď podporuje extrakci kontrolních tabulek.
  • Kontrola modelu

    • Podporuje extrakci podpisů plátce.
  • Model hypoték

    • Model hypotéky nyní podporuje detekci podpisů pro formuláře 1003, 1004, 1005 a závěrečné zveřejnění.
  • Model účtenek

    • Model účtenek teď podporuje další pole, včetně položky ReceiptType, Tax Rate, CountryRegion, net amount and description.
  • 🆕 Daňový model USA

    • Nové předem vytvořené daňové modely přidané pro 1095A, 1095C, 1099SSA a W4.
  • Rozhraní API verze 4.0 zahrnuje kumulativní aktualizace z verzí Preview, jak je uvedeno níže:

Srpen 2024

Rozhraní REST API document Intelligence 2024-07-31-preview je nyní k dispozici. Toto rozhraní API ve verzi Preview představuje nové a aktualizované funkce:

  • Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Nový model extrakce polí dokumentu na portálu Azure AI Foundry je k dispozici pouze v oblasti USA – středosever:

  • USA – východ

  • USA – západ 2

  • Západní Evropa

  • USA – středosever

  • 🆕 Vytváření modelů s vlastními klasifikátory

  • Vlastní klasifikační model

    • Vlastní klasifikační model teď podporuje také místní aktualizaci modelu.
    • Vlastní klasifikační model přidává podporu operace kopírování modelu, která umožňuje zálohování a zotavení po havárii.
    • Vlastní klasifikační model teď podporuje explicitní zadání stránek, které se mají klasifikovat ze vstupního dokumentu.
  • 🆕 Model hypoték

    • Extrahujte informace z Appraisal (formulář 1004).
    • Extrahujte informace z ověření zaměstnání (formulář 1005).
  • 🆕 Kontrola modelu

    • Extrahujte příjemce, částku, datum a další důležité informace z kontrol.
  • 🆕 Model s průběžnou platbou

    • Nové předem připravené ke zpracování plateb za účelem extrakce mezd, hodin, odpočtů, čistých plateb a dalších.
  • 🆕 Model bankovního výpisu

    • Nové předem připravené pro extrakci informací o účtech, včetně počátečních a koncových zůstatků, podrobností o transakcích z bankovních výpisů.
  • 🆕 Daňový model USA

    • Nový jednotný daňový model USA, který může extrahovat z formulářů, jako jsou W-2, 1098, 1099 a 1040.
  • 🆕 Prohledávatelný SOUBOR PDF. Předem vytvořený model čtení teď podporuje výstup PDF pro stahování souborů PDF s vloženým textem z výsledků extrakce, což umožňuje využít PDF ve scénářích, jako je například vyhledávání kopie obsahu.

  • Model rozložení teď podporuje vylepšenou detekci obrázků, kde se obrázky z dokumentů teď dají stáhnout jako soubor obrázku, který se má použít k dalšímu pochopení obrázku. Model rozložení také nabízí vylepšení modelu OCR pro vylepšení cílení na naskenovaný text pro jednotlivé znaky, text v rámečku a zhuštěné textové dokumenty.

  • 🆕 Rozhraní API služby Batch

    • Funkce Document Intelligence teď přidává podporu operace dávkové analýzy, která podporuje analýzu sady dokumentů za účelem zjednodušení vývojářského prostředí a zvýšení efektivity.
  • Možnosti doplňků

Květen 2024

Document Intelligence Studio přidává podporu pro ověřování Microsoft Entra (dříve Azure Active Directory). Další informace najdete v tématu Ověřování v nástroji Document Intelligence Studio.

Únor 2024

Rozhraní REST API document Intelligence 2024-07-31-preview je nyní k dispozici. Toto rozhraní API ve verzi Preview představuje nové a aktualizované funkce:

  • Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure:

    • USA – východ
    • USA – západ 2
    • Západní Evropa
  • Model rozložení teď podporuje detekci obrázků a hierarchickou analýzu struktury dokumentů (oddíly a pododdíly). Vylepšili jsme také kvalitu umělé inteligence pro pořadí čtení a detekci logických rolí.

  • Vlastní modely extrakce

    • Vlastní modely extrakce teď podporují skóre spolehlivosti na úrovni buněk, řádků a tabulek. Přečtěte si další informace o spolehlivosti tabulek, řádků a buněk.
    • Vlastní modely extrakce mají vylepšení kvality AI pro extrakci polí.
    • Model extrakce vlastních šablon teď podporuje extrahování překrývajících se polí. Přečtěte si další informace o překrývajících se polích a jejich používání.
  • Vlastní klasifikační model

    • Vlastní klasifikační model teď podporuje přírůstkové trénování pro scénáře, ve kterých potřebujete aktualizovat model klasifikátoru s přidanými ukázkami nebo třídami. Přečtěte si další informace o přírůstkovém trénování.
    • Vlastní klasifikační model přidává podporu pro typy dokumentů Office (.docx, .pptx a .xls). Přečtěte si další informace o podpoře rozšířeného typu dokumentu.
  • Model faktury

    • Podpora nových národních prostředí:
    Národní prostředí Kód
    Arabština (ar)
    Bulharština (bg)
    Řečtina (el)
    Hebrejština (he)
    Makedonština (mk)
    Ruština (ru) Srbština cyrilice (sr-cyrl)
    Ukrajinština (uk)
    Thajština (th)
    Turečtina (tr)
    Vietnamština (vi)
    • Podpora nových kódů měn:
    Měna Národní prostředí Kód
    BAM Bosenská sklápěcí značka (ba)
    BGN Bulharský lev (bg)
    ILS Izraelská nová šekelová (il)
    MKD Makedonský denár (mk)
    RUB Ruský rubl (ru)
    THB Thai Baht (th)
    TRY Turecká Lira (tr)
    UAH Ukrajinská hřivna (ua)
    VND Vietnamský dong (vn)
    • Daňové položky podporují rozšíření Pro Německo (de), Španělsko (es), Portugalsko (pt), Angličtina Kanada en-CA.
  • Model ID

  • 🆕 Doklady o hypotékách

    • Extrahování informací z jednotné žádosti o půjčku na bydlení (formulář 1003).
    • Extrahujte informace z jednotného přepisování a přenosu nebo formuláře 1008.
    • Extrahujte informace z uzavření hypotéky.
  • 🆕 Model kreditní/debetní karty

    • Extrahujte informace z bankovních karet.
  • 🆕 Manželství certifikátu

    • Nové předem připravené pro extrakci informací z manželství certifikátů.

Prosinec 2023

Klientské knihovny Document Intelligence, které cílí na rozhraní REST API 2023-10-31-preview , jsou teď k dispozici pro použití.

Listopad 2023

Rozhraní REST API document Intelligence 2023-10-31-preview je teď k dispozici. Toto rozhraní API ve verzi Preview představuje nové a aktualizované funkce:

  • Verze Public Preview 2023-10-31-preview je aktuálně dostupná jenom v následujících oblastech Azure:

    • USA – východ
    • USA – západ 2
    • Západní Evropa
  • Čtení modelu

    • Rozšíření jazyka pro rukopis: ruština(ru), arabština(ar), thajština(th).
    • Dodržování předpisů eO (Cyber Executive Order).
  • Model rozložení

    • Podpora souborů Office a HTML
    • Podpora výstupu Markdownu
    • Vylepšení detekce nadpisů oddílů, extrakce, pořadí čtení a oddílů
    • Díky verzi Document Intelligence 2023-10-31-preview je obecný model dokumentu (předem připravený dokument) zastaralý. Pokud chcete extrahovat páry klíč-hodnota z dokumentů, použijte prebuilt-layout model s povoleným volitelným parametrem features=keyValuePairs řetězce dotazu.
  • Model účtenek

    • Teď extrahuje měnu pro všechna pole související s cenou.
  • Model zdravotní pojištění

    • Nová podpora pro medicare a Medicaid informace.
  • Modely daňových dokumentů USA

    • Nový daňový model 1099. Podporuje základní formát 1099 a následující varianty: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Model faktury

    • Podpora pro KVK pole
    • Podpora pro BPAY pole
    • Řadu vylepšení polí.
  • Vlastní klasifikace

    • Podpora vícejazyčných dokumentů
    • Nové možnosti rozdělení stránky: automatické rozdělení, vždy rozděleno podle stránky, bez rozdělení.
  • Možnosti doplňků

    • Pole dotazu jsou k dispozici ve 2023-10-31-preview vydané verzi.
    • Možnosti doplňků jsou k dispozici ve všech modelech kromě modelu čtení.

Poznámka:

V případě obecné dostupnosti rozhraní API (GA) z 2022-08-31 se přidružená rozhraní API ve verzi Preview přestanou používat. Pokud používáte verze rozhraní API z 2021-09-30 preview, verze API z 2022-01-30 nebo 2022-06-30-preview, aktualizujte aplikace tak, aby cílily na verzi rozhraní API z 2022-08-31. Existuje několik menších změn, kde najdete další informace v průvodci migrací.

Červenec 2023

Poznámka:

Rozpoznávání formulářů je teď Azure AI Document Intelligence!

  • Dokument, služby Azure AI zahrnují všechny dříve známé služby Cognitive Services a Aplikace Azure lied AI Services.
  • Ceny se nemění.
  • Názvy služeb Cognitive Services a Aplikace Azure lied AI se nadále používají ve fakturaci Azure, analýze nákladů, ceníku a cenových rozhraních API.
  • V aplikačních programovacích rozhraních (API) ani klientských knihovnách nedošlo k žádným zásadním změnám.
  • Některé platformy stále čekají na aktualizaci přejmenování. Všechny zmínky o Rozpoznávání formulářů nebo funkci Document Intelligence v naší dokumentaci odkazují na stejnou službu Azure.

Document Intelligence v3.1 (GA)

Rozhraní API Document Intelligence verze 3.1 je nyní obecně dostupné (GA)! Verze rozhraní API odpovídá 2023-07-31. Rozhraní API verze 3.1 zavádí nové a aktualizované funkce:

Aktualizace uživatelského rozhraní nástroje Document Intelligence Studio

✔️ Možnosti analýzy

  • Funkce Document Intelligence teď podporuje sofistikovanější možnosti analýzy a Studio umožňuje snadno konfigurovat možnosti doplňku jedním vstupním bodem (tlačítko Analyzovat možnosti).

  • V závislosti na scénáři extrakce dokumentů nakonfigurujte rozsah analýzy, rozsah stránek dokumentu, volitelnou detekci a prémiové funkce detekce.

    Animovaný snímek obrazovky znázorňující použití tlačítka analyzovat možnosti ke konfiguraci možností v sadě Studio

    Poznámka:

    Extrakce písem není vizualizována v nástroji Document Intelligence Studio. Můžete ale zkontrolovat část stylů výstupu JSON pro výsledky detekce písem.

✔️ Automatické označování dokumentů pomocí předem připravených modelů nebo jednoho z vašich vlastních modelů

  • Na stránce popisování vlastního modelu extrakce teď můžete dokumenty automaticky označovat pomocí některého z předem připravených modelů nebo modelů služby Document Intelligent Service, které jste dříve natrénovali.

    Animovaný snímek obrazovky s automatickým popiskem v sadě Studio

  • U některých dokumentů můžou být po spuštění automatického popisku duplicitní popisky. Nezapomeňte popisky upravit tak, aby na stránce popisků nebyly žádné duplicitní popisky.

    Snímek obrazovky zobrazující upozornění duplicitního popisku po automatickém popisování

✔️ Automatické popisování tabulek

  • Na stránce popisování vlastního modelu extrakce teď můžete tabulky v dokumentu automaticky označovat, aniž byste museli tabulky označovat ručně.

    Animovaný snímek obrazovky s automatickým popiskem tabulky v sadě Studio

✔️ Přidání testovacích souborů přímo do trénovací datové sady

  • Jakmile vytrénujete vlastní model extrakce, využijte testovací stránku ke zlepšení kvality modelu tak, že v případě potřeby nahrajete testovací dokumenty do trénovací datové sady.

  • Pokud se u některých popisků vrátí skóre nízké spolehlivosti, ujistěte se, že jsou popisky správné. Pokud ne, přidejte je do trénovací datové sady a znovu oznamte, aby se zlepšila kvalita modelu.

Animovaný snímek obrazovky znázorňující, jak přidat testovací soubory do trénovací datové sady

✔️ Použití možností a filtrů seznamu dokumentů ve vlastních projektech

  • Použijte stránku popisování vlastního modelu extrakce. Trénovací dokumenty teď můžete snadno procházet pomocí funkce vyhledávání, filtrování a řazení.

  • Zobrazení mřížky můžete využít k zobrazení náhledu dokumentů nebo k snadnějšímu procházení dokumentů pomocí zobrazení seznamu.

    Snímek obrazovky zobrazující možnosti a filtry zobrazení seznamu dokumentů

✔️ Sdílení projektů

Květen 2023

Představení aktualizované dokumentace k buildu 2023

Duben 2023

Oznámení nejnovější verze Public Preview klientské knihovny Document Intelligence

Březen 2023

Důležité

2023-02-28-preview možnosti jsou aktuálně dostupné pouze v následujících oblastech:

  • Západní Evropa
  • USA – západ 2
  • USA – východ
  • Vlastní klasifikační model je nová funkce v rámci funkce Document Intelligence počínaje rozhraním 2023-02-28-preview API.
  • Možnosti dotazování polí přidaných do obecného modelu dokumentů používají modely Azure OpenAI k extrahování konkrétních polí z dokumentů. Vyzkoušejte funkci Obecné dokumenty s poli dotazu pomocí nástroje Document Intelligence Studio. Pole dotazu jsou aktuálně aktivní pouze pro prostředky v East US dané oblasti.
  • Možnosti doplňku:
    • Extrakce písem se teď rozpozná pomocí 2023-02-28-preview rozhraní API.
    • Extrakce vzorců se teď rozpozná pomocí 2023-02-28-preview rozhraní API.
    • Extrakce vysokého rozlišení se teď rozpozná pomocí 2023-02-28-preview rozhraní API.
  • Aktualizace vlastního modelu extrakce:
    • Vlastní neurální model teď podporuje přidané jazyky pro trénování a analýzu. Trénujte neurální modely pro holandštinu, francouzštinu, němčinu, italštinu a španělštinu.
    • Vlastní model šablony má nyní vylepšenou funkci detekce podpisů.
  • Aktualizace sady Document Intelligence Studio :
    • Kromě podpory všech nových funkcí, jako jsou klasifikace a pole dotazů, teď Studio umožňuje sdílení projektů pro projekty vlastních modelů.
    • Nové doplňky modelu ve verzi Preview: vakcinační karty, smlouvy, daň z USA 1098, US Tax 1098-E a US Tax 1098-T. Pokud chcete požádat o přístup k vrátovaným modelům Preview, vyplňte a odešlete formulář žádosti o privátní náhled funkce Document Intelligence.
  • Aktualizace modelu účtenek:
    • Model účtenek přidává podporu pro tepelné účtenky.
    • Model účtenek teď přidává podporu jazyků pro 18 jazyků a tři regionální jazyky (angličtina, francouzština, portugalština).
    • Model účtenek teď podporuje TaxDetails extrakci.
  • Model rozložení teď vylepšuje rozpoznávání tabulek.
  • Model pro čtení teď přidává vylepšení pro rozpoznávání jednociferných znaků.

2023. únor

  • Vyberte kontejnery Document Intelligence pro verzi 3.0, které můžete použít.

  • Aktuálně jsou k dispozici kontejnery Read v3.0 a Layout v3.0 .

    Další informace najdete v tématu Instalace a spouštění kontejnerů Document Intelligence.


Leden 2023

  • Předem připravený model účtenek – přidání podporovaných jazyků Model účtenek teď podporuje tyto přidané jazyky a národní prostředí.

    • Japonština – Japonsko (ja-JP)
    • Francouzština – Kanada (fr-CA)
    • Nizozemština – Nizozemsko (nl-NL)
    • Angličtina - Spojené arabské emiráty (en-AE)
    • Portugalština – Brazílie (pt-BR)
  • Předem připravený model faktury – přidání podporovaných jazyků Model faktury teď podporuje tyto přidané jazyky a národní prostředí.

    • Angličtina - USA (en-US), Austrálie (en-AU), Kanada (en-CA), Velká Británie (en-UK), Indie (en-IN)
    • Španělština - Španělsko (es-ES)
    • Francouzština - Francie (fr-FR)
    • Italština - Itálie (it-IT)
    • Portugalština – Portugalsko (pt-PT)
    • Nizozemština – Nizozemsko (nl-NL)
  • Předem připravený model faktury – byla rozpoznána přidaná pole. Model faktury teď rozpozná tato přidaná pole.

    • Kód měny
    • Možnosti platby
    • Celková sleva
    • Daňové položky (pouze en-IN)
  • Předem vytvořený model ID – přidání podporovaných typů dokumentů Model ID teď podporuje tyto přidané typy dokumentů.

    • AMERICKÉ vojenské ID

Tip

Všechny aktualizace z ledna 2023 jsou k dispozici s rozhraním REST API verze 2022-08-31 (GA).

  • Předem připravený model účtenek – další podpora jazyků:

    Předem připravený model účtenek přidává podporu pro následující jazyky:

    • Angličtina - Spojené arabské emiráty (en-AE)
    • Nizozemština – Nizozemsko (nl-NL)
    • Francouzština – Kanada (fr-CA)
    • Němčina - (de-DE)
    • Italština - (it-IT)
    • Japonština – Japonsko (ja-JP)
    • Portugalština – Brazílie (pt-BR)
  • Předem připravený model faktury – další podpora jazyka a extrakce polí

    Předem připravený model faktury přidává podporu pro následující jazyky:

    • Angličtina - Austrálie (en-AU), Kanada (en-CA), Spojené království (en-UK), Indie (en-IN)
    • Portugalština – Brazílie (pt-BR)

    Předem připravený model faktury teď přidává podporu pro následující extrakce polí:

    • Kód měny
    • Možnosti platby
    • Celková sleva
    • Daňové položky (pouze en-IN)
  • Předem vytvořený model dokumentu ID – podpora dalších typů dokumentů

    Předem vytvořený model dokumentu ID teď přidává podporu pro následující typy dokumentů:

    • Rozšíření řidičského průkazu podporující Indii, Kanadu, Spojené království a Austrálii
    • Americké vojenské identifikační karty a dokumenty
    • Karty a dokumenty ID Indie (PAN a Aadhaar)
    • Vizitky a dokumenty austrálie (fotokarta, ID klíče)
    • Identifikační karty a dokumenty Kanady (identifikační karta, maple card)
    • Průkazy a doklady spojeného království (národní/regionální průkaz totožnosti)

Prosinec 2022

  • Aktualizace nástroje Document Intelligence Studio

    Verze nástroje Document Intelligence Studio z prosince zahrnuje nejnovější aktualizace sady Document Intelligence Studio. Existují významná vylepšení uživatelského prostředí, především s podporou popisků vlastních modelů.

    • Rozsah stránek Studio teď podporuje analýzu zadaných stránek z dokumentu.

    • Popisky vlastního modelu:

      • Automatické spuštění rozhraní API rozložení Můžete se rozhodnout spustit rozhraní API rozložení pro všechny dokumenty automaticky v úložišti objektů blob během procesu nastavení vlastního modelu.

      • Vyhledat Studio teď obsahuje funkci vyhledávání pro vyhledání slov v dokumentu. Toto vylepšení umožňuje snadnější navigaci při označování.

      • Navigace Můžete vybrat popisky, které budou cílit na slova označená v dokumentu.

      • Automatické popisování tabulek Po výběru ikony tabulky v dokumentu se můžete rozhodnout automaticky oznamovat extrahoovanou tabulku v zobrazení popisků.

      • Podtypy popisků a podtypy druhé úrovně Studio teď podporuje podtypy pro sloupce tabulky, řádky tabulky a podtypy druhé úrovně pro typy, jako jsou kalendářní data a čísla.

  • Vytváření vlastních neurálních modelů je nyní podporováno v oblasti US Gov Virginia.

  • Verze 2022-01-30-preview rozhraní API verze Preview a 2021-09-30-preview budou vyřazeny z 31. ledna 2023. Aktualizujte na 2022-08-31 verzi rozhraní API, abyste se vyhnuli přerušení služeb.


Listopad 2022

  • Oznámení nejnovější stabilní verze knihoven Azure AI Document Intelligence
    • Tato verze obsahuje důležité změny a aktualizace pro klientské knihovny .NET, Java, JavaScript a Python. Další informace najdete v tématu Azure SDK DevBlog.
    • Nejvýznamnějším vylepšením jsou zavedení dvou nových klientů, a DocumentAnalysisClient DocumentModelAdministrationClienttaké .

Říjen 2022

  • Obsah ve verzi Document Intelligence

    • Dokumentace k funkci Document Intelligence je aktualizovaná tak, aby představila prostředí s verzí. Teď se můžete rozhodnout zobrazit obsah, který cílí na v3.0 GA prostředí nebo prostředí v2.1 GA . Prostředí verze 3.0 je výchozí.

      Snímek obrazovky s úvodní stránkou Document Intelligence označující rozevírací nabídku verze

  • Ukázkový kód nástroje Document Intelligence Studio

    • Vzorový kód pro prostředí popisků Document Intelligence Studio je teď k dispozici na GitHubu. Zákazníci můžou vyvíjet a integrovat funkci Document Intelligence do vlastního uživatelského prostředí nebo vytvářet vlastní nové uživatelské rozhraní pomocí ukázkového kódu nástroje Document Intelligence Studio.
  • Rozšíření jazyka

    • S nejnovější verzí Preview podporují modely šablon Document Intelligence pro čtení (OCR), Layout a Custom template 134 nových jazyků. Mezi tyto jazykové doplňky patří řečtina, lotyština, srbština, thajština, ukrajinština a vietnamština spolu s několika jazyky latinky a cyrilice. Funkce Document Intelligence teď obsahuje celkem 299 podporovaných jazyků v nejnovější verzi GA a nových verzích Preview. Všechny podporované jazyky najdete na stránkách podporovaných jazyků.
    • Parametr REST API api-version=2022-06-30-preview použijte při použití rozhraní API nebo odpovídající sady SDK pro podporu nových jazyků ve vašich aplikacích.
  • Nový předem připravený model kontraktu

    • Nový předem připravený, který extrahuje informace ze smluv, jako jsou strany, titul, ID smlouvy, datum provedení a další. model kontraktů je aktuálně ve verzi Preview a požádejte o přístup sem.
  • Rozšíření oblasti pro trénování vlastních neurálních modelů

    • Trénování vlastních neurálních modelů se teď podporuje v přidaných oblastech.
      • USA – východ
      • USA – východ 2
      • US Gov – Arizona

2022. září

Poznámka:

Od verze 4.0.0 byla zavedena nová sada klientů, která využívá nejnovější funkce služby Document Intelligence.

Verze GA sady SDK verze 4.0.0 zahrnuje následující aktualizace:

  • Verze 4.0.0 GA (2022-09-08)
  • Podporuje klienty REST API verze 3.0 a v2.0.

Balíček (NuGet)

Protokol změn / Historie vydaných verzí

Průvodce migrací

ReadMe

Ukázky

  • Rozšíření oblastí pro trénování vlastních neurálních modelů se teď podporuje v šesti nových oblastech.

    • Austrálie – východ
    • USA – střed
    • Východní Asie
    • Francie – střed
    • Velká Británie – jih
    • USA – západ 2
    • Úplný seznam oblastí, ve kterých se trénování podporuje, najdete ve vlastních neurálních modelech.

    • Verze 4.0.0 GA sady Document Intelligence SDK:

      • Klientské knihovny Document Intelligence verze 4.0.0 (.NET/C#, Java, JavaScript) a verze 3.2.0 (Python) jsou obecně dostupné a připravené k použití v produkčních aplikacích!.
      • Další informace o klientských knihovnách Document Intelligence najdete v přehledu sady SDK.
      • Aktualizujte aplikace pomocí průvodce migrací programovacího jazyka.

Srpen 2022

Verze Document Intelligence SDK beta ze srpna 2022 preview obsahuje následující aktualizace:

  • Obecně dostupné funkce Document Intelligence v3.0

    • Rozhraní DOCUMENT Intelligence REST API verze 3.0 je teď obecně dostupné a připravené k použití v produkčních aplikacích! Aktualizujte aplikace pomocí rozhraní REST API verze 2022-08-31.
  • Aktualizace nástroje Document Intelligence Studio

    • Další kroky. Na každé stránce modelu teď studio obsahuje další kroky. Uživatelé můžou rychle odkazovat na ukázkový kód, pokyny pro řešení potíží a informace o cenách.
    • Vlastní modely. Studio teď zahrnuje možnost změnit pořadí popisků v projektech vlastních modelů, aby se zlepšila efektivita označování.
    • Vlastní modely kopírování je možné zkopírovat napříč službami Document Intelligence v rámci studia. Tato operace umožňuje povýšení natrénovaného modelu do jiných prostředí a oblastí.
    • Odstraňte dokumenty. Studio teď podporuje odstraňování dokumentů z datové sady s popiskem v rámci vlastních projektů.
  • Aktualizace služby Document Intelligence

    • předem sestavené čtení. Model OCR pro čtení je teď k dispozici také ve funkci Document Intelligence s odstavci a rozpoznáváním jazyka jako dvě nové funkce. Funkce Document Intelligence Read cílí na pokročilé scénáře dokumentů v souladu s širšími možnostmi analýzy dokumentů v nástroji Document Intelligence.
    • předem připravené rozložení. Model rozložení extrahuje odstavce a zda je extrahovaný text odstavcem, nadpisem, nadpisem oddílu, poznámkou pod čarou, záhlavím stránky, zápatím stránky nebo číslem stránky.
    • předem připravená faktura. Pole TotalVAT a Line/VAT se teď přeloží na existující pole TotalTax a Line/Tax.
    • prebuilt-idDocument. Podpora extrakce dat pro ID státu USA, sociální zabezpečení a zelené karty Podpora informací o cestovním vízu.
    • předem připravená účtenka. Rozšířená podpora národního prostředí pro francouzštinu (fr-FR), španělštinu (es-ES), portugalštinu (pt-PT), italštinu (it-IT) a němčinu (de-DE).
    • předem připravená vizitka. Analýza adres podporuje extrahování dílčích polí pro komponenty adres, jako jsou adresa, město, stát, země/oblast a PSČ.
  • Vylepšení kvality AI

    • předem sestavené čtení. Vylepšená podpora pro jednotlivé znaky, ručně psaná data, částky, názvy, další klíčová data, která se běžně vyskytují v účtech a fakturách a vylepšeném zpracování digitálních dokumentů PDF.
    • předem připravené rozložení. Podpora pro lepší detekci oříznutých tabulek, okrajových tabulek a lepšího rozpoznávání dlouhých buněk, které pokrývají buňky.
    • předem připravený dokument. Vylepšená detekce hodnot a zaškrtávacích políček
    • vlastní neurální. Vylepšená přesnost detekce a extrakce tabulek.

Červen 2022

  • Verze Document Intelligence SDK beta z června 2022 ve verzi Preview obsahuje následující aktualizace:
  • Vydání sady Document Intelligence Studio z června je nejnovější aktualizací sady Document Intelligence Studio. Tato aktualizace řeší značné uživatelské prostředí a vylepšení přístupnosti:

    • Ukázka kódu pro JavaScript a C#. Karta Kód sady Studio teď přidává ukázky kódu JavaScriptu a jazyka C# kromě existujícího kódu Pythonu.
    • Nové uživatelské rozhraní pro nahrání dokumentu Studio teď podporuje nahrávání dokumentu přetažením do nového uživatelského rozhraní pro nahrávání.
    • Nová funkce pro vlastní projekty Vlastní projekty teď podporují vytváření účtu úložiště a objektů blob při konfiguraci projektu. Vlastní projekt teď navíc podporuje nahrávání trénovacích souborů přímo v sadě Studio a kopírování existujícího vlastního modelu.
  • Document Intelligence verze 3.0 2022-06-30-preview představuje rozsáhlé aktualizace napříč rozhraními API funkcí:


2022. únor

  • Verze Document Intelligence v3.0 Preview přináší několik nových funkcí, možností a vylepšení:

    • Vlastní neurální model nebo vlastní model dokumentu je nový vlastní model, který extrahuje text a značky výběru ze strukturovaných formulářů, částečně strukturovaných a nestrukturovaných dokumentů.
    • Předem vytvořený model W-2 je nový předem vytvořený model pro extrakci polí z formulářů W-2 pro scénáře daňového hlášení a ověřování příjmů.
    • Rozhraní API pro čtení extrahuje tištěné textové řádky, slova, umístění textu, zjištěné jazyky a rukou psaný text, pokud je zjištěn.
    • Obecný model předtrénovaného dokumentu je teď aktualizovaný tak, aby podporoval značky výběru kromě textu rozhraní API, tabulek, struktury a párů klíč-hodnota z formulářů a dokumentů.
    • Předem vytvořený model faktury rozhraní API pro faktury rozšiřuje podporu na španělské faktury.
    • Document Intelligence Studio přidává nové ukázky pro čtení, W2, ukázky účtenek hotelu a podporu pro trénování nových vlastních neurálních modelů.
    • Rozšíření jazyka Document Intelligence Read, Layout a Custom Form add support for 42 new languages including Arabic, Hindi, and other languages using Arabic and Devanagari scripts to expand the coverage to 164 languages. Podpora ručně psaného jazyka se rozšiřuje na japonštinu a korejštinu.
  • Začínáme s novým rozhraním API verze 3.0 Preview

  • Extrakce dat modelu Document Intelligence:

    Model Extrakce textu Páry klíč-hodnota Značky výběru Tabulky Signatury
    Čteno
    Obecný dokument
    Rozložení
    Faktura
    Potvrzení
    Průkaz totožnosti
    Vizitka
    Vlastní šablona
    Vlastní neurální
  • Verze Document Intelligence SDK beta verze Preview obsahuje následující aktualizace:


Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.