Udostępnij za pośrednictwem


Co nowego w usłudze Azure AI Document Intelligence

Ta zawartość dotyczy: Znacznik v4.0 (GA) Znacznik v3.1 (GA) v3.0 (GA) Znacznik v2.1 (GA) Znacznik

Usługa analizy dokumentów jest aktualizowana w sposób ciągły. Oznacz tę stronę zakładką, aby być na bieżąco z informacjami o wersji, ulepszeniami funkcji i najnowszą dokumentacją.

Ważne

Wersje interfejsu API w wersji zapoznawczej są wycofyzowane po wydaniu interfejsu API ogólnie dostępnego. Wersja interfejsu API 2023-02-28-preview jest wycofywana, jeśli nadal używasz interfejsu API w wersji zapoznawczej lub skojarzonych wersji zestawu SDK, zaktualizuj kod, aby był przeznaczony dla najnowszej wersji interfejsu API 2024-11-30 (OGÓLNA dostępność).

Grudzień 2024 r.

Zestawy SDK języka programowania analizy dokumentów w wersji 4.0 są teraz ogólnie dostępne (GA)!

Najnowsze zestawy SDK klienta są domyślne dla wersji interfejsu API REST (GA) 2024-11-30.

Aby uzyskać więcej informacji, zobacz Biblioteki klienta dla następujących obsługiwanych języków programowania:

Listopad 2024 r.

Interfejs API REST analizy dokumentów w wersji 4.0: 2024-11-30 interfejs API REST (GA) jest teraz ogólnie dostępny (GA)! Interfejs API REST w wersji 4.0 zawiera następujące zmiany:

  • 🆕 Interfejs API usługi Batch

    • Interfejs API usługi Batch obsługuje teraz wszystkie modele, w tym wszystkie modele odczytu, układu, wstępnie utworzone piony i modele niestandardowe.
    • Interfejs API usługi Batch obsługuje funkcję LIST, aby umożliwić użytkownikom wyświetlanie listy zadań wsadowych w ciągu ostatnich siedmiu dni.
    • Interfejs API usługi Batch obsługuje funkcję DELETE w celu jawnego usunięcia zadania wsadowego dla rodo i zgodności prywatności.
    • Polecenie GetAnalyzeBatchResult obsługuje identyfikator resultId w odpowiedzi na listę wszystkich identyfikatorów resultId.
  • 🆕 Plik PDF z możliwością wyszukiwania. Wstępnie utworzony model odczytu obsługuje teraz formaty obrazów (JPEG/JPG, PNG, BMP, TIFF, HEIF) i rozszerzenie języka w celu uwzględnienia danych wyjściowych plików PDF w języku chińskim, japońskim i koreańskim.

  • Niestandardowy model klasyfikacji

    • Niestandardowy model klasyfikacji obsługuje trenowanie przyrostowe. Możesz dodać nowe przykłady do klas exisisting lub dodać nowe klasy, odwołując się do istniejącego klasyfikatora.
    • W wersji 4.0 niestandardowy model klasyfikacji nie dzieli dokumentów domyślnie podczas analizy. Aby zachować starsze zachowanie, należy jawnie ustawić właściwość "splitMode".
    • Niestandardowy model klasyfikacji obsługuje teraz 25 000 stron jako nowy limit strony szkoleniowej.
  • Niestandardowy model neuronowy

    • Niestandardowy model neuronowy obsługuje teraz wykrywanie podpisów.
  • Model zestawienia banków USA

    • Model us Bank Statement Model obsługuje teraz wyodrębnianie tabel kontrolnych.
  • Sprawdzanie modelu

    • Obsługuje wyodrębnianie podpisów płatnika
  • Model dokumentów hipotecznych

    • Model kredytów hipotecznych obsługuje teraz wykrywanie podpisów formularzy 1003, 1004, 1005 i ujawnienie zamknięcia.
  • Model paragonu

    • Model paragonu obsługuje teraz więcej pól, w tym ReceiptType, Tax rate, CountryRegion, net amount and description.
  • 🆕 Amerykański model podatkowy

    • Nowe wstępnie utworzone modele podatkowe dodane dla 1095A, 1095C, 1099SSA i W4.
  • Interfejs API w wersji 4.0 zawiera zbiorcze aktualizacje z wersji zapoznawczej, jak pokazano na liście:

Sierpień 2024 r.

Interfejs API REST analizy dokumentów 2024-07-31-preview jest teraz dostępny. Ten interfejs API w wersji zapoznawczej wprowadza nowe i zaktualizowane możliwości:

  • Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Nowy model wyodrębniania pól dokumentów w portalu usługi Azure AI Foundry jest dostępny tylko w regionie Północno-środkowe stany USA:

  • Wschodnie stany USA

  • Zachodnie stany USA 2

  • Europa Zachodnia

  • Północno-środkowe stany USA

  • 🆕 Tworzenie modelu za pomocą niestandardowych klasyfikatorów

    • Analiza dokumentów dodaje teraz obsługę komponowania modelu z jawnym niestandardowym modelem klasyfikacji. Dowiedz się więcej o zaletach korzystania z nowej funkcji tworzenia.
  • Niestandardowy model klasyfikacji

    • Niestandardowy model klasyfikacji obsługuje teraz również aktualizowanie modelu w miejscu.
    • Niestandardowy model klasyfikacji dodaje obsługę operacji kopiowania modelu w celu włączenia tworzenia kopii zapasowych i odzyskiwania po awarii.
    • Niestandardowy model klasyfikacji obsługuje teraz jawne określanie stron, które mają być klasyfikowane z dokumentu wejściowego.
  • 🆕 Model dokumentów hipotecznych

    • Wyodrębnij informacje z oceny (formularz 1004).
    • Wyodrębnij informacje z weryfikacji zatrudnienia (formularz 1005).
  • 🆕 Sprawdzanie modelu

    • Wyodrębnij płatność, kwotę, datę i inne istotne informacje z kontroli.
  • 🆕 Model wycinków płatności

    • Nowe wstępnie utworzone w celu przetwarzania wycinków płac w celu wyodrębnienia płac, godzin, odliczeń, płac netto i nie tylko.
  • 🆕 Model zestawienia bankowego

    • Nowe wstępnie utworzone w celu wyodrębnienia informacji o koncie, w tym początkowych i końcowych sald, szczegółów transakcji z wyciągów bankowych.
  • 🆕 Amerykański model podatkowy

    • Nowy ujednolicony amerykański model podatkowy, który może wyodrębnić z formularzy, takich jak W-2, 1098, 1099 i 1040.
  • 🆕 Plik PDF z możliwością wyszukiwania. Wstępnie utworzony model odczytu obsługuje teraz dane wyjściowe pdf do pobierania plików PDF z osadzonym tekstem z wyników wyodrębniania, co pozwala na wykorzystanie formatu PDF w scenariuszach, takich jak kopiowanie zawartości.

  • Model układu obsługuje teraz ulepszone wykrywanie rysunków, gdzie dane z dokumentów można teraz pobrać jako plik obrazu, który ma być używany do dalszego zrozumienia rysunku. Model układu zawiera również ulepszenia modelu OCR do skanowania tekstu przeznaczonego dla pojedynczych znaków, tekstu w polu i gęstych dokumentów tekstowych.

  • 🆕 Interfejs API usługi Batch

    • Analiza dokumentów dodaje teraz obsługę operacji analizy wsadowej w celu obsługi analizowania zestawu dokumentów w celu uproszczenia środowiska dewelopera i zwiększenia wydajności.
  • Możliwości dodatków

Maj 2024 r.

Program Document Intelligence Studio dodaje obsługę uwierzytelniania microsoft Entra (dawniej Azure Active Directory). Aby uzyskać więcej informacji, zobacz Authentication in Document Intelligence Studio (Uwierzytelnianie w programie Document Intelligence Studio).

Luty 2024 r.

Interfejs API REST analizy dokumentów 2024-07-31-preview jest teraz dostępny. Ten interfejs API w wersji zapoznawczej wprowadza nowe i zaktualizowane możliwości:

  • Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:

    • Wschodnie stany USA
    • Zachodnie stany USA 2
    • Europa Zachodnia
  • Model układu obsługuje teraz wykrywanie danych i hierarchiczną analizę struktury dokumentów (sekcje i podsekcje). Poprawiono również jakość sztucznej inteligencji kolejności odczytu i wykrywania ról logicznych.

  • Niestandardowe modele wyodrębniania

    • Niestandardowe modele wyodrębniania obsługują teraz wyniki ufności na poziomie komórki, wiersza i tabeli. Dowiedz się więcej o ufności tabeli, wiersza i komórki.
    • Niestandardowe modele wyodrębniania mają ulepszenia jakości sztucznej inteligencji na potrzeby wyodrębniania pól.
    • Niestandardowy model wyodrębniania szablonów obsługuje teraz wyodrębnianie nakładających się pól. Dowiedz się więcej o nakładających się polach i sposobie ich używania.
  • Niestandardowy model klasyfikacji

    • Niestandardowy model klasyfikacji obsługuje teraz trenowanie przyrostowe dla scenariuszy, w których należy zaktualizować model klasyfikatora przy użyciu dodanych przykładów lub klas. Dowiedz się więcej o trenowaniu przyrostowym.
    • Niestandardowy model klasyfikacji dodaje obsługę typów dokumentów pakietu Office (.docx, .pptx i .xls). Dowiedz się więcej o rozszerzonej obsłudze typów dokumentów.
  • Model faktury

    • Obsługa nowych ustawień regionalnych:
    Ustawienia regionalne Kod
    Arabski (ar)
    Bułgarski (bg)
    Grecki (el)
    Hebrajski (he)
    Macedoński (mk)
    Rosyjski (ru) Serbski cyrylica (sr-cyrl)
    Ukraiński (uk)
    Tajlandzki (th)
    Turecki (tr)
    Wietnamski (vi)
    • Obsługa nowych kodów walutowych:
    Waluta Ustawienia regionalne Kod
    BAM Bośniacki znak kabrioletu (ba)
    BGN Lew bułgarski (bg)
    ILS Izraelski Nowy Shekel (il)
    MKD Macedoński Denar (mk)
    RUB Rubel (ru)
    THB Tajlandzki (th)
    TRY Lira turecka (tr)
    UAH Hrywinia ukraińska (ua)
    VND Wietnamski Dong (vn)
    • Elementy podatkowe wspierają ekspansję dla Niemiec (), Hiszpanii (dees), Portugalii (pt), Angielski Kanada en-CA.
  • Model identyfikatorów

  • 🆕 Dokumenty hipoteczne

    • Wyodrębnij informacje z jednolitego wniosku o pożyczkę mieszkaniową (formularz 1003).
    • Wyodrębnij informacje z formularza 1008 lub podsumowania jednolitego zapisu i przesyłania.
    • Wyodrębnij informacje z ujawnienia zamknięcia kredytu hipotecznego.
  • 🆕 Model karty kredytowej/debetowej

    • Wyodrębnij informacje z kart bankowych.
  • 🆕 Akt małżeństwa

    • Nowe wstępnie utworzone w celu wyodrębnienia informacji z certyfikatów małżeństwa.

Grudzień 2023 r.

Biblioteki klienta analizy dokumentów przeznaczone dla interfejsu API REST 2023-10-31-preview są teraz dostępne do użycia!

Listopad 2023

Interfejs API REST analizy dokumentów 2023-10-31-preview jest teraz dostępny. Ten interfejs API w wersji zapoznawczej wprowadza nowe i zaktualizowane możliwości:

  • Publiczna wersja zapoznawcza 2023-10-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:

    • Wschodnie stany USA
    • Zachodnie stany USA 2
    • Europa Zachodnia
  • Odczyt modelu

    • Rozszerzenie języka do pisma ręcznego: Russian(ru), Arabski(ar), Thai(th).
    • Zgodność ze standardem Cyber Executive Order (EO).
  • Model układu

    • Obsługa plików pakietu Office i HTML.
    • Obsługa danych wyjściowych języka Markdown.
    • Ulepszenia wyodrębniania tabel, kolejności odczytu i wykrywania nagłówków sekcji.
    • W przypadku wersji zapoznawczej 2023-10-31-preview ogólny model dokumentu (wstępnie utworzony dokument) jest przestarzały. W przyszłości, aby wyodrębnić pary klucz-wartość z dokumentów, użyj prebuilt-layout modelu z opcjonalnym parametrem features=keyValuePairs ciągu zapytania włączonym.
  • Model paragonu

    • Teraz wyodrębnia walutę dla wszystkich pól związanych z ceną.
  • Model karty ubezpieczenia zdrowotnego

    • Nowe wsparcie pola dla Medicare i Medicaid informacji.
  • Modele dokumentów podatkowych w USA

    • Nowy model podatkowy 1099. Obsługuje formularz base 1099 i następujące odmiany: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Model faktury

    • Obsługa KVK pól.
    • Obsługa BPAY pól.
    • Liczne udoskonalenia pól.
  • Klasyfikacja niestandardowa

    • Obsługa dokumentów wielojęzycznych.
    • Opcje podziału nowej strony: autosplit, zawsze podzielone według strony, bez podziału.
  • Możliwości dodatków

    • Pola zapytania są dostępne w 2023-10-31-preview wersji.
    • Funkcje dodatków są dostępne we wszystkich modelach z wyłączeniem modelu odczytu.

Uwaga

W wersji ogólnie dostępnej interfejsu API 2022-08-31 skojarzone interfejsy API w wersji zapoznawczej są przestarzałe. Jeśli używasz wersji 2021-09-30-preview, 2022-01-30-preview lub 2022-06-30-preview interfejsu API, zaktualizuj aplikacje do wersji interfejsu API 2022-08-31. Aby uzyskać więcej informacji, zobacz przewodnik migracji.

Lipiec 2023 r.

Uwaga

Rozpoznawanie formularzy to teraz usługa Azure AI Document Intelligence!

  • Dokument, usługi Azure AI obejmują wszystkie elementy, które wcześniej były znane jako Cognitive Services i aplikacja systemu Azure lied AI Services.
  • Nie ma żadnych zmian w cenach.
  • Nazwy usług Cognitive Services i aplikacja systemu Azure lied AI nadal są używane w rozliczeniach platformy Azure, analizie kosztów, cenniku i interfejsach API cen.
  • Nie ma żadnych zmian powodujących niezgodność w interfejsach programowania aplikacji lub bibliotekach klienckich.
  • Niektóre platformy nadal czekają na zmianę nazwy aktualizacji. Wszystkie wzmianki o rozpoznawaniu formularzy lub analizie dokumentów w naszej dokumentacji odnoszą się do tej samej usługi platformy Azure.

Analiza dokumentów w wersji 3.1 (ogólna dostępność)

Interfejs API analizy dokumentów w wersji 3.1 jest teraz ogólnie dostępny (GA)! Wersja interfejsu API odpowiada .2023-07-31 Interfejs API w wersji 3.1 wprowadza nowe i zaktualizowane możliwości:

Aktualizacje środowiska użytkownika programu Document Intelligence Studio

✔️ Opcje analizy

  • Analiza dokumentów obsługuje teraz bardziej zaawansowane funkcje analizy, a program Studio umożliwia łatwe konfigurowanie funkcji dodawania do jednego punktu wejścia (przycisk Analizuj opcje).

  • W zależności od scenariusza wyodrębniania dokumentów skonfiguruj zakres analiz, zakres stron dokumentów, opcjonalne wykrywanie i funkcje wykrywania w warstwie Premium.

    Animowany zrzut ekranu przedstawiający użycie przycisku analizuj opcje do konfigurowania opcji w programie Studio.

    Uwaga

    Wyodrębnianie czcionek nie jest wizualizowane w programie Document Intelligence Studio. Można jednak sprawdzić sekcję stylów danych wyjściowych JSON pod kątem wyników wykrywania czcionek.

✔️ Automatyczne etykietowanie dokumentów przy użyciu wstępnie utworzonych modeli lub jednego z własnych modeli

  • Na stronie niestandardowego etykietowania modelu wyodrębniania można teraz automatycznie oznaczać dokumenty przy użyciu jednego ze wstępnie utworzonych modeli lub modeli wstępnie wytrenowanych przez usługę Document Intelligent Service.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie w programie Studio.

  • W przypadku niektórych dokumentów po uruchomieniu automatycznej etykiety mogą być zduplikowane etykiety. Pamiętaj, aby zmodyfikować etykiety, aby nie było zduplikowanych etykiet na stronie etykietowania.

    Zrzut ekranu przedstawiający ostrzeżenie o zduplikowanych etykietach po automatycznym etykietowaniu.

✔️ Automatyczne etykietowanie tabel

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie etykietować tabele w dokumencie bez konieczności ręcznego etykietowania tabel.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie tabeli w programie Studio.

✔️ Dodawanie plików testowych bezpośrednio do zestawu danych treningowych

  • Po wytrenowaniu niestandardowego modelu wyodrębniania użyj strony testowej, aby poprawić jakość modelu, przekazując dokumenty testowe do zestawu danych trenowania w razie potrzeby.

  • Jeśli dla niektórych etykiet zostanie zwrócony niski współczynnik ufności, upewnij się, że etykiety są poprawne. Jeśli nie, dodaj je do zestawu danych szkoleniowych i ponownie określ, aby poprawić jakość modelu.

Animowany zrzut ekranu przedstawiający sposób dodawania plików testowych do zestawu danych szkoleniowych.

✔️ Korzystanie z opcji listy dokumentów i filtrów w projektach niestandardowych

  • Użyj niestandardowej strony etykietowania modelu wyodrębniania. Teraz możesz łatwo przechodzić przez dokumenty szkoleniowe, korzystając z funkcji wyszukiwania, filtrowania i sortowania według.

  • Użyj widoku siatki, aby wyświetlić podgląd dokumentów lub użyć widoku listy, aby łatwiej przewijać dokumenty.

    Zrzut ekranu przedstawiający opcje i filtry widoku listy dokumentów.

✔️ Udostępnianie projektu

Maj 2023 r .

Wprowadzenie do odświeżonej dokumentacji kompilacji 2023

Kwiecień 2023

Ogłoszenie najnowszej wersji zapoznawczej biblioteki klienta analizy dokumentów

Marzec 2023

Ważne

2023-02-28-preview możliwości są obecnie dostępne tylko w następujących regionach:

  • West Europe
  • Zachodnie stany USA 2
  • Wschodnie stany USA
  • Niestandardowy model klasyfikacji to nowa funkcja w ramach analizy dokumentów rozpoczynająca się od interfejsu 2023-02-28-preview API.
  • Możliwości pól zapytań dodane do modelu ogólnego dokumentu umożliwiają wyodrębnianie określonych pól z dokumentów przy użyciu modeli usługi Azure OpenAI. Wypróbuj funkcję Ogólne dokumenty z polami zapytań przy użyciu programu Document Intelligence Studio. Pola zapytań są obecnie aktywne tylko dla zasobów w East US regionie.
  • Możliwości dodatków:
    • Wyodrębnianie czcionek jest teraz rozpoznawane za pomocą interfejsu 2023-02-28-preview API.
    • Wyodrębnianie formuł jest teraz rozpoznawane za pomocą interfejsu 2023-02-28-preview API.
    • Wyodrębnianie o wysokiej rozdzielczości jest teraz rozpoznawane za pomocą interfejsu 2023-02-28-preview API.
  • Niestandardowe aktualizacje modelu wyodrębniania:
    • Niestandardowy model neuronowy obsługuje teraz dodane języki do trenowania i analizy. Trenowanie modeli neuronowych dla holenderskich, francuskich, niemieckich, włoskich i hiszpańskich.
    • Niestandardowy model szablonu ma teraz ulepszoną funkcję wykrywania podpisów.
  • Aktualizacje programu Document Intelligence Studio :
    • Oprócz obsługi wszystkich nowych funkcji, takich jak pola klasyfikacji i zapytań, program Studio umożliwia teraz udostępnianie projektów dla projektów niestandardowych modeli.
    • Nowe dodatki modelu w wersji zapoznawczej: karty szczepień, umowy, podatek USA 1098, US Tax 1098-E i US Tax 1098-T. Aby zażądać dostępu do modeli w wersji zapoznawczej z bramą, ukończ i prześlij formularz żądania prywatnej wersji zapoznawczej analizy dokumentów.
  • Aktualizacje modelu paragonów:
    • Model paragonu dodaje obsługę paragonów termicznych.
    • Model paragonu dodaje teraz obsługę języka dla 18 języków i trzech języków regionalnych (angielski, francuski, portugalski).
    • Model paragonu obsługuje TaxDetails teraz wyodrębnianie.
  • Model układu ulepsza teraz rozpoznawanie tabel.
  • Model odczytu dodaje teraz ulepszenia do rozpoznawania znaków jednocyfrowych.

2023 lutego

  • Wybierz pozycję Kontenery analizy dokumentów dla wersji 3.0 są teraz dostępne do użycia!

  • Obecnie dostępne są kontenery Read v3.0 i Layout v3.0 .

    Aby uzyskać więcej informacji, zobacz Instalowanie i uruchamianie kontenerów analizy dokumentów.


Styczeń 2023

  • Wstępnie utworzony model paragonu — dodano obsługiwane języki. Model paragonu obsługuje teraz te dodane języki i ustawienia regionalne

    • Japoński — Japonia (ja-JP)
    • Francuski — Kanada (fr-CA)
    • Holenderski — Holandia (nl-NL)
    • Angielski — Zjednoczone Emiraty Arabskie (en-AE)
    • Portugalski — Brazylia (pt-BR)
  • Wstępnie utworzony model faktur — dodano obsługiwane języki. Model faktury obsługuje teraz te dodane języki i ustawienia regionalne

    • Angielski — Stany Zjednoczone (en-US), Australia (en-AU), Kanada (en-CA), Wielka Brytania (en-UK), Indie (en-IN)
    • Hiszpański — Hiszpania (es-ES)
    • Francuski — Francja (fr-FR)
    • Włoski — Włochy (it-IT)
    • Portugalski — Portugalia (pt-PT)
    • Holenderski — Holandia (nl-NL)
  • Wstępnie utworzony model faktury — dodano rozpoznane pola. Model faktury rozpoznaje teraz te dodane pola

    • Kod waluty
    • Opcje płatności
    • Rabat końcowy
    • Elementy podatkowe (tylko en-IN)
  • Wstępnie utworzony model identyfikatorów — dodano obsługiwane typy dokumentów. Model identyfikatorów obsługuje teraz te dodane typy dokumentów

    • Identyfikator wojskowy USA

Napiwek

Wszystkie aktualizacje ze stycznia 2023 r. są dostępne w interfejsie API REST w wersji 2022-08-31 (GA).

  • Wstępnie utworzony model paragonu — dodatkowa obsługa języka:

    Wstępnie utworzony model paragonu dodaje obsługę następujących języków:

    • Angielski — Zjednoczone Emiraty Arabskie (en-AE)
    • Holenderski — Holandia (nl-NL)
    • Francuski — Kanada (fr-CA)
    • Niemiecki — (de-DE)
    • Włoski — (it-IT)
    • Japoński — Japonia (ja-JP)
    • Portugalski — Brazylia (pt-BR)
  • Wstępnie utworzony model faktury — dodatkowa obsługa języka i wyodrębnianie pól

    Wstępnie utworzony model faktury dodaje obsługę następujących języków:

    • Angielski — Australia (en-AU), Kanada (en-CA), Wielka Brytania (en-UK), Indie (en-IN)
    • Portugalski — Brazylia (pt-BR)

    Wstępnie utworzony model faktury dodaje teraz obsługę następujących wyodrębnień pól:

    • Kod waluty
    • Opcje płatności
    • Rabat końcowy
    • Elementy podatkowe (tylko en-IN)
  • Wstępnie utworzony model dokumentu identyfikatora — obsługa dodatkowych typów dokumentów

    Wstępnie utworzony model dokumentu identyfikatora dodaje teraz obsługę następujących typów dokumentów:

    • Rozszerzenie licencji kierowcy wspierające Indie, Kanada, Wielka Brytania i Australia
    • Amerykańskie karty identyfikatorów wojskowych i dokumenty
    • Karty identyfikatorów Indii i dokumenty (PAN i Aadhaar)
    • Karty tożsamości i dokumenty w Australii (karta zdjęciowa, identyfikator klucza)
    • Karty tożsamości Kanady i dokumenty (karty identyfikacyjnej, karty maple)
    • Dowody tożsamości i dokumenty Zjednoczonego Królestwa (krajowe/regionalne karty tożsamości)

Grudzień 2022

  • Aktualizacje programu Document Intelligence Studio

    Wersja programu Document Intelligence Studio z grudnia zawiera najnowsze aktualizacje programu Document Intelligence Studio. Istnieją znaczące ulepszenia środowiska użytkownika, głównie dzięki obsłudze etykietowania niestandardowego modelu.

    • Zakres stron. Program Studio obsługuje teraz analizowanie określonych stron z dokumentu.

    • Niestandardowe etykietowanie modelu:

      • Automatycznie uruchom interfejs API układu. Możesz zdecydować się na automatyczne uruchamianie interfejsu API układu dla wszystkich dokumentów w magazynie obiektów blob podczas procesu instalacji modelu niestandardowego.

      • Wyszukaj. Program Studio zawiera teraz funkcję wyszukiwania w celu lokalizowania wyrazów w dokumencie. To ulepszenie umożliwia łatwiejsze nawigację podczas etykietowania.

      • Nawigacja. Możesz wybrać etykiety, aby oznaczyć wyrazy etykietami docelowymi w dokumencie.

      • Automatyczne etykietowanie tabel. Po wybraniu ikony tabeli w dokumencie możesz wybrać automatyczne etykietowanie wyodrębnionej tabeli w widoku etykietowania.

      • Podtypy etykiet i podtypy drugiego poziomu Program Studio obsługuje teraz podtypy kolumn tabeli, wierszy tabeli i podtypów drugiego poziomu dla typów, takich jak daty i liczby.

  • Tworzenie niestandardowych modeli neuronowych jest teraz obsługiwane w regionie US Gov Virginia.

  • Wersje 2022-01-30-preview interfejsu API w wersji zapoznawczej i 2021-09-30-preview zostaną wycofane 31 stycznia 2023 r. Przeprowadź aktualizację do wersji interfejsu API, 2022-08-31 aby uniknąć zakłóceń w działaniu usługi.


Listopad 2022

  • Ogłoszenie najnowszej stabilnej wersji bibliotek analizy dokumentów usługi Azure AI
    • Ta wersja zawiera ważne zmiany i aktualizacje bibliotek klienckich .NET, Java, JavaScript i Python. Aby uzyskać więcej informacji, zobacz Azure SDK DevBlog.
    • Najważniejsze ulepszenia to wprowadzenie dwóch nowych klientów: i DocumentAnalysisClient DocumentModelAdministrationClient.

Październik 2022

  • Zawartość z wersją analizy dokumentów

    • Dokumentacja analizy dokumentów została zaktualizowana, aby przedstawić środowisko wersji. Teraz możesz wyświetlić zawartość przeznaczoną dla v3.0 GA środowiska lub v2.1 GA środowiska. Środowisko w wersji 3.0 jest domyślne.

      Zrzut ekranu przedstawiający stronę docelową analizy dokumentów oznaczającą menu rozwijane wersji.

  • Przykładowy kod programu Document Intelligence Studio

    • Przykładowy kod środowiska etykietowania usługi Document Intelligence Studio jest teraz dostępny w witrynie GitHub. Klienci mogą opracowywać i integrować analizę dokumentów z własnym środowiskiem użytkownika lub tworzyć własne nowe środowisko użytkownika przy użyciu przykładowego kodu usługi Document Intelligence Studio.
  • Rozszerzanie języka

    • W najnowszej wersji zapoznawczej modele odczytu (OCR), układu i szablonu niestandardowego analizy dokumentów obsługują 134 nowe języki. Dodatki te obejmują grecki, łotewski, serbski, tajski, ukraiński i wietnamski, wraz z kilkoma językami łacińskimi i cyrylica. Analiza dokumentów ma teraz łącznie 299 obsługiwanych języków w najnowszych wersjach ogólnodostępnych i nowych wersji zapoznawczych. Zapoznaj się z obsługiwanymi stronami języków, aby wyświetlić wszystkie obsługiwane języki.
    • Użyj parametru api-version=2022-06-30-preview interfejsu API REST podczas korzystania z interfejsu API lub odpowiedniego zestawu SDK, aby obsługiwać nowe języki w aplikacjach.
  • Nowy wstępnie utworzony model kontraktu

    • Nowa wstępnie utworzona funkcja wyodrębnia informacje z kontraktów, takich jak strony, tytuł, identyfikator kontraktu, data wykonania i inne. model kontraktów jest obecnie w wersji zapoznawczej, żądaj dostępu tutaj.
  • Rozszerzanie regionów na potrzeby trenowania niestandardowych modeli neuronowych

    • Trenowanie niestandardowych modeli neuronowych jest teraz obsługiwane w dodanych regionach.
      • East US
      • Wschodnie stany USA 2
      • US Gov Arizona

2022 września

Uwaga

Począwszy od wersji 4.0.0, wprowadzono nowy zestaw klientów korzystających z najnowszych funkcji usługi Analizy dokumentów.

Wersja zestawu SDK 4.0.0 (ogólna dostępność) zawiera następujące aktualizacje:

  • Wersja 4.0.0 GA (2022-09-08)
  • Obsługuje klientów interfejsu API REST w wersji 3.0 i 2.0

Pakiet (NuGet)

Dziennik zmian/historia wydania

Przewodnik migracji

ReadMe

Samples

  • Rozszerzanie regionów na potrzeby trenowania niestandardowych modeli neuronowych jest teraz obsługiwane w sześciu nowych regionach

    • Australia Wschodnia
    • Central US
    • Azja Wschodnia
    • Francja Środkowa
    • Południowe Zjednoczone Królestwo
    • Zachodnie stany USA 2
    • Aby uzyskać pełną listę regionów, w których obsługiwane jest trenowanie, zobacz niestandardowe modele neuronowe.

    • Wersja zestawu 4.0.0 GA SDK analizy dokumentów:

      • Biblioteki klienta analizy dokumentów w wersji 4.0.0 (.NET/C#, Java, JavaScript) i 3.2.0 (Python) są ogólnie dostępne i gotowe do użycia w aplikacjach produkcyjnych!.
      • Aby uzyskać więcej informacji na temat bibliotek klienta analizy dokumentów, zobacz omówienie zestawu SDK.
      • Zaktualizuj aplikacje przy użyciu przewodnika migracji języka programowania.

Sierpień 2022

Wersja zapoznawcza zestawu Document Intelligence SDK z sierpnia 2022 r. obejmuje następujące aktualizacje:

Wersja 4.0.0-beta.5 (2022-08-09)

Dziennik zmian/historia wydania

Pakiet (NuGet)

Dokumentacja referencyjna zestawu SDK

  • Analiza dokumentów w wersji 3.0 jest ogólnie dostępna

    • Interfejs API REST analizy dokumentów w wersji 3.0 jest teraz ogólnie dostępny i gotowy do użycia w aplikacjach produkcyjnych! Zaktualizuj aplikacje przy użyciu interfejsu API REST w wersji 2022-08-31.
  • Aktualizacje programu Document Intelligence Studio

    • Następne kroki. Na każdej stronie modelu program Studio ma teraz następną sekcję kroków. Użytkownicy mogą szybko odwoływać się do przykładowego kodu, wytycznych dotyczących rozwiązywania problemów i informacji o cenach.
    • Modele niestandardowe. Program Studio oferuje teraz możliwość zmiany kolejności etykiet w niestandardowych projektach modelu w celu zwiększenia wydajności etykietowania.
    • Modele niestandardowe kopiowania można kopiować między usługami analizy dokumentów z poziomu programu Studio. Operacja umożliwia podwyższenie poziomu wytrenowanego modelu do innych środowisk i regionów.
    • Usuń dokumenty. Program Studio obsługuje teraz usuwanie dokumentów z oznaczonego zestawu danych w projektach niestandardowych.
  • Aktualizacje usługi Analizy dokumentów

    • wstępnie skompilowany odczyt. Odczyt modelu OCR jest teraz również dostępny w usłudze Document Intelligence z akapitami i wykrywaniem języka jako dwie nowe funkcje. Odczyt analizy dokumentów jest przeznaczony dla zaawansowanych scenariuszy dokumentów dostosowanych do szerszych możliwości analizy dokumentów w usłudze Document Intelligence.
    • wstępnie utworzony układ. Model układu wyodrębnia akapity i określa, czy wyodrębniony tekst jest akapitem, tytułem, nagłówkiem sekcji, przypisem dolnym, nagłówkiem strony, stopką strony lub numerem strony.
    • wstępnie utworzona faktura. Pola TotalVAT i Line/VAT są teraz rozpoznawane odpowiednio dla istniejących pól TotalTax i Line/Tax.
    • prebuilt-idDocument. Obsługa wyodrębniania danych dla identyfikatorów stanu USA, zabezpieczeń społecznych i zielonych kart. Wsparcie dla informacji o wizie paszportowej.
    • wstępnie utworzone potwierdzenie. Rozszerzona obsługa ustawień regionalnych dla języka francuskiego (fr-FR), hiszpańskiego (es-ES), portugalskiego (pt-PT), włoskiego (it-IT) i niemieckiego (de-DE).
    • wstępnie utworzona karta biznesowa. Obsługa analizowania adresów w celu wyodrębniania pól podrzędnych dla składników adresów, takich jak adres, miasto, stan, kraj/region i kod pocztowy.
  • Ulepszenia jakości sztucznej inteligencji

    • wstępnie skompilowany odczyt. Ulepszona obsługa pojedynczych znaków, dat odręcznych, kwot, nazw, innych kluczowych danych często spotykanych w paragonach i fakturach oraz ulepszonego przetwarzania cyfrowych dokumentów PDF.
    • wstępnie utworzony układ. Obsługa lepszego wykrywania przyciętych tabel, tabel bez obramowania i ulepszonego rozpoznawania długich komórek.
    • wstępnie utworzony dokument. Ulepszona wartość i wykrywanie pól wyboru.
    • niestandardowe neuronowe. Ulepszona dokładność wykrywania i wyodrębniania tabel.

Czerwiec 2022

  • Wersja zapoznawcza zestawu DOCUMENT Intelligence SDK w czerwcu 2022 r. obejmuje następujące aktualizacje:
  • Wersja usługi Document Intelligence Studio w czerwcu to najnowsza aktualizacja programu Document Intelligence Studio. W tej aktualizacji uwzględniono znaczne ulepszenia środowiska użytkownika i ułatwień dostępu:

    • Przykład kodu dla języków JavaScript i C#. Karta Kod programu Studio dodaje teraz przykłady kodu JavaScript i C# oprócz istniejącego języka Python.
    • Interfejs użytkownika przekazywania nowego dokumentu. Program Studio obsługuje teraz przekazywanie dokumentu z przeciągnięciem i upuszczaniem do nowego interfejsu użytkownika przekazywania.
    • Nowa funkcja dla projektów niestandardowych. Projekty niestandardowe obsługują teraz tworzenie konta magazynu i obiektów blob podczas konfigurowania projektu. Ponadto projekt niestandardowy obsługuje teraz przekazywanie plików szkoleniowych bezpośrednio w programie Studio i kopiowanie istniejącego modelu niestandardowego.
  • W wersji 3.0 2022-06-30-preview analiza dokumentów zawiera obszerne aktualizacje w interfejsach API funkcji:


Luty 2022 r.

  • Wersja zapoznawcza analizy dokumentów w wersji 3.0 wprowadza kilka nowych funkcji, możliwości i ulepszeń:

    • Niestandardowy model neuronowy lub niestandardowy model dokumentów to nowy model niestandardowy do wyodrębniania tekstu i znaków zaznaczania ze strukturą, częściowo ustrukturyzowanych i nieustrukturyzowanych dokumentów.
    • W-2 wstępnie utworzony model to nowy wstępnie utworzony model umożliwiający wyodrębnianie pól z formularzy W-2 na potrzeby scenariuszy raportowania podatków i weryfikacji dochodów.
    • Interfejs API odczytu wyodrębnia drukowane wiersze tekstu, wyrazy, lokalizacje tekstu, wykryte języki i tekst odręczny, jeśli zostanie wykryty.
    • Ogólny wstępnie wytrenowany model dokumentu jest teraz aktualizowany w celu obsługi znaków zaznaczenia oprócz tekstu interfejsu API, tabel, struktury i par klucz-wartość z formularzy i dokumentów.
    • Wstępnie utworzony model faktur dla interfejsu API faktur rozszerza obsługę hiszpańskich faktur.
    • Usługa Document Intelligence Studio dodaje nowe pokazy dla przykładów odczytu, W2, paragonów hotelowych i obsługi trenowania nowych niestandardowych modeli neuronowych.
    • Rozszerzenie języka analiza dokumentów odczyt, układ i formularz niestandardowy dodaje obsługę 42 nowych języków, w tym arabskich, hindi i innych języków przy użyciu skryptów arabskich i Devanagari w celu rozszerzenia zasięgu do 164 języków. Obsługa języka odręcznego rozszerza się na japoński i koreański.
  • Wprowadzenie do nowego interfejsu API w wersji 3.0 (wersja zapoznawcza).

  • Wyodrębnianie danych modelu analizy dokumentów:

    Model Wyodrębnianie tekstu Pary klucz-wartość Znaczniki zaznaczenia Tabele Podpisy
    Przeczytaj
    Dokument ogólny
    Układ
    Faktura
    Przyjęcie
    Dokument tożsamości
    Karta biznesowa
    Szablon niestandardowy
    Niestandardowe neuronowe
  • Wersja zapoznawcza zestawu SDK analizy dokumentów w wersji beta zawiera następujące aktualizacje:


Następne kroki