Model dokumentu identyfikatora analizy dokumentów
Ważne
- Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
- Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
- Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
- Północno-środkowe stany USA
Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1
Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Model dokumentów tożsamości analizy dokumentów (ID) łączy optyczne rozpoznawanie znaków (OCR) z modelami uczenia głębokiego w celu analizowania i wyodrębniania kluczowych informacji z dokumentów tożsamości. Interfejs API analizuje dokumenty tożsamości (w tym następujące) i zwraca ustrukturyzowaną reprezentację danych JSON:
- Książka paszportowa, karta paszportowa na całym świecie
- Licencja kierowcy z Stany Zjednoczone, Europy, Indii, Kanady i Australii
- Stany Zjednoczone karty identyfikacyjne, zezwolenie na pobyt (zielona karta), kartę ubezpieczenia społecznego, identyfikator wojskowy
- Europejskie karty identyfikacyjne, zezwolenia na pobyt
- Karta Pan w Indiach, karta Aadhaar
- Karty identyfikacyjne Kanady, pozwolenie na pobyt (karta klonowa)
- Australia photo card, key-pass ID (w tym wersja cyfrowa)
Analiza dokumentów może analizować i wyodrębniać informacje z dokumentów identyfikacyjnych wystawionych przez instytucje rządowe przy użyciu wstępnie utworzonego modelu identyfikatorów. Łączy nasze zaawansowane funkcje optycznego rozpoznawania znaków (OCR) z funkcjami rozpoznawania identyfikatorów, aby wyodrębnić kluczowe informacje z światowych paszportów i licencji kierowców USA (wszystkie 50 stanów i DC). Interfejs API identyfikatorów wyodrębnia kluczowe informacje z tych dokumentów tożsamości, takich jak imię, nazwisko, data urodzenia, numer dokumentu i inne. Ten interfejs API jest dostępny w usłudze Document Intelligence w wersji 2.1 jako usługi w chmurze.
Przetwarzanie dokumentów tożsamości
Przetwarzanie dokumentów tożsamości obejmuje wyodrębnianie danych z dokumentów tożsamości ręcznie lub przy użyciu technologii OCR. Przetwarzanie dokumentów identyfikatorów to ważny krok w każdej operacji biznesowej, która wymaga potwierdzenia tożsamości. Przykłady obejmują weryfikację klienta w bankach i innych instytucjach finansowych, wniosków hipotecznych, wizyt medycznych, przetwarzania roszczeń, branży hotelarskiej i nie tylko. Osoby fizyczne dostarczają pewne dowody tożsamości za pośrednictwem licencji, paszportów i innych podobnych dokumentów, aby firma mogła skutecznie je zweryfikować przed świadczeniem usług i świadczeń.
Przykładowa licencja kierowcy USA przetworzona w usłudze Document Intelligence Studio
Wyodrębnianie danych
Wstępnie utworzona usługa identyfikatorów wyodrębnia wartości kluczy z światowych paszportów i licencji kierowców USA i zwraca je w zorganizowanej ustrukturyzowanej odpowiedzi JSON.
Przykład licencji kierowcy
Przykład usługi Passport
Opcje programowania
Analiza dokumentów w wersji 4.0 (2024-07-31-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model dokumentu identyfikatora | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
prebuilt-idDocument |
Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model dokumentu identyfikatora | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
prebuilt-idDocument |
Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model dokumentu identyfikatora | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
prebuilt-idDocument |
Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby |
---|---|
Model dokumentu identyfikatora | • Narzędzie do etykietowania analizy dokumentów• Interfejs API REST• Zestaw SDK biblioteki klienckiej• Kontener docker analizy dokumentów |
Wymagania dotyczące danych wejściowych
Obsługiwane formaty plików:
Model PDF Obraz: JPEG/JPG
, ,BMP
PNG
, ,TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowe wyodrębnianie ✔ ✔ Klasyfikacja niestandardowa ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i
4
MB za bezpłatną (F0).Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi
8
punktowemu na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i
1
GB dla modelu neuronowego.W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1
GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi2
GB z maksymalnie 10 000 stron.
Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
Obsługiwana liczba stron dla plików PDF i TIFF: maksymalnie 2000 stron lub tylko dwie pierwsze strony dla subskrybentów warstwy bezpłatna.
Obsługiwany rozmiar pliku: mniej niż 50 MB ŁĄCZNIE; minimalna liczba pikseli: 50 x 50 pikseli; maksymalna liczba pikseli: 10 000 x 10 000 pikseli.
Wyodrębnianie danych modelu dokumentów identyfikatorów
Wyodrębnij dane, w tym nazwę, datę urodzenia i datę wygaśnięcia z dokumentów identyfikatorów. Potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Uwaga
Program Document Intelligence Studio jest dostępny z interfejsami API w wersji 3.1 i 3.0 oraz nowszymi wersjami.
Narzędzie do etykietowania przykładowego analizy dokumentów
Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .
Wybierz typ formularza do przeanalizowania z menu rozwijanego.
Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:
- Przykładowy dokument faktury.
- Przykładowy dokument o identyfikatorze.
- Przykładowy obraz potwierdzenia.
- Przykładowy obraz wizytówki.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.
Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.
Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki.
- Węzeł "readResults" zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie.
- Węzeł "selectionMarks" pokazuje każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) i określa, czy jego stan jest zaznaczony , czy niezaznaczony.
- Sekcja "pageResults" zawiera wyodrębnione tabele. Dla każdej tabeli analiza dokumentów wyodrębnia tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.
- Pole "documentResults" zawiera informacje o parach klucz/wartość i informacje o elementach wiersza dla najbardziej odpowiednich części dokumentu.
Uwaga
Przykładowe narzędzie etykietowania nie obsługuje formatu pliku BMP. Jest to ograniczenie narzędzia, a nie usługi analizy dokumentów.
Obsługiwane typy dokumentu
Region (Region) | Typy dokumentów |
---|---|
Cały świat | Książka paszportowa, karta paszportowa |
Stany Zjednoczone | Prawo jazdy, karty identyfikacyjnej, zezwolenia na pobyt (zielona karta), karty ubezpieczenia społecznego, identyfikatora wojskowego |
Europa | Prawo jazdy, karta identyfikacji, zezwolenie na pobyt |
Indie | Prawo jazdy, KARTA PAN, Aadhaar Card |
Kanada | Prawo jazdy, karta identyfikacji, zezwolenie na pobyt (karta maple) |
Australia | Licencja kierowcy, karta fotograficzna, identyfikator klucza (w tym wersja cyfrowa) |
Wyodrębnianie pól
W przypadku obsługiwanych pól wyodrębniania dokumentów zapoznaj się ze stroną schematu modelu dokumentów identyfikatorów w naszym przykładowym repozytorium GitHub.
Obsługiwane typy dokumentu
Model dokumentu ID obsługuje obecnie amerykańskie licencje kierowców i stronę biograficzną z międzynarodowych paszportów (z wyłączeniem wiz i innych dokumentów podróży) wyodrębniania.
Wyodrębnione pola
Nazwisko | Pisz | Opis | Wartość |
---|---|---|---|
Country | kraj | Kod kraju zgodny ze standardem ISO 3166 | "USA" |
DateOfBirth | data | DOB w formacie RRRR-MM-DD | "1980-01-01" |
DateOfExpiration | data | Data wygaśnięcia w formacie RRRR-MM-DD | "2019-05-05" |
Numer dokumentu | string | Odpowiedni numer paszportu, numer licencji kierowcy itp. | "340020013" |
FirstName | string | Wyodrębnione imię i środkowe inicjały, jeśli ma to zastosowanie | "JENNIFER" |
LastName | string | Wyodrębnione nazwisko | "BROOKS" |
Narodowość | kraj | Kod kraju zgodny ze standardem ISO 3166 | "USA" |
Płeć | płeć | Możliwe wyodrębnione wartości obejmują "M" "F" "X" | „F” |
MachineReadableZone | obiekt | Wyodrębniony paszport MRZ zawierający dwa wiersze z 44 znakami |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307 715816<" |
DocumentType | string | Typ dokumentu, na przykład Paszport, Licencja kierowcy | "paszport" |
Adres | string | Wyodrębniony adres (tylko prawo jazdy) | "123 STREET ADDRESS YOUR CITY WA 99999-1234" |
Region (Region) | string | Wyodrębniony region, stan, prowincja itp. (tylko prawo jazdy) | "Waszyngton" |
Przewodnik migracji
- Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.0 w aplikacjach i przepływach pracy.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Spróbuj przetwarzać własne formularze i dokumenty za pomocą narzędzia do etykietowania przykładowego analizy dokumentów.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.