Model karty kredytowej analizy dokumentów
Ta zawartość dotyczy: v4.0
Model karty kredytowej/debetowej analizy dokumentów wykorzystuje zaawansowane funkcje optycznego rozpoznawania znaków (OCR) do analizowania i wyodrębniania kluczowych pól z kart kredytowych i debetowych. Karty kredytowe i karty debetowe mogą mieć różne formaty i jakość, w tym obrazy przechwycone przez telefon, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst dokumentu; wyodrębnia kluczowe informacje, takie jak numer karty, bank wystawiający i data wygaśnięcia; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie formaty dokumentów w języku angielskim.
Automatyczne przetwarzanie kart
Zautomatyzowane przetwarzanie kart kredytowych/debetowych to proces wyodrębniania pól kluczy z kart bankowych. W przeszłości proces analizy kart bankowych jest uzyskiwany ręcznie i dlatego bardzo czasochłonny. Dokładne wyodrębnianie kluczowych danych z kart bankowych jest zazwyczaj pierwszym i jednym z najważniejszych kroków w procesie automatyzacji kontraktu.
Opcje programowania
Analiza dokumentów w wersji 4.0: 2024-11-30 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model kontraktu | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
wstępnie utworzona karta kredytowa |
Wymagania dotyczące danych wejściowych
Obsługiwane formaty plików:
Model | Obraz: JPEG/JPG , , BMP PNG , , TIFF HEIF |
Microsoft Office: Word (), Excel ( XLSX DOCX ), PowerPoint (PPTX ), HTML |
|
---|---|---|---|
Przeczytaj | ✔ | ✔ | ✔ |
Układ | ✔ | ✔ | ✔ |
Dokument ogólny | ✔ | ✔ | |
Wstępnie utworzona | ✔ | ✔ | |
Niestandardowe wyodrębnianie | ✔ | ✔ | |
Klasyfikacja niestandardowa | ✔ | ✔ | ✔ |
Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i
4
MB za bezpłatną (F0).Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi
8
punktowemu na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i
1
GB dla modelu neuronowego.W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1
GB z maksymalnie 10 000 stron. W przypadku wersji 2024-11-30 (GA) całkowity rozmiar danych treningowych wynosi2
GB z maksymalnie 10 000 stron.
Wypróbuj wyodrębnianie danych karty kredytowej
Aby zobaczyć, jak działa wyodrębnianie danych dla usługi kart kredytowych/debetowych, potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Document Intelligence Studio
Na stronie głównej Usługi Document Intelligence Studio wybierz pozycję Karta kredytowa/debetowa.
Możesz przeanalizować przykładowe dokumenty kredytowe/debetowe lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Obsługiwane języki i ustawienia regionalne
Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą wstępnie utworzoną stronę obsługi języka modelu.
Wyodrębnianie pól
Aby uzyskać informacje o obsługiwanych polach wyodrębniania dokumentów, zobaczstronę schematu modelu karty kredytowej w naszym przykładowym repozytorium GitHub.
Pary klucz-wartość kart bankowych i wyodrębnione elementy wiersza znajdują się w
documentResults
sekcji danych wyjściowych JSON.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.