Korzystanie z modeli Dokument ogólny, Odczyt i Układ

3 min

Jeśli chcesz wyodrębnić tekst, języki i inne informacje z dokumentów z nieprzewidywalnymi strukturami, możesz użyć modeli odczytu, dokumentu ogólnego lub układu.

W firmie sondowania klienci i partnerzy często wysyłają specyfikacje, oferty, oświadczenia o pracy i inne dokumenty z nieprzewidywalnymi strukturami. Chcesz wiedzieć, czy usługa Azure AI Document Intelligence może analizować i wyodrębniać wartości z tych dokumentów.

W tym miejscu dowiesz się więcej o wstępnie utworzonych modelach, które firma Microsoft udostępnia na potrzeby ogólnych dokumentów.

Korzystanie z modelu odczytu

Model odczytu usługi Azure AI Document Intelligence wyodrębnia tekst drukowany i odręczny z dokumentów i obrazów. Służy do zapewniania wyodrębniania tekstu we wszystkich innych wstępnie utworzonych modelach.

Model odczytu może również wykryć język, w jakim jest napisany wiersz tekstu, i klasyfikować, czy jest to tekst odręczny, czy drukowany.

Uwaga

Model odczytu obsługuje więcej języków tekstu drukowanego niż tekst odręczny. Zapoznaj się z dokumentacją, aby wyświetlić bieżącą listę obsługiwanych języków.

W przypadku wielostronicowych plików PDF lub TIFF można użyć parametru pages w żądaniu, aby naprawić zakres stron na potrzeby analizy.

Model odczytu jest idealny, jeśli chcesz wyodrębnić wyrazy i wiersze z dokumentów bez stałej lub przewidywalnej struktury.

Korzystanie z ogólnego modelu dokumentów

Ogólny model dokumentów rozszerza funkcjonalność modelu odczytu przez dodanie wykrywania par klucz-wartość, jednostek, znaczników wyboru i tabel. Model może wyodrębnić te wartości ze strukturalnych, częściowo ustrukturyzowanych i nieustrukturyzowanych dokumentów.

Ogólny model dokumentu jest jedynym wstępnie utworzonym modelem obsługującym wyodrębnianie jednostek. Może rozpoznawać jednostki, takie jak osoby, organizacje i daty, i działa względem całego dokumentu, a nie tylko pary klucz-wartość. Takie podejście gwarantuje, że gdy złożoność strukturalna uniemożliwiła modelowi wyodrębnienie pary klucz-wartość, zamiast tego można wyodrębnić jednostkę. Pamiętaj jednak, że czasami pojedynczy fragment tekstu może zwracać zarówno parę klucz-wartość, jak i jednostkę.

Typy jednostek, które można wykryć, obejmują:

Person. Imię i nazwisko osoby.
PersonType. Stanowisko lub rola.
Location. Budynki, cechy geograficzne, jednostki geopolityczne.
Organization. Firmy, organy rządowe, kluby sportowe, zespoły muzyczne i inne grupy.
Event. Spotkania społeczne, wydarzenia historyczne, rocznice.
Product. Przedmioty zakupione i sprzedane.
Skill. Możliwość należąca do osoby.
Address. Adres wysyłkowy dla lokalizacji fizycznej.
Phone number. Numery telefonów komórkowych i telefonów komórkowych oraz telefonów stacjonarnych.
Email. Adresy e-mail.
URL. Adresy stron sieci Web.
IP Address. Adresy sieciowe sprzętu komputerowego.
DateTime. Daty kalendarza i godziny dnia.
Quantity. Pomiary liczbowe z jednostkami.

Korzystanie z modelu układu

Oprócz wyodrębniania tekstu model układu zwraca znaczniki wyboru i tabele z obrazu wejściowego lub pliku PDF. Dobrym modelem jest użycie, gdy potrzebujesz rozbudowanych informacji o strukturze dokumentu.

Podczas cyfryzacji dokumentu może on znajdować się pod nieparzysty kątem. Tabele mogą mieć skomplikowane struktury z nagłówkami lub bez nich, komórki obejmujące kolumny lub wiersze oraz niekompletne kolumny lub wiersze. Model układu może obsłużyć wszystkie te trudności, aby wyodrębnić pełną strukturę dokumentu.

Na przykład każda komórka tabeli jest wyodrębniona z:

Jego tekst zawartości.
Rozmiar i położenie pola ograniczenia.
Jeśli jest częścią kolumny nagłówka.
Indeksy wskazujące położenie wiersza i kolumny w tabeli.

Znaczniki wyboru są wyodrębniane ze swoim polem ograniczenia, wskaźnikiem ufności i czy są zaznaczone, czy nie.

Korzystanie z modeli Dokument ogólny, Odczyt i Układ

Korzystanie z modelu odczytu

Korzystanie z ogólnego modelu dokumentów

Korzystanie z modelu układu

Dowiedz się więcej

Opinia