Document Classifiers - Get Classify Result
Pobiera wynik klasyfikatora dokumentów.
GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-11-30
Parametry identyfikatora URI
Nazwa | W | Wymagane | Typ | Opis |
---|---|---|---|---|
classifier
|
path | True |
string |
Unikatowa nazwa klasyfikatora dokumentów. Wzorzec wyrażenia regularnego: |
endpoint
|
path | True |
string uri |
Punkt końcowy usługi Analizy dokumentów. |
result
|
path | True |
string uuid |
Analizowanie identyfikatora wyniku operacji. |
api-version
|
query | True |
string |
Wersja interfejsu API do użycia dla tej operacji. |
Odpowiedzi
Nazwa | Typ | Opis |
---|---|---|
200 OK |
Żądanie zakończyło się pomyślnie. |
|
Other Status Codes |
Nieoczekiwana odpowiedź na błąd. |
Zabezpieczenia
Ocp-Apim-Subscription-Key
Typ:
apiKey
W:
header
OAuth2Auth
Typ:
oauth2
Flow:
accessCode
Adres URL autoryzacji:
https://login.microsoftonline.com/common/oauth2/authorize
Adres URL tokenu:
https://login.microsoftonline.com/common/oauth2/token
Zakresy
Nazwa | Opis |
---|---|
https://cognitiveservices.azure.com/.default |
Przykłady
Get Classify Document Result
Przykładowe żądanie
GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30
Przykładowa odpowiedź
{
"status": "succeeded",
"createdDateTime": "2021-09-24T13:00:46Z",
"lastUpdatedDateTime": "2021-09-24T13:00:49Z",
"analyzeResult": {
"apiVersion": "2024-11-30",
"modelId": "myClassifier",
"stringIndexType": "textElements",
"contentFormat": "text",
"content": "",
"pages": [
{
"pageNumber": 1,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 2,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 3,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
}
],
"documents": [
{
"docType": "formA",
"boundingRegions": [
{
"pageNumber": 1,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
},
{
"pageNumber": 2,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
},
{
"docType": "formB",
"boundingRegions": [
{
"pageNumber": 3,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
}
]
}
}
Definicje
Nazwa | Opis |
---|---|
Address |
Wartość pola adresu. |
Analyzed |
Obiekt opisujący lokalizację i semantyczną zawartość dokumentu. |
Analyze |
Stan i wynik operacji analizy. |
Analyze |
Wynik analizy dokumentu. |
Bounding |
Wiązanie wielokąta na określonej stronie danych wejściowych. |
Currency |
Wartość pola waluty. |
Document |
Obiekt kodu kreskowego. |
Document |
Rodzaj kodu kreskowego. |
Document |
Obiekt podpisu opisujący tabelę lub rysunek. |
Document |
Format zawartości w przeanalizowanym wyniku. |
Document |
Obiekt reprezentujący zawartość i lokalizację wartości pola. |
Document |
Semantyczny typ danych wartości pola. |
Document |
Obiekt reprezentujący rysunek w dokumencie. |
Document |
Styl czcionki. |
Document |
Waga czcionki. |
Document |
Obiekt przypisu dolnego opisujący tabelę lub rysunek. |
Document |
Obiekt formuły. |
Document |
Rodzaj formuły. |
Document |
Obiekt błędu. |
Document |
Błąd obiektu odpowiedzi. |
Document |
Obiekt zawierający bardziej szczegółowe informacje o błędzie. |
Document |
Stan operacji. |
Document |
Obiekt błędu. |
Document |
Obiekt reprezentujący klucz pola lub wartość w parze klucz-wartość. |
Document |
Obiekt reprezentujący pole formularza z unikatową etykietą pola (klucz) i wartością pola (może być pusta). |
Document |
Obiekt reprezentujący wykryty język dla danego zakresu tekstu. |
Document |
Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia. |
Document |
Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych. |
Document |
Obiekt akapitu składający się z ciągłych linii zwykle ze wspólnym wyrównaniem i odstępami. |
Document |
Obiekt reprezentujący sekcję w dokumencie. |
Document |
Obiekt zaznaczenia reprezentujący pola wyboru, przyciski radiowe i inne elementy wskazujące zaznaczenie. |
Document |
Stan znacznika wyboru. |
Document |
Obecność podpisu. |
Document |
Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość. |
Document |
Obiekt reprezentujący obserwowane style tekstu. |
Document |
Obiekt tabeli składający się z komórek tabeli rozmieszczony w układzie prostokątnym. |
Document |
Obiekt reprezentujący lokalizację i zawartość komórki tabeli. |
Document |
Rodzaj komórki tabeli. |
Document |
Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz. |
Length |
Jednostka używana przez właściwości szerokości, wysokości i wielokąta. W przypadku obrazów jednostka jest "piksel". W przypadku formatu PDF jednostka jest "cal". |
Paragraph |
Semantyczna rola akapitu. |
String |
Metoda używana do obliczania przesunięcia i długości ciągu. |
AddressValue
Wartość pola adresu.
Nazwa | Typ | Opis |
---|---|---|
city |
string |
Nazwa miasta, miasta, wsi itp. |
cityDistrict |
string |
Dzielnice lub dzielnice w mieście, takim jak Brooklyn w Nowym Jorku lub City of Westminster w Londynie. |
countryRegion |
string |
Kraj/region. |
house |
string |
Nazwa kompilacji, taka jak World Trade Center. |
houseNumber |
string |
Dom lub numer budynku. |
level |
string |
Numer podłogi, taki jak 3F. |
poBox |
string |
Numer skrzynki pocztowej. |
postalCode |
string |
Kod pocztowy używany do sortowania poczty. |
road |
string |
Nazwa ulicy. |
state |
string |
Dział administracyjny pierwszego poziomu. |
stateDistrict |
string |
Podział administracyjny drugiego poziomu używany w niektórych ustawieniach regionalnych. |
streetAddress |
string |
Adres na poziomie ulicy, z wyłączeniem miasta, stanu, krajuRegion i kod pocztowy. |
suburb |
string |
Nieoficjalna nazwa sąsiedztwa, na przykład Chinatown. |
unit |
string |
Numer apartamentu lub biura |
AnalyzedDocument
Obiekt opisujący lokalizację i semantyczną zawartość dokumentu.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące dokument. |
|
confidence |
number |
Pewność poprawnego wyodrębnienia dokumentu. |
docType |
string |
Typ dokumentu. |
fields |
<string,
Document |
Słownik nazwanych wartości pól. |
spans |
Lokalizacja dokumentu w kolejności odczytu łączy zawartość. |
AnalyzeOperation
Stan i wynik operacji analizy.
Nazwa | Typ | Opis |
---|---|---|
analyzeResult |
Wynik analizy dokumentu. |
|
createdDateTime |
string |
Data i godzina (UTC), kiedy operacja analizy została przesłana. |
error |
Napotkano błąd podczas analizy dokumentu. |
|
lastUpdatedDateTime |
string |
Data i godzina (UTC), kiedy stan został ostatnio zaktualizowany. |
status |
Stan operacji. notStarted, running, succeeded, or failed |
AnalyzeResult
Wynik analizy dokumentu.
Nazwa | Typ | Opis |
---|---|---|
apiVersion |
string |
Wersja interfejsu API użyta do wygenerowania tego wyniku. |
content |
string |
Połącz reprezentację ciągu wszystkich elementów tekstowych i wizualnych w kolejności odczytu. |
contentFormat |
Format zawartości najwyższego poziomu wyników analizy. |
|
documents |
Wyodrębnione dokumenty. |
|
figures |
Wyodrębnione dane. |
|
keyValuePairs |
Wyodrębnione pary klucz-wartość. |
|
languages |
Wykryte języki. |
|
modelId |
string |
Identyfikator modelu dokumentu użyty do wygenerowania tego wyniku. |
pages |
Przeanalizowane strony. |
|
paragraphs |
Wyodrębnione akapity. |
|
sections |
Wyodrębnione sekcje. |
|
stringIndexType |
Metoda używana do obliczania przesunięcia i długości ciągu. |
|
styles |
Wyodrębnione style czcionek. |
|
tables |
Wyodrębnione tabele. |
|
warnings |
Napotkano listę ostrzeżeń. |
BoundingRegion
Wiązanie wielokąta na określonej stronie danych wejściowych.
Nazwa | Typ | Opis |
---|---|---|
pageNumber |
integer |
1 numer strony strony zawierającej region ograniczenia. |
polygon |
number[] |
Wiązanie wielokąta na stronie lub całej strony, jeśli nie zostanie określona. Współrzędne określone względem lewego górnego rogu strony. Liczby reprezentują wartości x, y wierzchołków wielokątnych, zgodnie z ruchem wskazówek zegara od lewej (-180 stopni włącznie) względem orientacji elementu. |
CurrencyValue
Wartość pola waluty.
Nazwa | Typ | Opis |
---|---|---|
amount |
number |
Kwota waluty. |
currencyCode |
string |
Rozpoznano kod waluty (ISO 4217), jeśli istnieje. |
currencySymbol |
string |
Etykieta symbolu waluty, jeśli istnieje. |
DocumentBarcode
Obiekt kodu kreskowego.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Pewność poprawnego wyodrębnienia kodu kreskowego. |
kind |
Rodzaj kodu kreskowego. |
|
polygon |
number[] |
Wiązanie wielokąta kodu kreskowego ze współrzędnymi określonymi względem lewej górnej części strony. Liczby reprezentują wartości x, y wierzchołków wielokątnych, zgodnie z ruchem wskazówek zegara od lewej (-180 stopni włącznie) względem orientacji elementu. |
span |
Lokalizacja kodu kreskowego w kolejności odczytu łączy zawartość. |
|
value |
string |
Wartość kodu kreskowego. |
DocumentBarcodeKind
Rodzaj kodu kreskowego.
Nazwa | Typ | Opis |
---|---|---|
Aztec |
string |
Kod Aztec, zgodnie z definicją w normie ISO/IEC 24778:2008. |
Codabar |
string |
Kod kreskowy Codabar, zgodnie z definicją w ANSI/AIM BC3-1995. |
Code128 |
string |
Kod kreskowy 128, zgodnie z definicją w normie ISO/IEC 15417:2007. |
Code39 |
string |
Kod kreskowy 39, zgodnie z definicją w normie ISO/IEC 16388:2007. |
Code93 |
string |
Kod kreskowy 93, zgodnie z definicją w ANSI/AIM BC5-1995. |
DataBar |
string |
Kod kreskowy GS1 DataBar. |
DataBarExpanded |
string |
Rozszerzony kod kreskowy GS1 DataBar. |
DataMatrix |
string |
Kod macierzy danych, zgodnie z definicją w normie ISO/IEC 16022:2006. |
EAN13 |
string |
GS1 13-cyfrowy numer artykułu międzynarodowego (numer artykułu europejskiego). |
EAN8 |
string |
GS1 8-cyfrowy numer międzynarodowego artykułu (europejski numer artykułu). |
ITF |
string |
Przeplatane 2 z 5 kodów kreskowych, zgodnie z definicją w ANSI/AIM BC2-1995. |
MaxiCode |
string |
MaxiCode, zgodnie z definicją w normie ISO/IEC 16023:2000. |
MicroQRCode |
string |
Kod Mikro QR, zgodnie z definicją w normie ISO/IEC 23941:2022. |
PDF417 |
string |
PDF417, zgodnie z definicją w normie ISO 15438. |
QRCode |
string |
Kod QR, zgodnie z definicją w normie ISO/IEC 18004:2015. |
UPCA |
string |
GS1 12-cyfrowy kod produktu uniwersalnego. |
UPCE |
string |
GS1 6-cyfrowy kod produktu uniwersalnego. |
DocumentCaption
Obiekt podpisu opisujący tabelę lub rysunek.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Wiązanie regionów obejmujących podpis. |
|
content |
string |
Zawartość podpisu. |
elements |
string[] |
Elementy podrzędne podpisu. |
spans |
Lokalizacja podpisu w kolejności czytania łączy zawartość. |
DocumentContentFormat
Format zawartości w przeanalizowanym wyniku.
Nazwa | Typ | Opis |
---|---|---|
markdown |
string |
Reprezentacja markdown zawartości dokumentu z nagłówkami sekcji, tabelami itp. |
text |
string |
Reprezentacja zwykłego tekstu zawartości dokumentu bez formatowania. |
DocumentField
Obiekt reprezentujący zawartość i lokalizację wartości pola.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące pole. |
|
confidence |
number |
Pewność poprawnego wyodrębnienia pola. |
content |
string |
Zawartość pola. |
spans |
Lokalizacja pola w kolejności odczytu łączy zawartość. |
|
type |
Typ danych wartości pola. |
|
valueAddress |
Wartość adresu. |
|
valueArray |
Tablica wartości pól. |
|
valueBoolean |
boolean |
Wartość logiczna. |
valueCountryRegion |
string |
3-literowa wartość kodu kraju (ISO 3166-1 alfa-3). |
valueCurrency |
Wartość waluty. |
|
valueDate |
string |
Wartość daty w formacie RRRR-MM-DD (ISO 8601). |
valueInteger |
integer |
Wartość całkowita. |
valueNumber |
number |
Wartość zmiennoprzecinkowa. |
valueObject |
<string,
Document |
Słownik nazwanych wartości pól. |
valuePhoneNumber |
string |
Wartość numeru telefonu w formacie E.164 (np. +19876543210). |
valueSelectionGroup |
string[] |
Wartość grupy zaznaczenia. |
valueSelectionMark |
Wartość znacznika zaznaczenia. |
|
valueSignature |
Obecność podpisu. |
|
valueString |
string |
Wartość ciągu. |
valueTime |
string |
Wartość czasu w formacie hh:mm:ss (ISO 8601). |
DocumentFieldType
Semantyczny typ danych wartości pola.
Nazwa | Typ | Opis |
---|---|---|
address |
string |
Przeanalizowany adres. |
array |
string |
Lista pól podrzędnych tego samego typu. |
boolean |
string |
Wartość logiczna, znormalizowana do wartości true lub false. |
countryRegion |
string |
Kraj/region, znormalizowany do formatu ISO 3166-1 alfa-3 (np. USA). |
currency |
string |
Kwota waluty z opcjonalnym symbolem waluty i jednostką. |
date |
string |
Data, znormalizowana do formatu ISO 8601 (RRRR-MM-DD). |
integer |
string |
Liczba całkowita, znormalizowana do 64-bitowej liczby całkowitej ze znakiem. |
number |
string |
Liczba zmiennoprzecinkowa znormalizowana do podwójnej precyzji zmiennoprzecinkowa. |
object |
string |
Nazwana lista pól podrzędnych potencjalnie różnych typów. |
phoneNumber |
string |
Numer telefonu, znormalizowany do formatu E.164 (+{CountryCode}{Numer subskrybenta}). |
selectionGroup |
string |
Tablica wybranych wartości ciągów. |
selectionMark |
string |
Czy pole jest zaznaczone? |
signature |
string |
Czy podpis jest obecny? |
string |
string |
Zwykły tekst. |
time |
string |
Czas znormalizowany do formatu ISO 8601 (hh:mm:ss). |
DocumentFigure
Obiekt reprezentujący rysunek w dokumencie.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące rysunek. |
|
caption |
Podpis skojarzony z rysunkiem. |
|
elements |
string[] |
Elementy podrzędne rysunku, z wyłączeniem podpisów lub przypisów dolnych. |
footnotes |
Lista przypisów dolnych skojarzonych z rysunkiem. |
|
id |
string |
Identyfikator rysunku. |
spans |
Lokalizacja rysunku w kolejności odczytu połączona zawartość. |
DocumentFontStyle
Styl czcionki.
Nazwa | Typ | Opis |
---|---|---|
italic |
string |
Znaki są wizualnie skośne po prawej stronie. |
normal |
string |
Znaki są reprezentowane normalnie. |
DocumentFontWeight
Waga czcionki.
Nazwa | Typ | Opis |
---|---|---|
bold |
string |
Znaki są reprezentowane za pomocą grubszych pociągnięć. |
normal |
string |
Znaki są reprezentowane normalnie. |
DocumentFootnote
Obiekt przypisu dolnego opisujący tabelę lub rysunek.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące przypis dolny. |
|
content |
string |
Zawartość przypisu dolnego. |
elements |
string[] |
Podrzędne elementy przypisu dolnego. |
spans |
Lokalizacja przypisu dolnego w kolejności odczytu łączy zawartość. |
DocumentFormula
Obiekt formuły.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Pewność poprawnego wyodrębnienia formuły. |
kind |
Rodzaj formuły. |
|
polygon |
number[] |
Powiązanie wielokąta formuły ze współrzędnymi określonymi względem lewej górnej części strony. Liczby reprezentują wartości x, y wierzchołków wielokątnych, zgodnie z ruchem wskazówek zegara od lewej (-180 stopni włącznie) względem orientacji elementu. |
span |
Lokalizacja formuły w kolejności odczytywania łączonej zawartości. |
|
value |
string |
Wyrażenie LaTex opisujące formułę. |
DocumentFormulaKind
Rodzaj formuły.
Nazwa | Typ | Opis |
---|---|---|
display |
string |
Formuła w trybie wyświetlania, która zajmuje cały wiersz. |
inline |
string |
Formuła osadzona w zawartości akapitu. |
DocumentIntelligenceError
Obiekt błędu.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
details |
Tablica szczegółów dotyczących określonych błędów, które doprowadziły do tego zgłoszonego błędu. |
|
innererror |
Obiekt zawierający bardziej szczegółowe informacje niż bieżący obiekt o błędzie. |
|
message |
string |
Czytelna dla człowieka reprezentacja błędu. |
target |
string |
Element docelowy błędu. |
DocumentIntelligenceErrorResponse
Błąd obiektu odpowiedzi.
Nazwa | Typ | Opis |
---|---|---|
error |
Informacje o błędzie. |
DocumentIntelligenceInnerError
Obiekt zawierający bardziej szczegółowe informacje o błędzie.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
innererror |
Błąd wewnętrzny. |
|
message |
string |
Czytelna dla człowieka reprezentacja błędu. |
DocumentIntelligenceOperationStatus
Stan operacji.
Nazwa | Typ | Opis |
---|---|---|
canceled |
string |
Operacja została anulowana. |
failed |
string |
Operacja nie powiodła się. |
notStarted |
string |
Operacja nie została jeszcze uruchomiona. |
running |
string |
Operacja jest w toku. |
skipped |
string |
Operacja została pominięta. |
succeeded |
string |
Operacja zakończyła się pomyślnie. |
DocumentIntelligenceWarning
Obiekt błędu.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów ostrzegawczych. |
message |
string |
Czytelna dla człowieka reprezentacja ostrzeżenia. |
target |
string |
Element docelowy błędu. |
DocumentKeyValueElement
Obiekt reprezentujący klucz pola lub wartość w parze klucz-wartość.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące element klucz-wartość. |
|
content |
string |
Połączona zawartość elementu klucz-wartość w kolejności odczytu. |
spans |
Lokalizacja elementu klucz-wartość w kolejności odczytu łączenie zawartości. |
DocumentKeyValuePair
Obiekt reprezentujący pole formularza z unikatową etykietą pola (klucz) i wartością pola (może być pusta).
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Pewność poprawnego wyodrębnienia pary klucz-wartość. |
key |
Etykieta pola pary klucz-wartość. |
|
value |
Wartość pola pary klucz-wartość. |
DocumentLanguage
Obiekt reprezentujący wykryty język dla danego zakresu tekstu.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Pewność prawidłowego identyfikowania języka. |
locale |
string |
Wykryty język. Wartość może zawierać kod języka ISO 639-1 (np. "en", "fr") lub tag języka BCP 47 (np. "zh-Hans"). |
spans |
Lokalizacja elementów tekstowych w łączonej zawartości, do których ma zastosowanie język. |
DocumentLine
Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.
Nazwa | Typ | Opis |
---|---|---|
content |
string |
Połączona zawartość zawartych elementów w kolejności odczytu. |
polygon |
number[] |
Wiązanie wielokąta linii ze współrzędnymi określonymi względem lewej górnej części strony. Liczby reprezentują wartości x, y wierzchołków wielokątnych, zgodnie z ruchem wskazówek zegara od lewej (-180 stopni włącznie) względem orientacji elementu. |
spans |
Lokalizacja wiersza w kolejności odczytu łączy zawartość. |
DocumentPage
Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.
Nazwa | Typ | Opis |
---|---|---|
angle |
number |
Ogólna orientacja zawartości w kierunku wskazówek zegara mierzona w stopniach między (-180, 180). |
barcodes |
Wyodrębnione kody kreskowe ze strony. |
|
formulas |
Wyodrębnione formuły ze strony. |
|
height |
number |
Wysokość obrazu/PLIKU PDF w pikselach/calach, odpowiednio. |
lines |
Wyodrębnione wiersze ze strony, potencjalnie zawierające zarówno elementy tekstowe, jak i wizualne. |
|
pageNumber |
integer |
Numer strony opartej na 1 w dokumencie wejściowym. |
selectionMarks |
Wyodrębnione znaczniki zaznaczenia ze strony. |
|
spans |
Lokalizacja strony w kolejności odczytu łączy zawartość. |
|
unit |
Jednostka używana przez właściwości szerokości, wysokości i wielokąta. W przypadku obrazów jednostka jest "piksel". W przypadku formatu PDF jednostka jest "cal". |
|
width |
number |
Szerokość obrazu/pliku PDF odpowiednio w pikselach/calach. |
words |
Wyodrębnione wyrazy ze strony. |
DocumentParagraph
Obiekt akapitu składający się z ciągłych linii zwykle ze wspólnym wyrównaniem i odstępami.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące akapit. |
|
content |
string |
Połączona zawartość akapitu w kolejności czytania. |
role |
Semantyczna rola akapitu. |
|
spans |
Lokalizacja akapitu w kolejności odczytu łączy zawartość. |
DocumentSection
Obiekt reprezentujący sekcję w dokumencie.
Nazwa | Typ | Opis |
---|---|---|
elements |
string[] |
Elementy podrzędne sekcji. |
spans |
Lokalizacja sekcji w kolejności odczytywania łączonej zawartości. |
DocumentSelectionMark
Obiekt zaznaczenia reprezentujący pola wyboru, przyciski radiowe i inne elementy wskazujące zaznaczenie.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Pewność poprawnego wyodrębnienia znacznika zaznaczenia. |
polygon |
number[] |
Wiązanie wielokąta znacznika wyboru ze współrzędnymi określonymi względem lewej górnej części strony. Liczby reprezentują wartości x, y wierzchołków wielokątnych, zgodnie z ruchem wskazówek zegara od lewej (-180 stopni włącznie) względem orientacji elementu. |
span |
Lokalizacja znacznika wyboru w kolejności odczytywania łączonej zawartości. |
|
state |
Stan znacznika wyboru. |
DocumentSelectionMarkState
Stan znacznika wyboru.
Nazwa | Typ | Opis |
---|---|---|
selected |
string |
Zaznaczony jest znacznik wyboru, często wskazywany przez znacznik wyboru = lub krzyż X wewnątrz znacznika zaznaczenia. |
unselected |
string |
Nie wybrano znacznika wyboru. |
DocumentSignatureType
Obecność podpisu.
Nazwa | Typ | Opis |
---|---|---|
signed |
string |
Wykryto podpis. |
unsigned |
string |
Nie wykryto podpisów. |
DocumentSpan
Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.
Nazwa | Typ | Opis |
---|---|---|
length |
integer |
Liczba znaków w zawartości reprezentowanej przez zakres. |
offset |
integer |
Indeks na podstawie zera zawartości reprezentowanej przez zakres. |
DocumentStyle
Obiekt reprezentujący obserwowane style tekstu.
Nazwa | Typ | Opis |
---|---|---|
backgroundColor |
string |
Kolor tła w formacie szesnastkowym #rrggbb. |
color |
string |
Kolor pierwszego planu w formacie szesnastkowym #rrggbb. |
confidence |
number |
Pewność prawidłowego identyfikowania stylu. |
fontStyle |
Styl czcionki. |
|
fontWeight |
Waga czcionki. |
|
isHandwritten |
boolean |
Czy zawartość jest odręczna? |
similarFontFamily |
string |
Wizualnie najbardziej podobna czcionka z zestawu obsługiwanych rodzin czcionek z czcionkami rezerwowymi zgodnie z konwencją CSS (np. "Arial, sans-serif"). |
spans |
Lokalizacja elementów tekstowych w łączonej zawartości, do których ma zastosowanie styl. |
DocumentTable
Obiekt tabeli składający się z komórek tabeli rozmieszczony w układzie prostokątnym.
Nazwa | Typ | Opis |
---|---|---|
boundingRegions |
Wiązanie regionów obejmujących tabelę. |
|
caption |
Podpis skojarzony z tabelą. |
|
cells |
Komórki zawarte w tabeli. |
|
columnCount |
integer |
Liczba kolumn w tabeli. |
footnotes |
Lista przypisów dolnych skojarzonych z tabelą. |
|
rowCount |
integer |
Liczba wierszy w tabeli. |
spans |
Lokalizacja tabeli w kolejności odczytu łączy zawartość. |
DocumentTableCell
Obiekt reprezentujący lokalizację i zawartość komórki tabeli.
Nazwa | Typ | Domyślna wartość | Opis |
---|---|---|---|
boundingRegions |
Regiony ograniczenia obejmujące komórkę tabeli. |
||
columnIndex |
integer |
Indeks kolumn komórki. |
|
columnSpan |
integer |
1 |
Liczba kolumn obejmujących tę komórkę. |
content |
string |
Połączona zawartość komórki tabeli w kolejności odczytu. |
|
elements |
string[] |
Elementy podrzędne komórki tabeli. |
|
kind | content |
Rodzaj komórki tabeli. |
|
rowIndex |
integer |
Indeks wiersza komórki. |
|
rowSpan |
integer |
1 |
Liczba wierszy obejmujących tę komórkę. |
spans |
Lokalizacja komórki tabeli w kolejności odczytywania łączonej zawartości. |
DocumentTableCellKind
Rodzaj komórki tabeli.
Nazwa | Typ | Opis |
---|---|---|
columnHeader |
string |
Opisuje zawartość kolumny. |
content |
string |
Zawiera główną zawartość/dane. |
description |
string |
Opisuje zawartość w (częściach) tabeli. |
rowHeader |
string |
Opisuje zawartość wiersza. |
stubHead |
string |
Opisuje nagłówki wierszy, zwykle znajdujące się w lewym górnym rogu tabeli. |
DocumentWord
Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.
Nazwa | Typ | Opis |
---|---|---|
confidence |
number |
Pewność poprawnego wyodrębnienia wyrazu. |
content |
string |
Zawartość tekstowa wyrazu. |
polygon |
number[] |
Wiązanie wielokąta słowa ze współrzędnymi określonymi względem lewej górnej części strony. Liczby reprezentują wartości x, y wierzchołków wielokątnych, zgodnie z ruchem wskazówek zegara od lewej (-180 stopni włącznie) względem orientacji elementu. |
span |
Lokalizacja wyrazu w kolejności czytania łączy zawartość. |
LengthUnit
Jednostka używana przez właściwości szerokości, wysokości i wielokąta. W przypadku obrazów jednostka jest "piksel". W przypadku formatu PDF jednostka jest "cal".
Nazwa | Typ | Opis |
---|---|---|
inch |
string |
Jednostka długości plików PDF. |
pixel |
string |
Jednostka długości dla plików obrazów. |
ParagraphRole
Semantyczna rola akapitu.
Nazwa | Typ | Opis |
---|---|---|
footnote |
string |
Notatka zwykle umieszczana po zawartości głównej na stronie. |
formulaBlock |
string |
Blok formuł, często ze współdzieloną wyrównaniem. |
pageFooter |
string |
Tekst w dolnej krawędzi strony. |
pageHeader |
string |
Tekst w górnej krawędzi strony. |
pageNumber |
string |
Numer strony. |
sectionHeading |
string |
Nagłówek podrzędny opisujący sekcję dokumentu. |
title |
string |
Tytuł najwyższego poziomu opisujący cały dokument. |
StringIndexType
Metoda używana do obliczania przesunięcia i długości ciągu.
Nazwa | Typ | Opis |
---|---|---|
textElements |
string |
Postrzegany przez użytkownika znak wyświetlania lub klaster grafu, zgodnie z definicją w standardze Unicode 8.0.0. |
unicodeCodePoint |
string |
Jednostka znaku reprezentowana przez pojedynczy punkt kodu Unicode. Używany przez język Python 3. |
utf16CodeUnit |
string |
Jednostka znaków reprezentowana przez 16-bitową jednostkę kodu Unicode. Używane przez języki JavaScript, Java i .NET. |