Document Classifiers - Get Classify Result
Získá výsledek klasifikátoru dokumentu.
GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-11-30
Parametry identifikátoru URI
Name | V | Vyžadováno | Typ | Description |
---|---|---|---|---|
classifier
|
path | True |
string |
Jedinečný název klasifikátoru dokumentu Vzor regulárního výrazu: |
endpoint
|
path | True |
string uri |
Koncový bod služby Document Intelligence |
result
|
path | True |
string uuid |
Analyzujte ID výsledku operace. |
api-version
|
query | True |
string |
Verze rozhraní API, která se má použít pro tuto operaci. |
Odpovědi
Name | Typ | Description |
---|---|---|
200 OK |
Požadavek byl úspěšný. |
|
Other Status Codes |
Neočekávaná chybová odpověď |
Zabezpečení
Ocp-Apim-Subscription-Key
Typ:
apiKey
V:
header
OAuth2Auth
Typ:
oauth2
Tok:
accessCode
URL autorizace:
https://login.microsoftonline.com/common/oauth2/authorize
URL tokenu:
https://login.microsoftonline.com/common/oauth2/token
Rozsahy
Name | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Příklady
Get Classify Document Result
Ukázkový požadavek
GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30
Ukázková odpověď
{
"status": "succeeded",
"createdDateTime": "2021-09-24T13:00:46Z",
"lastUpdatedDateTime": "2021-09-24T13:00:49Z",
"analyzeResult": {
"apiVersion": "2024-11-30",
"modelId": "myClassifier",
"stringIndexType": "textElements",
"contentFormat": "text",
"content": "",
"pages": [
{
"pageNumber": 1,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 2,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 3,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
}
],
"documents": [
{
"docType": "formA",
"boundingRegions": [
{
"pageNumber": 1,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
},
{
"pageNumber": 2,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
},
{
"docType": "formB",
"boundingRegions": [
{
"pageNumber": 3,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
}
]
}
}
Definice
Name | Description |
---|---|
Address |
Hodnota pole Adresa. |
Analyzed |
Objekt popisující umístění a sémantický obsah dokumentu. |
Analyze |
Stav a výsledek operace analýzy |
Analyze |
Výsledek analýzy dokumentu |
Bounding |
Ohraničení mnohoúhelníku na konkrétní stránce vstupu |
Currency |
Hodnota pole Měna. |
Document |
Objekt čárového kódu. |
Document |
Druh čárového kódu. |
Document |
Objekt titulku popisující tabulku nebo obrázek |
Document |
Formát obsahu v analyzovaném výsledku |
Document |
Objekt představující obsah a umístění hodnoty pole. |
Document |
Sémantický datový typ hodnoty pole |
Document |
Objekt představující obrázek v dokumentu |
Document |
Styl písma. |
Document |
Váha písma. |
Document |
Objekt poznámky pod čarou popisující tabulku nebo obrázek |
Document |
Objekt vzorce. |
Document |
Druh vzorce |
Document |
Objekt chyby. |
Document |
Objekt odpovědi na chybu |
Document |
Objekt obsahující konkrétnější informace o chybě. |
Document |
Stav operace. |
Document |
Objekt chyby. |
Document |
Objekt představující klíč pole nebo hodnotu v páru klíč-hodnota. |
Document |
Objekt představující pole formuláře s jedinečným popiskem pole (klíč) a hodnotou pole (může být prázdný). |
Document |
Objekt představující rozpoznaný jazyk daného rozsahu textu. |
Document |
Objekt řádku obsahu, který se skládá ze sousední sekvence prvků obsahu, jako jsou slova a značky výběru. |
Document |
Prvky obsahu a rozložení extrahované ze stránky ze vstupu |
Document |
Objekt odstavce, který se skládá z souvislých čar obecně se společným zarovnáním a mezerami. |
Document |
Objekt představující oddíl v dokumentu. |
Document |
Objekt značky výběru představující zaškrtávací políčka, přepínače a další prvky označující výběr |
Document |
Stav značky výběru |
Document |
Přítomnost podpisu. |
Document |
Souvislá oblast zřetězené vlastnosti obsahu určená jako posun a délka. |
Document |
Objekt představující pozorované styly textu |
Document |
Objekt tabulky, který se skládá z buněk tabulky uspořádaných do obdélníkového rozložení |
Document |
Objekt představující umístění a obsah buňky tabulky |
Document |
Druh buňky tabulky |
Document |
Objekt slova skládající se z souvislé posloupnosti znaků. Pro jazyky, které nejsou oddělené mezerami, jako jsou čínština, japonština a korejština, jsou jednotlivé znaky reprezentovány jako vlastní slovo. |
Length |
Jednotka používaná vlastnostmi šířky, výšky a mnohoúhelníku. U obrázků je jednotka "pixel". Pro PDF je jednotka "inch". |
Paragraph |
Sémantická role odstavce. |
String |
Metoda použitá k výpočtu posunu a délky řetězce |
AddressValue
Hodnota pole Adresa.
Name | Typ | Description |
---|---|---|
city |
string |
Název města, města, vesnice atd. |
cityDistrict |
string |
Čtvrti nebo obvody v rámci města, jako je Brooklyn v New York City nebo City of Westminster v Londýně. |
countryRegion |
string |
Země/oblast. |
house |
string |
Název sestavení, například World Trade Center. |
houseNumber |
string |
Číslo domu nebo budovy. |
level |
string |
Číslo podlahy, například 3F. |
poBox |
string |
Číslo poštovní schránky. |
postalCode |
string |
PSČ používané k řazení pošty. |
road |
string |
Název ulice. |
state |
string |
Správní divize první úrovně. |
stateDistrict |
string |
Rozdělení správy druhé úrovně používané v určitých národních prostředích. |
streetAddress |
string |
Adresa na úrovni ulice s výjimkou města, státu, země a PSČ. |
suburb |
string |
Neoficiální název sousedství, jako je Chinatown. |
unit |
string |
Číslo bytu nebo kanceláře |
AnalyzedDocument
Objekt popisující umístění a sémantický obsah dokumentu.
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti, které dokument pokrývají. |
|
confidence |
number |
Spolehlivost správného extrahování dokumentu |
docType |
string |
Typ dokumentu. |
fields |
<string,
Document |
Slovník pojmenovaných hodnot polí |
spans |
Umístění dokumentu v pořadí čtení zřetězeného obsahu |
AnalyzeOperation
Stav a výsledek operace analýzy
Name | Typ | Description |
---|---|---|
analyzeResult |
Výsledek analýzy dokumentu |
|
createdDateTime |
string |
Datum a čas (UTC) při odeslání operace analýzy |
error |
Při analýze dokumentu došlo k chybě. |
|
lastUpdatedDateTime |
string |
Datum a čas (UTC) při poslední aktualizaci stavu |
status |
Stav operace. notStarted, running, succeeded, orfailed |
AnalyzeResult
Výsledek analýzy dokumentu
Name | Typ | Description |
---|---|---|
apiVersion |
string |
Verze rozhraní API používaná k vytvoření tohoto výsledku. |
content |
string |
Zřetězení řetězcové reprezentace všech textových a vizuálních prvků v pořadí čtení |
contentFormat |
Formát obsahu nejvyšší úrovně analýzy výsledků |
|
documents |
Extrahované dokumenty |
|
figures |
Extrahované obrázky. |
|
keyValuePairs |
Extrahované páry klíč-hodnota |
|
languages |
Zjištěné jazyky. |
|
modelId |
string |
ID modelu dokumentu použité k vytvoření tohoto výsledku |
pages |
Analyzované stránky. |
|
paragraphs |
Extrahované odstavce |
|
sections |
Extrahované oddíly |
|
stringIndexType |
Metoda použitá k výpočtu posunu a délky řetězce |
|
styles |
Extrahované styly písma |
|
tables |
Extrahované tabulky |
|
warnings |
Byl zjištěn seznam upozornění. |
BoundingRegion
Ohraničení mnohoúhelníku na konkrétní stránce vstupu
Name | Typ | Description |
---|---|---|
pageNumber |
integer |
1-based page number of page containing the bounding region. |
polygon |
number[] |
Ohraničující mnohoúhelník na stránce nebo celá stránka, pokud není zadána. Souřadnice zadané vzhledem k levému hornímu rohu stránky Čísla představují hodnoty x, y polygonových vrcholů, ve směru hodinových ručiček zleva (-180 stupňů včetně) vzhledem k orientaci prvku. |
CurrencyValue
Hodnota pole Měna.
Name | Typ | Description |
---|---|---|
amount |
number |
Částka měny. |
currencyCode |
string |
Vyřešený kód měny (ISO 4217), pokud existuje. |
currencySymbol |
string |
Popisek symbolu měny, pokud existuje. |
DocumentBarcode
Objekt čárového kódu.
Name | Typ | Description |
---|---|---|
confidence |
number |
Spolehlivost správného extrahování čárového kódu. |
kind |
Druh čárového kódu. |
|
polygon |
number[] |
Ohraničující mnohoúhelník čárového kódu se zadanými souřadnicemi v levém horním rohu stránky. Čísla představují hodnoty x, y polygonových vrcholů, ve směru hodinových ručiček zleva (-180 stupňů včetně) vzhledem k orientaci prvku. |
span |
Umístění čárového kódu v pořadí čtení zřetězeného obsahu |
|
value |
string |
Hodnota čárového kódu |
DocumentBarcodeKind
Druh čárového kódu.
Name | Typ | Description |
---|---|---|
Aztec |
string |
Kód Aztec definovaný v ISO/IEC 24778:2008. |
Codabar |
string |
Čárový kód Codabar definovaný v ANSI/AIM BC3-1995. |
Code128 |
string |
Čárový kód 128 definovaný v ISO/IEC 15417:2007. |
Code39 |
string |
Čárový kód 39 definovaný v ISO/IEC 16388:2007. |
Code93 |
string |
Čárový kód 93 definovaný v ANSI/AIM BC5-1995. |
DataBar |
string |
Čárový kód datového pruhu GS1. |
DataBarExpanded |
string |
Datovýbar GS1 – rozbalený čárový kód |
DataMatrix |
string |
Kód datové matice, jak je definováno v ISO/IEC 16022:2006. |
EAN13 |
string |
GS1 13místné číslo mezinárodního článku (číslo evropského článku). |
EAN8 |
string |
GS1 8místné číslo mezinárodního článku (číslo evropského článku). |
ITF |
string |
Prokládání 2 z 5 čárových kódů, jak je definováno v ANSI/AIM BC2-1995. |
MaxiCode |
string |
MaxiCode, jak je definováno v ISO/IEC 16023:2000. |
MicroQRCode |
string |
Micro QR kód, jak je definováno v ISO/IEC 23941:2022. |
PDF417 |
string |
PDF417, jak je definováno v ISO 15438. |
QRCode |
string |
Kód QR definovaný v ISO/IEC 18004:2015. |
UPCA |
string |
GS1 12místný univerzální kód produktu. |
UPCE |
string |
GS1 6místný univerzální kód produktu. |
DocumentCaption
Objekt titulku popisující tabulku nebo obrázek
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti, které pokrývají titulek |
|
content |
string |
Obsah titulku |
elements |
string[] |
Podřízené prvky titulku |
spans |
Umístění titulku v pořadí čtení zřetězený obsah |
DocumentContentFormat
Formát obsahu v analyzovaném výsledku
Name | Typ | Description |
---|---|---|
markdown |
string |
Reprezentace obsahu dokumentu pomocí nadpisů oddílů, tabulek atd. |
text |
string |
Reprezentace obsahu dokumentu ve formátu prostého textu bez formátování |
DocumentField
Objekt představující obsah a umístění hodnoty pole.
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti pokrývající pole. |
|
confidence |
number |
Spolehlivost správného extrahování pole |
content |
string |
Obsah pole |
spans |
Umístění pole v pořadí čtení zřetězený obsah |
|
type |
Datový typ hodnoty pole |
|
valueAddress |
Hodnota adresy. |
|
valueArray |
Pole hodnot polí |
|
valueBoolean |
boolean |
Logická hodnota |
valueCountryRegion |
string |
3-letter country code value (ISO 3166-1 alpha-3). |
valueCurrency |
Hodnota měny. |
|
valueDate |
string |
Hodnota data ve formátu RRRR-MM-DD (ISO 8601). |
valueInteger |
integer |
Celočíselná hodnota |
valueNumber |
number |
Hodnota s plovoucí desetinou čárkou |
valueObject |
<string,
Document |
Slovník pojmenovaných hodnot polí |
valuePhoneNumber |
string |
Telefonní číslo ve formátu E.164 (např. +19876543210). |
valueSelectionGroup |
string[] |
Hodnota skupiny výběru |
valueSelectionMark |
Hodnota značky výběru |
|
valueSignature |
Přítomnost podpisu. |
|
valueString |
string |
Řetězcová hodnota. |
valueTime |
string |
Časová hodnota ve formátu hh:mm:ss (ISO 8601). |
DocumentFieldType
Sémantický datový typ hodnoty pole
Name | Typ | Description |
---|---|---|
address |
string |
Parsovaná adresa. |
array |
string |
Seznam dílčích polí stejného typu |
boolean |
string |
Logická hodnota, normalizovaná na hodnotu true nebo false. |
countryRegion |
string |
Země/oblast, normalizovaná na formát ISO 3166-1 alfa-3 (např. USA). |
currency |
string |
Částka měny s volitelným symbolem měny a jednotkou |
date |
string |
Datum, normalizované ve formátu ISO 8601 (RRRR-MM-DD) |
integer |
string |
Celočíselné číslo, normalizované na 64bitové celé číslo se signedem. |
number |
string |
Číslo s plovoucí desetinnou čárkou, normalizované na dvojitou přesnost s plovoucí desetinnou čárkou. |
object |
string |
Pojmenovaný seznam dílčích polí potenciálně různých typů |
phoneNumber |
string |
Telefonní číslo, normalizované na formát E.164 (+{CountryCode}{SubscriberNumber}). |
selectionGroup |
string |
Pole vybraných řetězcových hodnot |
selectionMark |
string |
Je pole vybrané? |
signature |
string |
Existuje podpis? |
string |
string |
Prostý text. |
time |
string |
Čas normalizovaný do formátu ISO 8601 (hh:mm:ss). |
DocumentFigure
Objekt představující obrázek v dokumentu
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti pokrývající obrázek. |
|
caption |
Titulek přidružený k obrázku |
|
elements |
string[] |
Podřízené prvky obrázku s výjimkou titulků nebo poznámek pod čarou |
footnotes |
Seznam poznámek pod čarou přidružených k obrázku |
|
id |
string |
ID obrázku |
spans |
Umístění obrázku v pořadí čtení zřetězeného obsahu |
DocumentFontStyle
Styl písma.
Name | Typ | Description |
---|---|---|
italic |
string |
Znaky jsou vizuálně zkosené doprava. |
normal |
string |
Znaky jsou reprezentovány normálně. |
DocumentFontWeight
Váha písma.
Name | Typ | Description |
---|---|---|
bold |
string |
Znaky jsou reprezentovány silnějšími tahy. |
normal |
string |
Znaky jsou reprezentovány normálně. |
DocumentFootnote
Objekt poznámky pod čarou popisující tabulku nebo obrázek
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti, které pokrývají poznámku pod čarou. |
|
content |
string |
Obsah poznámky pod čarou. |
elements |
string[] |
Podřízené prvky poznámky pod čarou |
spans |
Umístění poznámky pod čarou v pořadí čtení zřetězený obsah. |
DocumentFormula
Objekt vzorce.
Name | Typ | Description |
---|---|---|
confidence |
number |
Spolehlivost správného extrahování vzorce |
kind |
Druh vzorce |
|
polygon |
number[] |
Ohraničující mnohoúhelník vzorce se souřadnicemi zadanými vzhledem k levému hornímu rohu stránky Čísla představují hodnoty x, y polygonových vrcholů, ve směru hodinových ručiček zleva (-180 stupňů včetně) vzhledem k orientaci prvku. |
span |
Umístění vzorce v pořadí čtení zřetězeného obsahu |
|
value |
string |
Výraz LaTex popisující vzorec |
DocumentFormulaKind
Druh vzorce
Name | Typ | Description |
---|---|---|
display |
string |
Vzorec v režimu zobrazení, který zabírá celý řádek. |
inline |
string |
Vzorec vložený do obsahu odstavce |
DocumentIntelligenceError
Objekt chyby.
Name | Typ | Description |
---|---|---|
code |
string |
Jedna ze serverově definovaných kódů chyb. |
details |
Pole podrobností o konkrétních chybách, které vedly k této nahlášené chybě. |
|
innererror |
Objekt obsahující konkrétnější informace, než je aktuální objekt o chybě. |
|
message |
string |
Čitelné znázornění chyby člověkem. |
target |
string |
Cíl chyby. |
DocumentIntelligenceErrorResponse
Objekt odpovědi na chybu
Name | Typ | Description |
---|---|---|
error |
Informace o chybě |
DocumentIntelligenceInnerError
Objekt obsahující konkrétnější informace o chybě.
Name | Typ | Description |
---|---|---|
code |
string |
Jedna ze serverově definovaných kódů chyb. |
innererror |
Vnitřní chyba. |
|
message |
string |
Čitelné znázornění chyby člověkem. |
DocumentIntelligenceOperationStatus
Stav operace.
Name | Typ | Description |
---|---|---|
canceled |
string |
Operace byla zrušena. |
failed |
string |
Operace se nezdařila. |
notStarted |
string |
Operace ještě nebyla spuštěna. |
running |
string |
Operace probíhá. |
skipped |
string |
Operace byla vynechána. |
succeeded |
string |
Operace byla úspěšná. |
DocumentIntelligenceWarning
Objekt chyby.
Name | Typ | Description |
---|---|---|
code |
string |
Jedna ze serverově definovaných kódů upozornění. |
message |
string |
Čitelné znázornění varování člověkem. |
target |
string |
Cíl chyby. |
DocumentKeyValueElement
Objekt představující klíč pole nebo hodnotu v páru klíč-hodnota.
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti pokrývající prvek klíč-hodnota. |
|
content |
string |
Zřetězený obsah prvku klíč-hodnota v pořadí čtení. |
spans |
Umístění prvku klíč-hodnota v zřetězený obsah pořadí čtení. |
DocumentKeyValuePair
Objekt představující pole formuláře s jedinečným popiskem pole (klíč) a hodnotou pole (může být prázdný).
Name | Typ | Description |
---|---|---|
confidence |
number |
Spolehlivost správného extrahování páru klíč-hodnota |
key |
Popisek pole páru klíč-hodnota |
|
value |
Hodnota pole páru klíč-hodnota. |
DocumentLanguage
Objekt představující rozpoznaný jazyk daného rozsahu textu.
Name | Typ | Description |
---|---|---|
confidence |
number |
Spolehlivost správné identifikace jazyka |
locale |
string |
Zjištěný jazyk. Hodnota může kód jazyka ISO 639-1 (např. "en", "fr") nebo značka jazyka BCP 47 (např. "zh-Hans"). |
spans |
Umístění textových prvků v zřetězení obsahu, na který se jazyk vztahuje. |
DocumentLine
Objekt řádku obsahu, který se skládá ze sousední sekvence prvků obsahu, jako jsou slova a značky výběru.
Name | Typ | Description |
---|---|---|
content |
string |
Zřetězený obsah obsažených prvků v pořadí čtení |
polygon |
number[] |
Ohraničení mnohoúhelníku čáry se souřadnicemi zadanými vzhledem k levému hornímu rohu stránky Čísla představují hodnoty x, y polygonových vrcholů, ve směru hodinových ručiček zleva (-180 stupňů včetně) vzhledem k orientaci prvku. |
spans |
Umístění řádku v pořadí čtení zřetězený obsah. |
DocumentPage
Prvky obsahu a rozložení extrahované ze stránky ze vstupu
Name | Typ | Description |
---|---|---|
angle |
number |
Obecná orientace obsahu ve směru hodinových ručiček měřená ve stupních mezi (-180, 180]. |
barcodes |
Extrahované čárové kódy ze stránky |
|
formulas |
Extrahované vzorce ze stránky |
|
height |
number |
Výška obrázku/PDF v pixelech/palcích. |
lines |
Extrahované řádky ze stránky, potenciálně obsahující textové i vizuální prvky. |
|
pageNumber |
integer |
Číslo stránky založené na 1 číslu ve vstupním dokumentu |
selectionMarks |
Extrahované značky výběru ze stránky |
|
spans |
Umístění stránky ve zřetězení obsahu v pořadí čtení |
|
unit |
Jednotka používaná vlastnostmi šířky, výšky a mnohoúhelníku. U obrázků je jednotka "pixel". Pro PDF je jednotka "inch". |
|
width |
number |
Šířka obrázku/PDF v pixelech/palcích. |
words |
Extrahovaná slova ze stránky |
DocumentParagraph
Objekt odstavce, který se skládá z souvislých čar obecně se společným zarovnáním a mezerami.
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti pokrývající odstavec. |
|
content |
string |
Zřetězený obsah odstavce v pořadí čtení |
role |
Sémantická role odstavce. |
|
spans |
Umístění odstavce v pořadí čtení zřetězený obsah. |
DocumentSection
Objekt představující oddíl v dokumentu.
Name | Typ | Description |
---|---|---|
elements |
string[] |
Podřízené prvky oddílu |
spans |
Umístění oddílu v pořadí čtení zřetězeného obsahu |
DocumentSelectionMark
Objekt značky výběru představující zaškrtávací políčka, přepínače a další prvky označující výběr
Name | Typ | Description |
---|---|---|
confidence |
number |
Spolehlivost správného extrahování značky výběru |
polygon |
number[] |
Ohraničení mnohoúhelníku značky výběru se souřadnicemi zadanými vzhledem k levému hornímu rohu stránky Čísla představují hodnoty x, y polygonových vrcholů, ve směru hodinových ručiček zleva (-180 stupňů včetně) vzhledem k orientaci prvku. |
span |
Umístění značky výběru v zřetězení obsahu v pořadí čtení |
|
state |
Stav značky výběru |
DocumentSelectionMarkState
Stav značky výběru
Name | Typ | Description |
---|---|---|
selected |
string |
Značka výběru je vybrána, často označená zaškrtnutím nebo křížkem X uvnitř značky výběru. |
unselected |
string |
Značka výběru není vybraná. |
DocumentSignatureType
Přítomnost podpisu.
Name | Typ | Description |
---|---|---|
signed |
string |
Zjistí se podpis. |
unsigned |
string |
Nebyly zjištěny žádné podpisy. |
DocumentSpan
Souvislá oblast zřetězené vlastnosti obsahu určená jako posun a délka.
Name | Typ | Description |
---|---|---|
length |
integer |
Počet znaků v obsahu reprezentované rozsahem |
offset |
integer |
Index obsahu reprezentovaný rozsahem založený na nule |
DocumentStyle
Objekt představující pozorované styly textu
Name | Typ | Description |
---|---|---|
backgroundColor |
string |
Barva pozadí v šestnáctkovém formátu #rrggbb. |
color |
string |
Barva popředí v šestnáctkovém formátu #rrggbb. |
confidence |
number |
Spolehlivost správné identifikace stylu |
fontStyle |
Styl písma. |
|
fontWeight |
Váha písma. |
|
isHandwritten |
boolean |
Je obsah ručně psaný? |
similarFontFamily |
string |
Vizuálně nejpodobnější písmo ze sady podporovaných rodin písem s náhradními písmy podle konvence CSS (např. Arial, sans-serif). |
spans |
Umístění textových prvků v zřetězení obsahu, na který se styl vztahuje. |
DocumentTable
Objekt tabulky, který se skládá z buněk tabulky uspořádaných do obdélníkového rozložení
Name | Typ | Description |
---|---|---|
boundingRegions |
Ohraničující oblasti pokrývající tabulku. |
|
caption |
Titulek přidružený k tabulce |
|
cells |
Buňky obsažené v tabulce |
|
columnCount |
integer |
Počet sloupců v tabulce |
footnotes |
Seznam poznámek pod čarou přidružených k tabulce |
|
rowCount |
integer |
Počet řádků v tabulce |
spans |
Umístění tabulky v pořadí čtení zřetězeného obsahu |
DocumentTableCell
Objekt představující umístění a obsah buňky tabulky
Name | Typ | Default value | Description |
---|---|---|---|
boundingRegions |
Ohraničující oblasti pokrývající buňku tabulky. |
||
columnIndex |
integer |
Index sloupce buňky |
|
columnSpan |
integer |
1 |
Počet sloupců rozložených touto buňkou |
content |
string |
Zřetězený obsah buňky tabulky v pořadí čtení |
|
elements |
string[] |
Podřízené prvky buňky tabulky |
|
kind | content |
Druh buňky tabulky |
|
rowIndex |
integer |
Index řádku buňky |
|
rowSpan |
integer |
1 |
Početřádkůch |
spans |
Umístění buňky tabulky v pořadí čtení zřetězeného obsahu |
DocumentTableCellKind
Druh buňky tabulky
Name | Typ | Description |
---|---|---|
columnHeader |
string |
Popisuje obsah sloupce. |
content |
string |
Obsahuje hlavní obsah nebo data. |
description |
string |
Popisuje obsah tabulky (části). |
rowHeader |
string |
Popisuje obsah řádku. |
stubHead |
string |
Popisuje záhlaví řádků, obvykle umístěné v levém horním rohu tabulky. |
DocumentWord
Objekt slova skládající se z souvislé posloupnosti znaků. Pro jazyky, které nejsou oddělené mezerami, jako jsou čínština, japonština a korejština, jsou jednotlivé znaky reprezentovány jako vlastní slovo.
Name | Typ | Description |
---|---|---|
confidence |
number |
Spolehlivost správného extrahování slova |
content |
string |
Textový obsah slova |
polygon |
number[] |
Ohraničení mnohoúhelníku slova se souřadnicemi zadanými vzhledem k levému hornímu rohu stránky Čísla představují hodnoty x, y polygonových vrcholů, ve směru hodinových ručiček zleva (-180 stupňů včetně) vzhledem k orientaci prvku. |
span |
Umístění slova v pořadí čtení zřetězeného obsahu |
LengthUnit
Jednotka používaná vlastnostmi šířky, výšky a mnohoúhelníku. U obrázků je jednotka "pixel". Pro PDF je jednotka "inch".
Name | Typ | Description |
---|---|---|
inch |
string |
Jednotka délky souborů PDF. |
pixel |
string |
Jednotka délky pro soubory obrázků. |
ParagraphRole
Sémantická role odstavce.
Name | Typ | Description |
---|---|---|
footnote |
string |
Poznámka se obvykle umístí za hlavní obsah na stránce. |
formulaBlock |
string |
Blok vzorců, často se sdíleným zarovnáním |
pageFooter |
string |
Text poblíž dolního okraje stránky |
pageHeader |
string |
Text v blízkosti horního okraje stránky |
pageNumber |
string |
Číslo stránky. |
sectionHeading |
string |
Podnadpis popisující část dokumentu |
title |
string |
Nadpis nejvyšší úrovně popisující celý dokument |
StringIndexType
Metoda použitá k výpočtu posunu a délky řetězce
Name | Typ | Description |
---|---|---|
textElements |
string |
Uživatelem vnímaný znak zobrazení nebo cluster grapheme definovaný kódem Unicode 8.0.0. |
unicodeCodePoint |
string |
Znaková jednotka reprezentovaná jedním bodem kódu Unicode. Používá python 3. |
utf16CodeUnit |
string |
Znaková jednotka reprezentovaná 16bitovou jednotkou kódu Unicode Používá se v JavaScriptu, Javě a .NET. |