Document Classifiers - Get Classify Result
Hämtar resultatet av dokumentklassificeraren.
GET {endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-11-30
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
classifier
|
path | True |
string |
Unikt namn på dokumentklassificerare. Reguljärt uttrycksmönster: |
endpoint
|
path | True |
string uri |
Slutpunkten för document intelligence-tjänsten. |
result
|
path | True |
string uuid |
Analysera åtgärdsresultat-ID. |
api-version
|
query | True |
string |
DEN API-version som ska användas för den här åtgärden. |
Svar
Name | Typ | Description |
---|---|---|
200 OK |
Begäran har slutförts. |
|
Other Status Codes |
Ett oväntat felsvar. |
Säkerhet
Ocp-Apim-Subscription-Key
Typ:
apiKey
I:
header
OAuth2Auth
Typ:
oauth2
Flow:
accessCode
Auktoriseringswebbadress:
https://login.microsoftonline.com/common/oauth2/authorize
Token-webbadress:
https://login.microsoftonline.com/common/oauth2/token
Omfattningar
Name | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Exempel
Get Classify Document Result
Exempelbegäran
GET https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/myClassifier/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30
Exempelsvar
{
"status": "succeeded",
"createdDateTime": "2021-09-24T13:00:46Z",
"lastUpdatedDateTime": "2021-09-24T13:00:49Z",
"analyzeResult": {
"apiVersion": "2024-11-30",
"modelId": "myClassifier",
"stringIndexType": "textElements",
"contentFormat": "text",
"content": "",
"pages": [
{
"pageNumber": 1,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 2,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
},
{
"pageNumber": 3,
"width": 8.5,
"height": 11,
"unit": "inch",
"spans": []
}
],
"documents": [
{
"docType": "formA",
"boundingRegions": [
{
"pageNumber": 1,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
},
{
"pageNumber": 2,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
},
{
"docType": "formB",
"boundingRegions": [
{
"pageNumber": 3,
"polygon": [
0,
0,
8.5,
0,
8.5,
11,
0,
11
]
}
],
"confidence": 0.97,
"spans": []
}
]
}
}
Definitioner
Name | Description |
---|---|
Address |
Adressfältvärde. |
Analyzed |
Ett objekt som beskriver platsen och det semantiska innehållet i ett dokument. |
Analyze |
Status och resultat av analysåtgärden. |
Analyze |
Resultat av dokumentanalys. |
Bounding |
Avgränsning av polygon på en specifik sida av indata. |
Currency |
Valutafältvärde. |
Document |
Ett streckkodsobjekt. |
Document |
Streckkodstyp. |
Document |
Ett undertextobjekt som beskriver en tabell eller figur. |
Document |
Format för innehållet i analyserat resultat. |
Document |
Ett objekt som representerar innehållet och platsen för ett fältvärde. |
Document |
Semantisk datatyp för fältvärdet. |
Document |
Ett objekt som representerar en bild i dokumentet. |
Document |
Teckenstil. |
Document |
Teckenvikt. |
Document |
Ett fotnotsobjekt som beskriver en tabell eller figur. |
Document |
Ett formelobjekt. |
Document |
Formeltyp. |
Document |
Felobjektet. |
Document |
Felsvarsobjekt. |
Document |
Ett objekt som innehåller mer specifik information om felet. |
Document |
Åtgärdsstatus. |
Document |
Felobjektet. |
Document |
Ett objekt som representerar fältnyckeln eller värdet i ett nyckel/värde-par. |
Document |
Ett objekt som representerar ett formulärfält med distinkt fältetikett (nyckel) och fältvärde (kan vara tomt). |
Document |
Ett objekt som representerar det identifierade språket för ett visst textintervall. |
Document |
Ett innehållsradsobjekt som består av en intilliggande sekvens med innehållselement, till exempel ord och markeringsmarkeringar. |
Document |
Innehålls- och layoutelement som extraherats från en sida från indata. |
Document |
Ett styckeobjekt som består av sammanhängande linjer, vanligtvis med gemensam justering och avstånd. |
Document |
Ett objekt som representerar ett avsnitt i dokumentet. |
Document |
Ett markeringsmarkeringsobjekt som representerar kryssrutor, alternativknappar och andra element som anger en markering. |
Document |
Markeringsmarkeringens tillstånd. |
Document |
Närvaro av signatur. |
Document |
Sammanhängande region för den sammanfogade innehållsegenskapen, angiven som förskjutning och längd. |
Document |
Ett objekt som representerar observerade textformat. |
Document |
Ett tabellobjekt som består av tabellceller ordnade i en rektangulär layout. |
Document |
Ett objekt som representerar platsen och innehållet i en tabellcell. |
Document |
Tabellcellstyp. |
Document |
Ett ordobjekt som består av en sammanhängande sekvens med tecken. För icke-blankstegsavgränsade språk, till exempel kinesiska, japanska och koreanska, representeras varje tecken som sitt eget ord. |
Length |
Den enhet som används av egenskaperna bredd, höjd och polygon. För bilder är enheten "pixel". För PDF är enheten "tum". |
Paragraph |
Styckets semantiska roll. |
String |
Metod som används för att beräkna strängförskjutning och längd. |
AddressValue
Adressfältvärde.
Name | Typ | Description |
---|---|---|
city |
string |
Namn på stad, stad, by osv. |
cityDistrict |
string |
Distrikt eller stadsdelar inom en stad, till exempel Brooklyn i New York City eller City of Westminster i London. |
countryRegion |
string |
Land/region. |
house |
string |
Byggnamn, till exempel World Trade Center. |
houseNumber |
string |
Hus- eller byggnadsnummer. |
level |
string |
Golvnummer, till exempel 3F. |
poBox |
string |
Postnummer. |
postalCode |
string |
Postnummer som används för e-postsortering. |
road |
string |
Gatunamn. |
state |
string |
Administrativ avdelning på första nivån. |
stateDistrict |
string |
Administrativ avdelning på andra nivån som används i vissa nationella inställningar. |
streetAddress |
string |
Gatuadress, exklusive ort, delstat, landRegion och postnummer. |
suburb |
string |
Inofficiellt kvartersnamn, som Chinatown. |
unit |
string |
Lägenhets- eller kontorsnummer |
AnalyzedDocument
Ett objekt som beskriver platsen och det semantiska innehållet i ett dokument.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker dokumentet. |
|
confidence |
number |
Konfidens för korrekt extraherande av dokumentet. |
docType |
string |
Dokumenttyp. |
fields |
<string,
Document |
Ordlista med namngivna fältvärden. |
spans |
Dokumentets plats i det sammanfogade innehållet i läsordningen. |
AnalyzeOperation
Status och resultat av analysåtgärden.
Name | Typ | Description |
---|---|---|
analyzeResult |
Resultat av dokumentanalys. |
|
createdDateTime |
string |
Datum och tid (UTC) när analysåtgärden skickades. |
error |
Ett fel uppstod under dokumentanalysen. |
|
lastUpdatedDateTime |
string |
Datum och tid (UTC) när statusen senast uppdaterades. |
status |
Åtgärdsstatus. notStarted, running, succeeded eller failed |
AnalyzeResult
Resultat av dokumentanalys.
Name | Typ | Description |
---|---|---|
apiVersion |
string |
API-version som används för att producera det här resultatet. |
content |
string |
Sammanfoga strängrepresentation av alla text- och visuella element i läsordning. |
contentFormat |
Format för analysresultatets innehåll på den översta nivån. |
|
documents |
Extraherade dokument. |
|
figures |
Extraherade siffror. |
|
keyValuePairs |
Extraherade nyckel/värde-par. |
|
languages |
Identifierade språk. |
|
modelId |
string |
Dokumentmodell-ID som används för att skapa det här resultatet. |
pages |
Analyserade sidor. |
|
paragraphs |
Extraherade stycken. |
|
sections |
Extraherade avsnitt. |
|
stringIndexType |
Metod som används för att beräkna strängförskjutning och längd. |
|
styles |
Extraherade teckensnittsformat. |
|
tables |
Extraherade tabeller. |
|
warnings |
Lista över varningar som påträffas. |
BoundingRegion
Avgränsning av polygon på en specifik sida av indata.
Name | Typ | Description |
---|---|---|
pageNumber |
integer |
1-baserat sidnummer för sidan som innehåller avgränsningsregionen. |
polygon |
number[] |
Avgränsning av polygon på sidan eller hela sidan om den inte anges. Koordinater som anges i förhållande till sidans övre vänstra del. Talen representerar x- och y-värdena för polygonhörnerna, medsols från vänster (-180 grader inklusive) i förhållande till elementorienteringen. |
CurrencyValue
Valutafältvärde.
Name | Typ | Description |
---|---|---|
amount |
number |
Valutabelopp. |
currencyCode |
string |
Löst valutakod (ISO 4217), om någon. |
currencySymbol |
string |
Om det finns en valutasymboletikett. |
DocumentBarcode
Ett streckkodsobjekt.
Name | Typ | Description |
---|---|---|
confidence |
number |
Konfidens för korrekt extraktion av streckkoden. |
kind |
Streckkodstyp. |
|
polygon |
number[] |
Streckkodens avgränsningspolygon, med angivna koordinater i förhållande till sidans övre vänstra del. Talen representerar x- och y-värdena för polygonhörnerna, medsols från vänster (-180 grader inklusive) i förhållande till elementorienteringen. |
span |
Plats för streckkoden i läsordningen sammanfogat innehåll. |
|
value |
string |
Streckkodsvärde. |
DocumentBarcodeKind
Streckkodstyp.
Name | Typ | Description |
---|---|---|
Aztec |
string |
Aztec-kod enligt definitionen i ISO/IEC 24778:2008. |
Codabar |
string |
Codabar-streckkod enligt definitionen i ANSI/AIM BC3-1995. |
Code128 |
string |
Kod 128-streckkod enligt definitionen i ISO/IEC 15417:2007. |
Code39 |
string |
Kod 39-streckkod enligt definitionen i ISO/IEC 16388:2007. |
Code93 |
string |
Kod 93-streckkod enligt definitionen i ANSI/AIM BC5-1995. |
DataBar |
string |
GS1 DataBar-streckkod. |
DataBarExpanded |
string |
GS1 DataBar Expanderad streckkod. |
DataMatrix |
string |
Datamatriskod enligt definitionen i ISO/IEC 16022:2006. |
EAN13 |
string |
GS1 13-siffrig internationell artikelnummer (europeiskt artikelnummer). |
EAN8 |
string |
GS1 8-siffrig internationell artikelnummer (europeiskt artikelnummer). |
ITF |
string |
Interfolierad 2 av 5 streckkod enligt definitionen i ANSI/AIM BC2-1995. |
MaxiCode |
string |
MaxiCode, enligt definitionen i ISO/IEC 16023:2000. |
MicroQRCode |
string |
Micro QR-kod, enligt definitionen i ISO/IEC 23941:2022. |
PDF417 |
string |
PDF417, enligt definitionen i ISO 15438. |
QRCode |
string |
QR-kod enligt definitionen i ISO/IEC 18004:2015. |
UPCA |
string |
GS1 12-siffrig universell produktkod. |
UPCE |
string |
GS1 6-siffrig universell produktkod. |
DocumentCaption
Ett undertextobjekt som beskriver en tabell eller figur.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker beskrivningen. |
|
content |
string |
Innehållet i bildtexten. |
elements |
string[] |
Underordnade element i bildtexten. |
spans |
Plats för bildtexten i det sammanfogade innehållet i läsordningen. |
DocumentContentFormat
Format för innehållet i analyserat resultat.
Name | Typ | Description |
---|---|---|
markdown |
string |
Markdown-representation av dokumentinnehållet med avsnittsrubriker, tabeller osv. |
text |
string |
Oformaterad textrepresentation av dokumentinnehållet utan formatering. |
DocumentField
Ett objekt som representerar innehållet och platsen för ett fältvärde.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker fältet. |
|
confidence |
number |
Konfidens för korrekt extrahering av fältet. |
content |
string |
Fältinnehåll. |
spans |
Plats för fältet i det sammanfogade innehållet i läsordningen. |
|
type |
Datatyp för fältvärdet. |
|
valueAddress |
Adressvärde. |
|
valueArray |
Matris med fältvärden. |
|
valueBoolean |
boolean |
Booleskt värde. |
valueCountryRegion |
string |
Landskodsvärde på 3 bokstäver (ISO 3166-1 alpha-3). |
valueCurrency |
Valutavärde. |
|
valueDate |
string |
Datumvärde i ÅÅÅÅ-MM-DD format (ISO 8601). |
valueInteger |
integer |
Heltalsvärde. |
valueNumber |
number |
Flyttalsvärde. |
valueObject |
<string,
Document |
Ordlista med namngivna fältvärden. |
valuePhoneNumber |
string |
Telefonnummervärde i E.164-format (t.ex. +19876543210). |
valueSelectionGroup |
string[] |
Värde för markeringsgrupp. |
valueSelectionMark |
Markeringsmarkeringsvärde. |
|
valueSignature |
Närvaro av signatur. |
|
valueString |
string |
Strängvärde. |
valueTime |
string |
Tidsvärde i formatet hh:mm:ss (ISO 8601). |
DocumentFieldType
Semantisk datatyp för fältvärdet.
Name | Typ | Description |
---|---|---|
address |
string |
Parsad adress. |
array |
string |
Lista över underfält av samma typ. |
boolean |
string |
Booleskt värde, normaliserat till sant eller falskt. |
countryRegion |
string |
Land/region, normaliserat till ISO 3166-1 alfa-3-format (till exempel USA). |
currency |
string |
Valutabelopp med valfri valutasymbol och enhet. |
date |
string |
Datum, normaliserat till FORMATET ISO 8601 (ÅÅÅÅ-MM-DD). |
integer |
string |
Heltalsnummer, normaliserat till 64-bitars signerat heltal. |
number |
string |
Flyttalsnummer, normaliserat till flyttal med dubbel precision. |
object |
string |
Namngiven lista över underfält av potentiellt olika typer. |
phoneNumber |
string |
Telefonnummer, normaliserat till formatet E.164 (+{CountryCode}{SubscriberNumber}). |
selectionGroup |
string |
Matris med markerade strängvärden. |
selectionMark |
string |
Är fältet markerat? |
signature |
string |
Finns signaturen? |
string |
string |
Klartext. |
time |
string |
Tid, normaliserat till ISO 8601-format (hh:mm:ss). |
DocumentFigure
Ett objekt som representerar en bild i dokumentet.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker figuren. |
|
caption |
Bildtext som är associerad med figuren. |
|
elements |
string[] |
Underordnade element i figuren, exklusive bildtexter eller fotnoter. |
footnotes |
Lista över fotnoter som är associerade med figuren. |
|
id |
string |
Bild-ID. |
spans |
Plats för figuren i det sammanfogade innehållet i läsordningen. |
DocumentFontStyle
Teckenstil.
Name | Typ | Description |
---|---|---|
italic |
string |
Tecken lutas visuellt åt höger. |
normal |
string |
Tecken representeras normalt. |
DocumentFontWeight
Teckenvikt.
Name | Typ | Description |
---|---|---|
bold |
string |
Tecken representeras med tjockare linjer. |
normal |
string |
Tecken representeras normalt. |
DocumentFootnote
Ett fotnotsobjekt som beskriver en tabell eller figur.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker fotnoten. |
|
content |
string |
Innehållet i fotnoten. |
elements |
string[] |
Underordnade element i fotnoten. |
spans |
Plats för fotnoten i det sammanfogade innehållet i läsordningen. |
DocumentFormula
Ett formelobjekt.
Name | Typ | Description |
---|---|---|
confidence |
number |
Konfidens för att extrahera formeln korrekt. |
kind |
Formeltyp. |
|
polygon |
number[] |
Avgränsningspolygon för formeln, med angivna koordinater i förhållande till sidans övre vänstra del. Talen representerar x- och y-värdena för polygonhörnerna, medsols från vänster (-180 grader inklusive) i förhållande till elementorienteringen. |
span |
Plats för formeln i det sammanfogade innehållet i läsordningen. |
|
value |
string |
LaTex-uttryck som beskriver formeln. |
DocumentFormulaKind
Formeltyp.
Name | Typ | Description |
---|---|---|
display |
string |
En formel i visningsläge som tar upp en hel rad. |
inline |
string |
En formel som är inbäddad i innehållet i ett stycke. |
DocumentIntelligenceError
Felobjektet.
Name | Typ | Description |
---|---|---|
code |
string |
En av en serverdefinierad uppsättning felkoder. |
details |
En matris med information om specifika fel som ledde till det rapporterade felet. |
|
innererror |
Ett objekt som innehåller mer specifik information än det aktuella objektet om felet. |
|
message |
string |
En mänsklig läsbar representation av felet. |
target |
string |
Målet för felet. |
DocumentIntelligenceErrorResponse
Felsvarsobjekt.
Name | Typ | Description |
---|---|---|
error |
Felinformation. |
DocumentIntelligenceInnerError
Ett objekt som innehåller mer specifik information om felet.
Name | Typ | Description |
---|---|---|
code |
string |
En av en serverdefinierad uppsättning felkoder. |
innererror |
Inre fel. |
|
message |
string |
En mänsklig läsbar representation av felet. |
DocumentIntelligenceOperationStatus
Åtgärdsstatus.
Name | Typ | Description |
---|---|---|
canceled |
string |
Åtgärden har avbrutits. |
failed |
string |
Åtgärden misslyckades. |
notStarted |
string |
Åtgärden har inte startats än. |
running |
string |
Åtgärden pågår. |
skipped |
string |
Åtgärden har hoppats över. |
succeeded |
string |
Åtgärden har slutförts. |
DocumentIntelligenceWarning
Felobjektet.
Name | Typ | Description |
---|---|---|
code |
string |
En av en serverdefinierad uppsättning varningskoder. |
message |
string |
En mänsklig läsbar representation av varningen. |
target |
string |
Målet för felet. |
DocumentKeyValueElement
Ett objekt som representerar fältnyckeln eller värdet i ett nyckel/värde-par.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker nyckel/värde-elementet. |
|
content |
string |
Sammanfogat innehåll i nyckel/värde-elementet i läsordning. |
spans |
Plats för nyckel/värde-elementet i det sammanfogade innehållet i läsordningen. |
DocumentKeyValuePair
Ett objekt som representerar ett formulärfält med distinkt fältetikett (nyckel) och fältvärde (kan vara tomt).
Name | Typ | Description |
---|---|---|
confidence |
number |
Konfidens för korrekt extrahering av nyckel/värde-paret. |
key |
Fältetikett för nyckel/värde-paret. |
|
value |
Fältvärde för nyckel/värde-paret. |
DocumentLanguage
Ett objekt som representerar det identifierade språket för ett visst textintervall.
Name | Typ | Description |
---|---|---|
confidence |
number |
Förtroende för korrekt identifiering av språket. |
locale |
string |
Det identifierade språket. Värdet kan vara en ISO 639-1-språkkod (t.ex. "en", "fr") eller BCP 47-språktagg (t.ex. "zh-Hans"). |
spans |
Plats för textelementen i det sammanfogade innehållet som språket gäller för. |
DocumentLine
Ett innehållsradsobjekt som består av en intilliggande sekvens med innehållselement, till exempel ord och markeringsmarkeringar.
Name | Typ | Description |
---|---|---|
content |
string |
Sammanfogat innehåll i de inneslutna elementen i läsordning. |
polygon |
number[] |
Avgränsning av polygon för linjen, med koordinater som anges i förhållande till sidans övre vänstra del. Talen representerar x- och y-värdena för polygonhörnerna, medsols från vänster (-180 grader inklusive) i förhållande till elementorienteringen. |
spans |
Platsen för raden i det sammanfogade innehållet i läsordningen. |
DocumentPage
Innehålls- och layoutelement som extraherats från en sida från indata.
Name | Typ | Description |
---|---|---|
angle |
number |
Den allmänna orienteringen av innehållet i medsols riktning, mätt i grader mellan (-180, 180]. |
barcodes |
Extraherade streckkoder från sidan. |
|
formulas |
Extraherade formler från sidan. |
|
height |
number |
Bildens/PDF-filens höjd i bildpunkter/tum. |
lines |
Extraherade rader från sidan, som potentiellt innehåller både text- och visuella element. |
|
pageNumber |
integer |
1-baserat sidnummer i indatadokumentet. |
selectionMarks |
Extraherade markeringsmarkeringar från sidan. |
|
spans |
Platsen för sidan i det sammanfogade innehållet i läsordningen. |
|
unit |
Den enhet som används av egenskaperna bredd, höjd och polygon. För bilder är enheten "pixel". För PDF är enheten "tum". |
|
width |
number |
Bredden på bilden/PDF-filen i bildpunkter/tum. |
words |
Extraherade ord från sidan. |
DocumentParagraph
Ett styckeobjekt som består av sammanhängande linjer, vanligtvis med gemensam justering och avstånd.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker stycket. |
|
content |
string |
Sammanfogat innehåll i stycket i läsordning. |
role |
Styckets semantiska roll. |
|
spans |
Plats för stycket i det sammanfogade innehållet i läsordningen. |
DocumentSection
Ett objekt som representerar ett avsnitt i dokumentet.
Name | Typ | Description |
---|---|---|
elements |
string[] |
Underordnade element i avsnittet. |
spans |
Plats för avsnittet i det sammanfogade innehållet i läsordningen. |
DocumentSelectionMark
Ett markeringsmarkeringsobjekt som representerar kryssrutor, alternativknappar och andra element som anger en markering.
Name | Typ | Description |
---|---|---|
confidence |
number |
Konfidens för korrekt extrahering av markeringsmarkeringen. |
polygon |
number[] |
Markeringsmarkeringens avgränsningspolygon, med angivna koordinater i förhållande till sidans övre vänstra del. Talen representerar x- och y-värdena för polygonhörnerna, medsols från vänster (-180 grader inklusive) i förhållande till elementorienteringen. |
span |
Plats för markeringen i det sammanfogade innehållet i läsordningen. |
|
state |
Markeringsmarkeringens tillstånd. |
DocumentSelectionMarkState
Markeringsmarkeringens tillstånd.
Name | Typ | Description |
---|---|---|
selected |
string |
Markeringen markeras, vilket ofta indikeras av en bock √ eller kryss X inuti markeringsmarkeringen. |
unselected |
string |
Markeringen är inte markerad. |
DocumentSignatureType
Närvaro av signatur.
Name | Typ | Description |
---|---|---|
signed |
string |
En signatur har identifierats. |
unsigned |
string |
Inga signaturer har identifierats. |
DocumentSpan
Sammanhängande region för den sammanfogade innehållsegenskapen, angiven som förskjutning och längd.
Name | Typ | Description |
---|---|---|
length |
integer |
Antal tecken i innehållet som representeras av intervallet. |
offset |
integer |
Nollbaserat index för innehållet som representeras av intervallet. |
DocumentStyle
Ett objekt som representerar observerade textformat.
Name | Typ | Description |
---|---|---|
backgroundColor |
string |
Bakgrundsfärg i #rrggbb hexadecimalt format.. |
color |
string |
Förgrundsfärg i #rrggbb hexadecimalt format. |
confidence |
number |
Förtroende för korrekt identifiering av formatmallen. |
fontStyle |
Teckenstil. |
|
fontWeight |
Teckenvikt. |
|
isHandwritten |
boolean |
Skrivs innehållet hand? |
similarFontFamily |
string |
Visuellt mest liknande teckensnitt bland de teckensnittsfamiljer som stöds, med reservteckensnitt som följer CSS-konventionen (t.ex. "Arial, sans-serif"). |
spans |
Plats för textelementen i det sammanfogade innehållet som formatet gäller för. |
DocumentTable
Ett tabellobjekt som består av tabellceller ordnade i en rektangulär layout.
Name | Typ | Description |
---|---|---|
boundingRegions |
Avgränsningsregioner som täcker tabellen. |
|
caption |
Bildtext som är associerad med tabellen. |
|
cells |
Celler som finns i tabellen. |
|
columnCount |
integer |
Antal kolumner i tabellen. |
footnotes |
Lista över fotnoter som är associerade med tabellen. |
|
rowCount |
integer |
Antal rader i tabellen. |
spans |
Plats för tabellen i det sammanfogade innehållet i läsordningen. |
DocumentTableCell
Ett objekt som representerar platsen och innehållet i en tabellcell.
Name | Typ | Standardvärde | Description |
---|---|---|---|
boundingRegions |
Avgränsningsregioner som täcker tabellcellen. |
||
columnIndex |
integer |
Cellens kolumnindex. |
|
columnSpan |
integer |
1 |
Antal kolumner som sträcker sig över cellen. |
content |
string |
Sammanfogat innehåll i tabellcellen i läsordning. |
|
elements |
string[] |
Underordnade element i tabellcellen. |
|
kind | content |
Tabellcellstyp. |
|
rowIndex |
integer |
Cellens radindex. |
|
rowSpan |
integer |
1 |
Antal rader som sträcker sig över den här cellen. |
spans |
Plats för tabellcellen i det sammanfogade innehållet i läsordningen. |
DocumentTableCellKind
Tabellcellstyp.
Name | Typ | Description |
---|---|---|
columnHeader |
string |
Beskriver innehållet i kolumnen. |
content |
string |
Innehåller huvudinnehållet/data. |
description |
string |
Beskriver innehållet i (delar av) tabellen. |
rowHeader |
string |
Beskriver innehållet i raden. |
stubHead |
string |
Beskriver radrubrikerna, som vanligtvis finns i det övre vänstra hörnet i en tabell. |
DocumentWord
Ett ordobjekt som består av en sammanhängande sekvens med tecken. För icke-blankstegsavgränsade språk, till exempel kinesiska, japanska och koreanska, representeras varje tecken som sitt eget ord.
Name | Typ | Description |
---|---|---|
confidence |
number |
Förtroende för att extrahera ordet korrekt. |
content |
string |
Textinnehåll i ordet. |
polygon |
number[] |
Avgränsar polygon av ordet, med koordinater angivna i förhållande till sidans övre vänstra del. Talen representerar x- och y-värdena för polygonhörnerna, medsols från vänster (-180 grader inklusive) i förhållande till elementorienteringen. |
span |
Platsen för ordet i läsordningen sammanfogat innehåll. |
LengthUnit
Den enhet som används av egenskaperna bredd, höjd och polygon. För bilder är enheten "pixel". För PDF är enheten "tum".
Name | Typ | Description |
---|---|---|
inch |
string |
Längdenhet för PDF-filer. |
pixel |
string |
Längdenhet för bildfiler. |
ParagraphRole
Styckets semantiska roll.
Name | Typ | Description |
---|---|---|
footnote |
string |
En anteckning placeras vanligtvis efter huvudinnehållet på en sida. |
formulaBlock |
string |
Ett block med formler, ofta med delad justering. |
pageFooter |
string |
Text nära sidans nederkant. |
pageHeader |
string |
Text nära sidans övre kant. |
pageNumber |
string |
Sidnummer. |
sectionHeading |
string |
Underrubrik som beskriver ett avsnitt i dokumentet. |
title |
string |
Rubrik på toppnivå som beskriver hela dokumentet. |
StringIndexType
Metod som används för att beräkna strängförskjutning och längd.
Name | Typ | Description |
---|---|---|
textElements |
string |
Användarupplevt visningstecken, eller grapheme-kluster, som definieras av Unicode 8.0.0. |
unicodeCodePoint |
string |
Teckenenhet som representeras av en enda unicode-kodpunkt. Används av Python 3. |
utf16CodeUnit |
string |
Teckenenhet som representeras av en 16-bitars Unicode-kodenhet. Används av JavaScript, Java och .NET. |