Document Models - Analyze Document
Analyserar dokument med dokumentmodell.
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyze?_overload=analyzeDocument&api-version=2024-11-30
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyze?_overload=analyzeDocument&api-version=2024-11-30&pages={pages}&locale={locale}&stringIndexType={stringIndexType}&features={features}&queryFields={queryFields}&outputContentFormat={outputContentFormat}&output={output}
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string uri |
Slutpunkten för document intelligence-tjänsten. |
model
|
path | True |
string |
Unikt dokumentmodellnamn. Reguljärt uttrycksmönster: |
api-version
|
query | True |
string |
DEN API-version som ska användas för den här åtgärden. |
features
|
query |
Lista över valfria analysfunktioner. |
||
locale
|
query |
string |
Språktips för textigenkänning och dokumentanalys. Värdet får endast innehålla språkkoden (t.ex. "en", "fr") eller BCP 47-språktagg (t.ex. "en-US"). |
|
output
|
query |
Ytterligare utdata som ska genereras under analysen. |
||
output
|
query |
Format för analysresultatets innehåll på den översta nivån. |
||
pages
|
query |
string |
1-baserade sidnummer att analysera. Ex. "1-3,5,7-9" Reguljärt uttrycksmönster: |
|
query
|
query |
string[] |
Lista över ytterligare fält som ska extraheras. Ex. "NumberOfGuests,StoreNumber" |
|
string
|
query |
Metod som används för att beräkna strängförskjutning och längd. |
Begärandetext
Name | Typ | Description |
---|---|---|
base64Source |
string |
Base64-kodning av dokumentet som ska analyseras. Antingen urlSource eller base64Source måste anges. |
urlSource |
string |
Dokument-URL som ska analyseras. Antingen urlSource eller base64Source måste anges. |
Svar
Name | Typ | Description |
---|---|---|
202 Accepted |
Begäran har godkänts för bearbetning, men bearbetningen har ännu inte slutförts. Sidhuvuden
|
|
Other Status Codes |
Ett oväntat felsvar. |
Säkerhet
Ocp-Apim-Subscription-Key
Typ:
apiKey
I:
header
OAuth2Auth
Typ:
oauth2
Flow:
accessCode
Auktoriseringswebbadress:
https://login.microsoftonline.com/common/oauth2/authorize
Token-webbadress:
https://login.microsoftonline.com/common/oauth2/token
Omfattningar
Name | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Exempel
Analyze Document from Base64 |
Analyze Document from Url |
Analyze Document from Base64
Exempelbegäran
POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?_overload=analyzeDocument&api-version=2024-11-30&pages=1-2,4&locale=en-US&stringIndexType=textElements
{
"base64Source": "e2Jhc2U2NEVuY29kZWRQZGZ9"
}
Exempelsvar
Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30
Analyze Document from Url
Exempelbegäran
POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel:analyze?_overload=analyzeDocument&api-version=2024-11-30&pages=1-2,4&locale=en-US&stringIndexType=textElements
{
"urlSource": "http://host.com/doc.pdf"
}
Exempelsvar
Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel/analyzeResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-11-30
Definitioner
Name | Description |
---|---|
Analyze |
Parametrar för dokumentanalys. |
Analyze |
Ytterligare utdata som ska genereras under analysen. |
Document |
Funktioner för dokumentanalys som ska aktiveras. |
Document |
Format för innehållet i analyserat resultat. |
Document |
Felobjektet. |
Document |
Felsvarsobjekt. |
Document |
Ett objekt som innehåller mer specifik information om felet. |
String |
Metod som används för att beräkna strängförskjutning och längd. |
AnalyzeDocumentRequest
Parametrar för dokumentanalys.
Name | Typ | Description |
---|---|---|
base64Source |
string |
Base64-kodning av dokumentet som ska analyseras. Antingen urlSource eller base64Source måste anges. |
urlSource |
string |
Dokument-URL som ska analyseras. Antingen urlSource eller base64Source måste anges. |
AnalyzeOutputOption
Ytterligare utdata som ska genereras under analysen.
Name | Typ | Description |
---|---|---|
figures |
string |
Generera beskurna bilder av identifierade figurer. |
string |
Generera sökbara PDF-utdata. |
DocumentAnalysisFeature
Funktioner för dokumentanalys som ska aktiveras.
Name | Typ | Description |
---|---|---|
barcodes |
string |
Aktivera identifiering av streckkoder i dokumentet. |
formulas |
string |
Aktivera identifiering av matematiska uttryck i dokumentet. |
keyValuePairs |
string |
Aktivera identifiering av allmänna nyckelvärdepar (formulärfält) i dokumentet. |
languages |
string |
Aktivera identifiering av textinnehållsspråket. |
ocrHighResolution |
string |
Utför OCR med högre upplösning för att hantera dokument med finstilt. |
queryFields |
string |
Aktivera extrahering av ytterligare fält via frågeparametern queryFields. |
styleFont |
string |
Aktivera igenkänning av olika teckensnittsformat. |
DocumentContentFormat
Format för innehållet i analyserat resultat.
Name | Typ | Description |
---|---|---|
markdown |
string |
Markdown-representation av dokumentinnehållet med avsnittsrubriker, tabeller osv. |
text |
string |
Oformaterad textrepresentation av dokumentinnehållet utan formatering. |
DocumentIntelligenceError
Felobjektet.
Name | Typ | Description |
---|---|---|
code |
string |
En av en serverdefinierad uppsättning felkoder. |
details |
En matris med information om specifika fel som ledde till det rapporterade felet. |
|
innererror |
Ett objekt som innehåller mer specifik information än det aktuella objektet om felet. |
|
message |
string |
En mänsklig läsbar representation av felet. |
target |
string |
Målet för felet. |
DocumentIntelligenceErrorResponse
Felsvarsobjekt.
Name | Typ | Description |
---|---|---|
error |
Felinformation. |
DocumentIntelligenceInnerError
Ett objekt som innehåller mer specifik information om felet.
Name | Typ | Description |
---|---|---|
code |
string |
En av en serverdefinierad uppsättning felkoder. |
innererror |
Inre fel. |
|
message |
string |
En mänsklig läsbar representation av felet. |
StringIndexType
Metod som används för att beräkna strängförskjutning och längd.
Name | Typ | Description |
---|---|---|
textElements |
string |
Användarupplevt visningstecken, eller grapheme-kluster, som definieras av Unicode 8.0.0. |
unicodeCodePoint |
string |
Teckenenhet som representeras av en enda unicode-kodpunkt. Används av Python 3. |
utf16CodeUnit |
string |
Teckenenhet som representeras av en 16-bitars Unicode-kodenhet. Används av JavaScript, Java och .NET. |