Document Models - Analyze Batch Documents
Analiza documentos por lotes con el modelo de documento.
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyzeBatch?api-version=2024-07-31-preview
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyzeBatch?api-version=2024-07-31-preview&pages={pages}&locale={locale}&stringIndexType={stringIndexType}&features={features}&queryFields={queryFields}&outputContentFormat={outputContentFormat}&output={output}
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string uri |
Punto de conexión del servicio De inteligencia de documentos. |
model
|
path | True |
string |
Nombre único del modelo de documento. Patrón de Regex: |
api-version
|
query | True |
string |
Versión de la API que se va a usar para esta operación. |
features
|
query |
Lista de características de análisis opcionales. |
||
locale
|
query |
string |
Sugerencia de configuración regional para el reconocimiento de texto y el análisis de documentos. El valor solo puede contener el código de idioma (por ejemplo, "en", "fr") o la etiqueta de idioma BCP 47 (por ejemplo, "en-US"). |
|
output
|
query |
Salidas adicionales que se van a generar durante el análisis. |
||
output
|
query |
Formato del contenido de nivel superior de análisis de resultados. |
||
pages
|
query |
string |
Lista de números de página basados en 1 que se van a analizar. Ex. "1-3,5,7-9" Patrón de Regex: |
|
query
|
query |
string[] |
Lista de campos adicionales que se van a extraer. Ex. "NumberOfGuests,StoreNumber" |
|
string
|
query |
Método usado para calcular el desplazamiento y la longitud de la cadena. |
Cuerpo de la solicitud
Nombre | Requerido | Tipo | Description |
---|---|---|---|
resultContainerUrl | True |
string |
Dirección URL del contenedor de Azure Blob Storage donde se almacenarán los archivos de resultados de análisis. |
azureBlobFileListSource |
Lista de archivos de Azure Blob Storage que especifica los documentos por lotes. Se debe especificar azureBlobSource o azureBlobFileListSource. |
||
azureBlobSource |
Ubicación de Azure Blob Storage que contiene los documentos por lotes. Se debe especificar azureBlobSource o azureBlobFileListSource. |
||
overwriteExisting |
boolean |
¿Sobrescribir los archivos de resultados de análisis existentes? |
|
resultPrefix |
string |
Prefijo de nombre de blob de los archivos de resultados. |
Respuestas
Nombre | Tipo | Description |
---|---|---|
202 Accepted |
La solicitud se ha aceptado para su procesamiento, pero el procesamiento aún no se ha completado. Encabezados
|
|
Other Status Codes |
Una respuesta de error inesperada. |
Seguridad
Ocp-Apim-Subscription-Key
Tipo:
apiKey
En:
header
OAuth2Auth
Tipo:
oauth2
Flujo:
accessCode
Dirección URL de autorización:
https://login.microsoftonline.com/common/oauth2/authorize
Dirección URL del token:
https://login.microsoftonline.com/common/oauth2/token
Ámbitos
Nombre | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Ejemplos
Analyze Batch Documents
Solicitud de ejemplo
POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel:analyzeBatch?api-version=2024-07-31-preview&pages=1-5&locale=en-US&stringIndexType=textElements
{
"azureBlobSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
"prefix": "trainingDocs/"
},
"resultContainerUrl": "https://myStorageAccount.blob.core.windows.net/myOutputContainer?mySasToken",
"resultPrefix": "trainingDocsResult/",
"overwriteExisting": true
}
Respuesta de muestra
Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel/analyzeBatchResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-02-29-preview
Definiciones
Nombre | Description |
---|---|
Analyze |
Parámetros de análisis de documentos por lotes. |
Analyze |
Salidas adicionales que se van a generar durante el análisis. |
Azure |
Contenido de Azure Blob Storage. |
Azure |
Lista de archivos en Azure Blob Storage. |
Content |
Formato del contenido en el resultado analizado. |
Document |
Características de análisis de documentos que se van a habilitar. |
Error |
Objeto de error. |
Error |
Objeto de respuesta de error. |
Inner |
Objeto que contiene información más específica sobre el error. |
String |
Método usado para calcular el desplazamiento y la longitud de la cadena. |
AnalyzeBatchDocumentsRequest
Parámetros de análisis de documentos por lotes.
Nombre | Tipo | Valor predeterminado | Description |
---|---|---|---|
azureBlobFileListSource |
Lista de archivos de Azure Blob Storage que especifica los documentos por lotes. Se debe especificar azureBlobSource o azureBlobFileListSource. |
||
azureBlobSource |
Ubicación de Azure Blob Storage que contiene los documentos por lotes. Se debe especificar azureBlobSource o azureBlobFileListSource. |
||
overwriteExisting |
boolean |
False |
¿Sobrescribir los archivos de resultados de análisis existentes? |
resultContainerUrl |
string |
Dirección URL del contenedor de Azure Blob Storage donde se almacenarán los archivos de resultados de análisis. |
|
resultPrefix |
string |
Prefijo de nombre de blob de los archivos de resultados. |
AnalyzeOutputOption
Salidas adicionales que se van a generar durante el análisis.
Nombre | Tipo | Description |
---|---|---|
figures |
string |
Genere imágenes recortadas de figuras detectadas. |
string |
Generar una salida PDF en la que se puede buscar. |
AzureBlobContentSource
Contenido de Azure Blob Storage.
Nombre | Tipo | Description |
---|---|---|
containerUrl |
string |
Dirección URL del contenedor de Azure Blob Storage. |
prefix |
string |
Prefijo de nombre de blob. |
AzureBlobFileListContentSource
Lista de archivos en Azure Blob Storage.
Nombre | Tipo | Description |
---|---|---|
containerUrl |
string |
Dirección URL del contenedor de Azure Blob Storage. |
fileList |
string |
Ruta de acceso a un archivo JSONL dentro del contenedor que especifica un subconjunto de documentos. |
ContentFormat
Formato del contenido en el resultado analizado.
Nombre | Tipo | Description |
---|---|---|
markdown |
string |
Representación de Markdown del contenido del documento con encabezados de sección, tablas etcetera. |
text |
string |
Representación de texto sin formato del contenido del documento sin formato. |
DocumentAnalysisFeature
Características de análisis de documentos que se van a habilitar.
Nombre | Tipo | Description |
---|---|---|
barcodes |
string |
Habilite la detección de códigos de barras en el documento. |
formulas |
string |
Habilite la detección de expresiones matemáticas en el documento. |
keyValuePairs |
string |
Habilite la detección de pares de valores de clave general (campos de formulario) en el documento. |
languages |
string |
Habilite la detección del idioma de contenido de texto. |
ocrHighResolution |
string |
Realice OCR en una resolución más alta para controlar documentos con impresión fina. |
queryFields |
string |
Habilite la extracción de campos adicionales a través del parámetro de consulta QueryFields. |
styleFont |
string |
Habilite el reconocimiento de varios estilos de fuente. |
Error
Objeto de error.
Nombre | Tipo | Description |
---|---|---|
code |
string |
Uno de un conjunto definido por el servidor de códigos de error. |
details |
Error[] |
Matriz de detalles sobre errores específicos que llevaron a este error notificado. |
innererror |
Objeto que contiene información más específica que el objeto actual sobre el error. |
|
message |
string |
Representación legible del error. |
target |
string |
Destino del error. |
ErrorResponse
Objeto de respuesta de error.
Nombre | Tipo | Description |
---|---|---|
error |
Información de error. |
InnerError
Objeto que contiene información más específica sobre el error.
Nombre | Tipo | Description |
---|---|---|
code |
string |
Uno de un conjunto definido por el servidor de códigos de error. |
innererror |
Error interno. |
|
message |
string |
Representación legible del error. |
StringIndexType
Método usado para calcular el desplazamiento y la longitud de la cadena.
Nombre | Tipo | Description |
---|---|---|
textElements |
string |
Carácter de visualización percibido por el usuario o clúster de grafos, tal como se define en Unicode 8.0.0. |
unicodeCodePoint |
string |
Unidad de caracteres representada por un único punto de código unicode. Usado por Python 3. |
utf16CodeUnit |
string |
Unidad de caracteres representada por una unidad de código Unicode de 16 bits. Se usa en JavaScript, Java y .NET. |