Aptitud de Diseño de documento

Artículo
11/23/2024

Nota:

Esta característica actualmente está en su versión preliminar pública. Esta versión preliminar se ofrece sin contrato de nivel de servicio y no es aconsejable usarla para cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

La aptitud Diseño de documento analiza un documento para extraer regiones de interés y sus relaciones inter-relaciones para generar una representación sintáctica del documento en formato Markdown. Esta aptitud usa el modelo de diseño de Document Intelligence proporcionado en Inteligencia de documentos de Azure AI.

Este artículo es la documentación de referencia de la aptitud Diseño de documento. Para obtener información de uso, consulte Fragmentación y vectorización compatibles con la estructura.

La aptitud Diseño de documento llama a la versión preliminar pública de Document Intelligence 2024-07-31-preview. Actualmente solo está disponible en las siguientes regiones de Azure:

Este de EE. UU.
Oeste de EE. UU. 2
Oeste de Europa
Centro-Norte de EE. UU

Entre otros, estos son los formatos de archivos admitidos:

PDF.
.JPEG
.JPG
.PNG
.BMP
.TIFF
.DOCX
.XLSX
.PPTX
HTML.

Nota:

Esta aptitud está enlazada a los servicios de Azure AI y necesita un recurso facturable para las transacciones que superan los 20 documentos por indexador al día. La ejecución de aptitudes integradas se carga al actual precio de pago por uso de los servicios de Azure AI.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Límites de datos

Para PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratis, solo se procesan las dos primeras páginas).
Incluso si el tamaño de archivo para analizar documentos es de 500 MB para el nivel de Azure AI Document Intelligence de pago (S0) y 4 MB para el nivel gratis (F0) de Inteligencia de documentos de Azure AI, la indexación está sujeta a los límites del indexador del nivel de servicio de búsqueda.
Las dimensiones de imagen deben estar entre 50 x 50 píxeles o 10 000 píxeles x 10 000 píxeles.
Si los archivos PDF están bloqueados con contraseña, quite el bloqueo antes de ejecutar el indexador.

Idiomas compatibles

Consulte los idiomas admitidos del modelo de diseño de Azure AI Document Intelligence para el texto impreso.

Limitaciones

Durante la versión preliminar pública, esta aptitud tiene las restricciones siguientes:

La aptitud no puede extraer imágenes insertadas en documentos.
Los números de página no se incluyen en la salida generada.
La aptitud no es adecuada para documentos de gran tamaño que requieren más de 5 minutos de procesamiento en el modelo de diseño de Inteligencia de documentos de IA. La aptitud agotará el tiempo de espera, pero los cargos se seguirán aplicando al recurso de varios servicios de AI Services si está asociado al conjunto de aptitudes con fines de facturación. Asegúrese de que los documentos están optimizados para mantenerse dentro de los límites de procesamiento para evitar costos innecesarios.

Parámetros de la aptitud

Los parámetros distinguen mayúsculas de minúsculas.

Nombre del parámetro	Valores permitidos	Descripción
`outputMode`	`oneToMany`	Controla la cardinalidad de la salida generada por la aptitud.
`markdownHeaderDepth`	`h1`, `h2`, `h3`, `h4`, , `h5`, `h6(default)`	Este parámetro describe el nivel de anidamiento más profundo que se debe tener en cuenta. Por ejemplo, si markdownHeaderDepth se indica como "h3" cualquier sección de Markdown que sea más profunda que h3 (es decir, #### y más profunda) se considera "contenido" que debe agregarse al nivel en el que esté su elemento primario.

Entradas de la aptitud

Nombre de entrada	Descripción
`file_data`	Archivo del que se debe extraer el contenido.

La entrada "file_data" debe ser un objeto definido así:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Como alternativa, se puede definir como:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

El objeto de referencia de archivo se puede generar de una de las maneras siguientes:

Establezca el parámetro en la allowSkillsetToReadFileData definición del indexador en true. Esta configuración crea una ruta de acceso /document/file_data que representa los datos de archivo originales descargados del origen de datos del blob. Este parámetro solo se aplica a los archivos de Azure Blob Storage.
Tener una aptitud personalizada que devuelva un objeto JSON definido que proporcione $type, datao url y sastoken. El $type parámetro debe establecerse fileen y data debe ser la matriz de bytes codificada en base 64 del contenido del archivo. El url parámetro debe ser una dirección URL válida con acceso para descargar el archivo en esa ubicación.

Salidas de la aptitud

Nombre de salida	Descripción
`markdown_document`	Colección de objetos "secciones", que representan cada sección individual del documento markdown.

Definición de ejemplo

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Salida de ejemplo

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

El valor de controla markdownHeaderDepth el número de claves del diccionario de "secciones". En la definición de aptitud de ejemplo, dado markdownHeaderDepth que es "h3", hay tres claves en el diccionario "sections": h1, h2, h3.

Compartir vía