Compartir a través de


Introducción a proyectos personalizados en Document Intelligence Studio

Este contenido se aplica a: marca de verificación v4.0 (GA) | Versiones anteriores: marca de verificación azul v3.1 (GA) marca de verificación azul v3.0 (GA)

Estudio del documento de inteligencia es una herramienta en línea para explorar, comprender e integrar visualmente las funciones del servicio de Documento de inteligencia en sus aplicaciones. Este inicio rápido tiene como objetivo proporcionar una guía de configuración de un proyecto personalizado en Document Intelligence Studio.

Requisitos previos para nuevos usuarios

Consulte la siguiente documentación para la creación de recursos y suscripciones, así como la configuración de autenticación.

Requisitos previos adicionales para proyectos personalizados

Además de la cuenta Azure y un recurso de servicios de documento de inteligencia o Azure AI, necesita:

Contenedor de Azure Blob Storage

Una cuenta de Azure Blob Storage con un rendimiento estándar. Creará contenedores para almacenar y organizar los documentos de entrenamiento en la cuenta de almacenamiento. Si no sabe cómo crear una cuenta de almacenamiento de Azure con un contenedor, siga estos inicios rápidos:

  • Crear una cuenta de almacenamiento. Al crear la cuenta de almacenamiento, asegúrese de seleccionar rendimiento Estándar en el campo Detalles de instancia → Rendimiento.
  • Creación de un contenedor. Al crear un contenedor, establezca el campo Nivel de acceso público en Contenedor (acceso anónimo de lectura para contenedores y blobs) en la ventana Nuevo contenedor.

Asignaciones de roles de Azure

En el caso de los proyectos personalizados, se requieren las siguientes asignaciones de roles para distintos escenarios.

  • Basic

    • Usuario de Cognitive Services: Necesita este rol para el recurso de inteligencia de documentos o servicios de Azure AI para entrenar el modelo personalizado o realizar análisis con modelos entrenados.
    • Colaborador de datos de Storage Blob: Necesita este rol para que la cuenta de almacenamiento cree un proyecto y etiquete los datos.
  • Avanzado

    • Colaborador de la cuenta de almacenamiento: necesita este rol para que la cuenta de almacenamiento configure la configuración de CORS (esta acción es un esfuerzo único si se reutiliza la misma cuenta de almacenamiento).
    • colaborador: Necesita este rol para crear un grupo de recursos y recursos.

    Nota:

    Si la autenticación local (basada en claves) está desactivada para la cuenta de recursos de servicio y almacenamiento de Document Intelligence, asegúrese de obtener los roles Usuario de Cognitive Services y Colaborador de datos de almacenamiento de Blob, respectivamente, de modo que disponga de permisos suficientes para usar Document Intelligence Studio. El rol Colaborador de la cuenta de almacenamiento y los roles Colaborador solo le permiten enumerar claves, pero no le concede permiso para usar los recursos cuando se deshabilita el acceso a claves.

Configuración de CORS

CORS (uso compartido de recursos entre orígenes) debe configurarse en la cuenta de almacenamiento de Azure para que sea accesible desde Estudio de documento de inteligencia. Para configurar CORS en Azure Portal, necesita acceso a la pestaña CORS de su cuenta de almacenamiento.

  1. Seleccione la pestaña CORS de la cuenta de almacenamiento.

    Captura de pantalla del menú de configuración de CORS en Azure Portal.

  2. Empiece por crear una nueva entrada de CORS en Blob service.

  3. Establezca Orígenes permitidos en https://documentintelligence.ai.azure.com.

    Captura de pantalla que muestra la configuración de CORS para una cuenta de almacenamiento.

    Sugerencia

    También puede utilizar el carácter comodín (*), en lugar de un dominio específico, para permitir que todos los dominios de origen hagan solicitudes a través de CORS.

  4. Seleccione las ocho opciones disponibles de Métodos permitidos.

  5. Apruebe todos los encabezados permitidos y los encabezados expuestos; para ello, escriba * en cada campo.

  6. Establezca la antigüedad máxima en 120 segundos o cualquier valor aceptable.

  7. Para guardar los cambios, seleccione el botón Guardar situado en la parte superior de la página.

CORS debe configurarse ahora para utilizar la cuenta de almacenamiento desde Estudio de documento de inteligencia.

Conjunto de documentos de ejemplo

  1. Inicie sesión en Azure portal y vaya a Su cuenta de almacenamiento>Almacenamiento de datos>Contenedores.

    Captura de pantalla del menú Almacenamiento de datos en Azure Portal.

  2. Seleccione un contenedor de la lista.

  3. En el menú de la parte superior de la página, seleccione Cargar.

    Captura de pantalla del botón de carga de contenedores en Azure Portal.

  4. Aparece la ventana Cargar blob.

  5. Seleccione los archivos que quiere cargar.

    Captura de pantalla de la ventana Cargar blob en Azure Portal.

Nota:

De manera predeterminada, Studio usará los documentos que se encuentran en la raíz del contenedor. Sin embargo, puede usar datos organizados en carpetas si se especifica la ruta de la carpeta en los pasos de creación del proyecto de formulario personalizado. Consulte Organización de los datos en subcarpetas (opcional).

Uso de la características de Estudio para Documento de inteligencia

Etiquetado automático de documentos con modelos precompilados o uno de sus propios modelos

  • En la página de etiquetado de modelos de extracción personalizados, ahora puede etiquetar automáticamente los documentos con uno de los modelos precompilados del servicio Document Intelligent o con modelos que haya entrenado.

    Captura de pantalla animada que muestra el etiquetado automático en Studio.

  • En algunos documentos, se pueden duplicar las etiquetas después de ejecutar la etiqueta automática. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.

    Captura de pantalla que muestra la advertencia de etiquetas duplicadas tras el etiquetado automático.

Tablas de etiquetas automáticas

  • En la página de etiquetado del modelo de extracción personalizada, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.

    Captura de pantalla animada que muestra el etiquetado automático de tablas en Studio.

Adición de archivos de prueba directamente al conjunto de datos de entrenamiento

  • Una vez que haya entrenado un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo cargando documentos de prueba en el conjunto de datos de entrenamiento si es necesario.

  • Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de etiquetar correctamente el contenido. Si no es así, agréguelos al conjunto de datos de entrenamiento y vuelva a etiquetarlos para mejorar la calidad del modelo.

    Captura de pantalla animada que muestra cómo agregar archivos de prueba al conjunto de datos de entrenamiento.

Usar las opciones y filtros de la lista de documentos en proyectos personalizados

  • Use la página de etiquetado de modelos de extracción personalizados para navegar por sus documentos de entrenamiento con facilidad usando las características de búsqueda, filtrado y ordenación.

  • Utilice la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos más fácilmente.

    Captura de pantalla de las opciones y filtros de la vista de lista de documentos.

Uso compartido de proyectos

Comparta proyectos de extracción personalizados con facilidad. Para obtener más información, vea Uso compartido de proyectos con modelos personalizados.

Pasos siguientes

Comenzar con Estudio de documento de inteligencia.