Compartir vía


Análisis o fragmento de contenido para flujos de trabajo estándar en Azure Logic Apps (versión preliminar)

Se aplica a: Azure Logic Apps (estándar)

Importante

Esta funcionalidad está en versión preliminar y está sujeta a las Condiciones de uso complementarias para las versiones preliminares de Microsoft Azure.

A veces, tiene que convertir contenido en tokens, que son palabras o fragmentos de caracteres, o dividir un documento grande en partes más pequeñas antes de poder usar este contenido con algunas acciones. Por ejemplo, las acciones de Búsqueda de Azure AI o Azure OpenAI esperan entrada con tokenización y solo pueden controlar un número limitado de tokens.

En estos escenarios, use las acciones de Operaciones de datos denominadas Analizar un documento y fragmento de texto en el flujo de trabajo de la aplicación lógica estándar. Estas acciones transforman el contenido, como un documento PDF, un archivo CSV, un archivo Excel, etc., en una salida de cadena con token y, a continuación, dividen la cadena en partes, en función del número de tokens. A continuación, puede hacer referencia a estas salidas y usarlas con acciones posteriores en el flujo de trabajo.

Sugerencia

Para más información, puede hacerle estas preguntas a Azure Copilot:

  • ¿Qué es un token en IA?
  • ¿Qué es la entrada tokenizada?
  • ¿Qué es la salida de cadena tokenizada?
  • ¿Qué es el análisis en IA?
  • ¿Qué es la fragmentación en IA?

Para buscar Azure Copilot, en la barra de herramientas de Azure Portal, seleccione Copilot.

En esta guía paso a paso se muestra cómo agregar y configurar estas operaciones en el flujo de trabajo.

Requisitos previos

  • Una cuenta y una suscripción de Azure. Si no tiene una suscripción de Azure, regístrese para obtener una cuenta gratuita de Azure.

  • Un flujo de trabajo de aplicación lógica estándar con un desencadenador existente porque el Analizar un documento y operaciones de texto fragmento solo están disponibles como acciones. Asegúrese de que la acción que recupera el contenido que desea analizar o fragmentar precede a estas operaciones de datos.

Análisis de un documento

El Analizar un documento acción convierte el contenido, como un documento PDF, un archivo CSV, un archivo de Excel, etc., en una cadena tokenizada. En este ejemplo, supongamos que el flujo de trabajo comienza con el desencadenador Solicitud denominado Cuando se recibe una solicitud HTTP. Este desencadenador espera a recibir una solicitud HTTP enviada desde otro componente, como una función de Azure, otro flujo de trabajo de aplicación lógica, etc. La solicitud HTTP incluye la dirección URL de un nuevo documento cargado que está disponible para que el flujo de trabajo recupere y analice. Una acción de HTTP sigue inmediatamente el desencadenador y envía una solicitud HTTP a la dirección URL del documento y devuelve con el contenido del documento desde su ubicación de almacenamiento.

Si usa otros orígenes de contenido, como Azure Blob Storage, SharePoint, OneDrive, Sistema de archivos, FTP, etc., puede comprobar si los desencadenadores están disponibles para estos orígenes. También puede comprobar si hay acciones disponibles para recuperar el contenido de estos orígenes. Para más información, consulte Operaciones integradasy conectores administrados .

  1. En Azure Portal, abra su recurso de aplicación lógica estándar y el flujo de trabajo en el diseñador.

  2. En el desencadenador y las acciones existentes, siga estos pasos generales para agregar la acciónOperaciones de datos denominada Analizar un documento al flujo de trabajo.

  3. En el diseñador, seleccione la acción Analizar un documento.

  4. Una vez que se abra el panel de información de acción, en la pestaña Parámetros , en la propiedad contenido del documento, especifique el contenido que se va a analizar siguiendo estos pasos:

    1. Seleccione dentro del cuadro Contenido del documento.

      Aparecen las opciones de la lista de contenido dinámico (icono de rayo) y el editor de expresiones (icono de función).

      • Para elegir la salida de una acción anterior, seleccione la lista de contenido dinámico.

      • Para crear una expresión que manipule la salida de una acción anterior, seleccione el editor de expresiones.

      En este ejemplo se continúa seleccionando el icono de rayo de la lista de contenido dinámico.

    2. Una vez que se abra la lista de contenido dinámico, seleccione la salida que desea de una operación anterior.

      En este ejemplo, la acciónAnalizar un documento hace referencia a la salida del Cuerpo de la acción de HTTP.

      Captura de pantalla que muestra el diseñador de flujo de trabajo estándar y la acción denominada Analizar un documento con apertura de la lista de contenido dinámico y la salida Cuerpo seleccionada de la acción HTTP.

      La salida Cuerpo aparece ahora en el cuadro Contenido del Documento:

      Captura de pantalla que muestra el flujo de trabajo de ejemplo con la salida Cuerpo en la acción denominada Analizar un documento.

  5. En la acciónAnalizar un documento, agregue las acciones que desea trabajar con la salida de cadena con token, por ejemplo, Fragmento de texto, que esta guía describe más adelante.

Análisis de un documento: referencia

Parámetros

NOMBRE Valor Tipo de datos Descripción Límite
Contenido de documento <content-to-parse> Any Contenido que se va a analizar. None

Salidas

Nombre Tipo de datos Descripción
Texto del resultado analizado Matriz de cadenas Una matriz de cadenas.
Resultado analizado Object Objeto que contiene todo el texto analizado.

Fragmento de texto

La acción Fragmento de texto divide el contenido en partes más pequeñas para que las acciones posteriores se usen más fácilmente en el flujo de trabajo actual. Los pasos siguientes se basan en el ejemplo de la sección Analizar un documento y divide la salida de la cadena de token para su uso con operaciones de Azure AI que esperan fragmentos de contenido tokenizados y pequeños.

Nota:

Las acciones anteriores que usan la fragmentación no afectan a la acción de Texto de fragmento, ni tampoco afecta a la acción de texto de fragmento afecta a las acciones posteriores que usan la fragmentación.

  1. En Azure Portal, abra su recurso de aplicación lógica estándar y el flujo de trabajo en el diseñador.

  2. En la acción Analizar un documento, siga estos pasos generales para agregar la acción Operaciones de datos denominada Fragmento de texto .

  3. En el diseñador, seleccione la acción Fragmento de texto.

  4. Una vez que se abra el panel de información de acción, en la pestaña Parámetros, para la propiedad estrategia de fragmentación, seleccione TokenSize como método de fragmentación, si aún no está seleccionado.

    Estrategia Descripción
    TokenSize Divida el contenido especificado, en función del número de tokens.
  5. Después de seleccionar la estrategia, seleccione dentro del cuadro Texto para especificar el contenido para la fragmentación.

    Aparecen las opciones de la lista de contenido dinámico (icono de rayo) y el editor de expresiones (icono de función).

    • Para elegir la salida de una acción anterior, seleccione la lista de contenido dinámico.

    • Para crear una expresión que manipule la salida de una acción anterior, seleccione el editor de expresiones.

    En este ejemplo se continúa seleccionando el icono de rayo de la lista de contenido dinámico.

    1. Una vez que se abra la lista de contenido dinámico, seleccione la salida que desea de una operación anterior.

      En este ejemplo, la acción Fragmento de texto hace referencia a la salida de texto del resultado analizado de la acciónAnalizar un documento.

      Captura de pantalla que muestra el diseñador de flujo de trabajo estándar, la acción denominada Fragmento de texto con la lista de contenido dinámico abierta y la salida seleccionada de Analizar una acción de documento.

      La salida Acción de resultado analizadoaparece ahora en el cuadro Texto :

      Captura de pantalla que muestra el flujo de trabajo de ejemplo con la salida de texto del resultado analizado seleccionada en la acción denominada Fragmento de texto.

  6. Complete la configuración de la acción de Fragmento de texto, en función de la estrategia y el escenario seleccionados. Para obtener más información, consulte Fragmento de texto: referencia.

Ahora, al agregar otras acciones que esperan y usan entradas tokenizadas, como las acciones de Azure AI, el contenido de entrada tiene el formato para facilitar el consumo.

Fragmento de texto: referencia

Parámetros

NOMBRE Valor Tipo de datos Descripción Límites
Estrategia de fragmentación TokenSize Enumeración de cadena Divida el contenido en función del número de tokens.

Valor predeterminado: TokenSize
No aplicable
Texto <content-to-chunk> Any Contenido que se va a fragmentar. Consulte Guía de referencia de configuración y límites
EncodingModel <Método de codificación> Enumeración de cadena Modelo de codificación que se va a usar:

- Valor predeterminado: cl100k_base (gpt4, gpt-3.5-turbo, gpt-35-turbo)

- r50k_base (gpt-3)

- p50k_base (gpt-3)

- p50k_edit (gpt-3)

- cl200k_base (gpt-4o)

Para obtener más información, consulte OpenAI - Información general sobre los modelos.
No aplicable
TokenSize <max-tokens-per-chunk> Entero Número máximo de tokens por fragmento de contenido.

Valor predeterminado: ninguno
Mínimo: 1
Máximo: 8000
PageOverlapLength <número de caracteres superpuestos> Entero Número de caracteres del final del fragmento anterior que se va a incluir en el fragmento siguiente. Esta configuración le ayuda a evitar perder información importante al dividir el contenido en fragmentos y conserva la continuidad y el contexto entre fragmentos.

Valor predeterminado: 0: no existen caracteres superpuestos.
Mínimo: 0

Sugerencia

Para más información, puede hacerle estas preguntas a Azure Copilot:

  • ¿Qué es PageOverlapLength en la fragmentación?
  • ¿Qué es la codificación en Azure AI?

Para buscar Azure Copilot, en la barra de herramientas de Azure Portal, seleccione Copilot.

Salidas

Nombre Tipo de datos Descripción
Elementos de texto de resultado fragmentado Matriz de cadenas Una matriz de cadenas.
Elemento de texto de resultado fragmentado Cadena Una sola cadena de la matriz.
Resultado fragmentado Object Objeto que contiene todo el texto fragmentado.

Flujo de trabajo de ejemplo

En el ejemplo siguiente se incluyen otras acciones que crean un patrón de flujo de trabajo completo para ingerir datos de cualquier origen:

Captura de pantalla que muestra un flujo de trabajo de ejemplo completo.

Paso Tarea Operaciones subyacentes Descripción
1 Espere o compruebe si hay contenido nuevo. Cuando se recibe una solicitud HTTP Desencadenador que sondea o espera a que lleguen nuevos datos, ya sea en función de una periodicidad programada o en respuesta a eventos específicos, respectivamente. Este evento puede ser un nuevo archivo que se carga en un sistema de almacenamiento específico, como Azure Blob Storage, SharePoint, OneDrive, Sistema de archivos, FTP, etc.

En este ejemplo, la operación de desencadenador Solicitud espera una solicitud HTTP o HTTPS enviada desde otro punto de conexión. La solicitud incluye la dirección URL de un nuevo documento cargado.
2 Obtenga el contenido. HTTP Acción HTTP que recupera el documento cargado mediante la dirección URL del archivo de la salida del desencadenador.
3 Redactar detalles del documento. Compose Acción Operaciones de datos que concatena varios elementos.

En este ejemplo se concatena información de clave-valor sobre el documento.
4 Cree una cadena de token. Analizar un documento Acción de Operaciones de datos que genera una cadena con token mediante la salida de la acción Redactar.
5 Cree fragmentos de contenido. Fragmento de texto Una acción de Operaciones de datos que divide la cadena de token en partes, en función del número de tokens por fragmento de contenido.
6 Convierta texto con tokens y fragmentado en JSON. Análisis del archivo JSON Una acción Operaciones de datos que convierte la salida fragmentada en una matriz JSON.
7 Seleccione elementos de matriz JSON. Seleccione Acción Operaciones de datos que selecciona varios elementos de la matriz JSON.
8 Genere las incrustaciones. Obtención de varias incrustaciones Una acción de Azure OpenAI que crea incrustaciones para cada elemento de matriz JSON.
9 Seleccione Incrustaciones y otra información. Seleccione Acción Operaciones de datos que selecciona incrustaciones y otra información del documento.
10 Indexe los datos. Indexar documentos Una acción de Búsqueda de Azure AI que indexa los datos en función de cada inserción seleccionada.