Análisis o fragmento de contenido para flujos de trabajo estándar en Azure Logic Apps (versión preliminar)
Se aplica a: Azure Logic Apps (estándar)
Importante
Esta funcionalidad está en versión preliminar y está sujeta a las Condiciones de uso complementarias para las versiones preliminares de Microsoft Azure.
A veces, tiene que convertir contenido en tokens, que son palabras o fragmentos de caracteres, o dividir un documento grande en partes más pequeñas antes de poder usar este contenido con algunas acciones. Por ejemplo, las acciones de Búsqueda de Azure AI o Azure OpenAI esperan entrada con tokenización y solo pueden controlar un número limitado de tokens.
En estos escenarios, use las acciones de Operaciones de datos denominadas Analizar un documento y fragmento de texto en el flujo de trabajo de la aplicación lógica estándar. Estas acciones transforman el contenido, como un documento PDF, un archivo CSV, un archivo Excel, etc., en una salida de cadena con token y, a continuación, dividen la cadena en partes, en función del número de tokens. A continuación, puede hacer referencia a estas salidas y usarlas con acciones posteriores en el flujo de trabajo.
Sugerencia
Para más información, puede hacerle estas preguntas a Azure Copilot:
- ¿Qué es un token en IA?
- ¿Qué es la entrada tokenizada?
- ¿Qué es la salida de cadena tokenizada?
- ¿Qué es el análisis en IA?
- ¿Qué es la fragmentación en IA?
Para buscar Azure Copilot, en la barra de herramientas de Azure Portal, seleccione Copilot.
En esta guía paso a paso se muestra cómo agregar y configurar estas operaciones en el flujo de trabajo.
Requisitos previos
Una cuenta y una suscripción de Azure. Si no tiene una suscripción de Azure, regístrese para obtener una cuenta gratuita de Azure.
Un flujo de trabajo de aplicación lógica estándar con un desencadenador existente porque el Analizar un documento y operaciones de texto fragmento solo están disponibles como acciones. Asegúrese de que la acción que recupera el contenido que desea analizar o fragmentar precede a estas operaciones de datos.
Análisis de un documento
El Analizar un documento acción convierte el contenido, como un documento PDF, un archivo CSV, un archivo de Excel, etc., en una cadena tokenizada. En este ejemplo, supongamos que el flujo de trabajo comienza con el desencadenador Solicitud denominado Cuando se recibe una solicitud HTTP. Este desencadenador espera a recibir una solicitud HTTP enviada desde otro componente, como una función de Azure, otro flujo de trabajo de aplicación lógica, etc. La solicitud HTTP incluye la dirección URL de un nuevo documento cargado que está disponible para que el flujo de trabajo recupere y analice. Una acción de HTTP sigue inmediatamente el desencadenador y envía una solicitud HTTP a la dirección URL del documento y devuelve con el contenido del documento desde su ubicación de almacenamiento.
Si usa otros orígenes de contenido, como Azure Blob Storage, SharePoint, OneDrive, Sistema de archivos, FTP, etc., puede comprobar si los desencadenadores están disponibles para estos orígenes. También puede comprobar si hay acciones disponibles para recuperar el contenido de estos orígenes. Para más información, consulte Operaciones integradasy conectores administrados .
En Azure Portal, abra su recurso de aplicación lógica estándar y el flujo de trabajo en el diseñador.
En el desencadenador y las acciones existentes, siga estos pasos generales para agregar la acciónOperaciones de datos denominada Analizar un documento al flujo de trabajo.
En el diseñador, seleccione la acción Analizar un documento.
Una vez que se abra el panel de información de acción, en la pestaña Parámetros , en la propiedad contenido del documento, especifique el contenido que se va a analizar siguiendo estos pasos:
Seleccione dentro del cuadro Contenido del documento.
Aparecen las opciones de la lista de contenido dinámico (icono de rayo) y el editor de expresiones (icono de función).
Para elegir la salida de una acción anterior, seleccione la lista de contenido dinámico.
Para crear una expresión que manipule la salida de una acción anterior, seleccione el editor de expresiones.
En este ejemplo se continúa seleccionando el icono de rayo de la lista de contenido dinámico.
Una vez que se abra la lista de contenido dinámico, seleccione la salida que desea de una operación anterior.
En este ejemplo, la acciónAnalizar un documento hace referencia a la salida del Cuerpo de la acción de HTTP.
La salida Cuerpo aparece ahora en el cuadro Contenido del Documento:
En la acciónAnalizar un documento, agregue las acciones que desea trabajar con la salida de cadena con token, por ejemplo, Fragmento de texto, que esta guía describe más adelante.
Análisis de un documento: referencia
Parámetros
NOMBRE | Valor | Tipo de datos | Descripción | Límite |
---|---|---|---|---|
Contenido de documento | <content-to-parse> | Any | Contenido que se va a analizar. | None |
Salidas
Nombre | Tipo de datos | Descripción |
---|---|---|
Texto del resultado analizado | Matriz de cadenas | Una matriz de cadenas. |
Resultado analizado | Object | Objeto que contiene todo el texto analizado. |
Fragmento de texto
La acción Fragmento de texto divide el contenido en partes más pequeñas para que las acciones posteriores se usen más fácilmente en el flujo de trabajo actual. Los pasos siguientes se basan en el ejemplo de la sección Analizar un documento y divide la salida de la cadena de token para su uso con operaciones de Azure AI que esperan fragmentos de contenido tokenizados y pequeños.
Nota:
Las acciones anteriores que usan la fragmentación no afectan a la acción de Texto de fragmento, ni tampoco afecta a la acción de texto de fragmento afecta a las acciones posteriores que usan la fragmentación.
En Azure Portal, abra su recurso de aplicación lógica estándar y el flujo de trabajo en el diseñador.
En la acción Analizar un documento, siga estos pasos generales para agregar la acción Operaciones de datos denominada Fragmento de texto .
En el diseñador, seleccione la acción Fragmento de texto.
Una vez que se abra el panel de información de acción, en la pestaña Parámetros, para la propiedad estrategia de fragmentación, seleccione TokenSize como método de fragmentación, si aún no está seleccionado.
Estrategia Descripción TokenSize Divida el contenido especificado, en función del número de tokens. Después de seleccionar la estrategia, seleccione dentro del cuadro Texto para especificar el contenido para la fragmentación.
Aparecen las opciones de la lista de contenido dinámico (icono de rayo) y el editor de expresiones (icono de función).
Para elegir la salida de una acción anterior, seleccione la lista de contenido dinámico.
Para crear una expresión que manipule la salida de una acción anterior, seleccione el editor de expresiones.
En este ejemplo se continúa seleccionando el icono de rayo de la lista de contenido dinámico.
Una vez que se abra la lista de contenido dinámico, seleccione la salida que desea de una operación anterior.
En este ejemplo, la acción Fragmento de texto hace referencia a la salida de texto del resultado analizado de la acciónAnalizar un documento.
La salida Acción de resultado analizadoaparece ahora en el cuadro Texto :
Complete la configuración de la acción de Fragmento de texto, en función de la estrategia y el escenario seleccionados. Para obtener más información, consulte Fragmento de texto: referencia.
Ahora, al agregar otras acciones que esperan y usan entradas tokenizadas, como las acciones de Azure AI, el contenido de entrada tiene el formato para facilitar el consumo.
Fragmento de texto: referencia
Parámetros
NOMBRE | Valor | Tipo de datos | Descripción | Límites |
---|---|---|---|---|
Estrategia de fragmentación | TokenSize | Enumeración de cadena | Divida el contenido en función del número de tokens. Valor predeterminado: TokenSize |
No aplicable |
Texto | <content-to-chunk> | Any | Contenido que se va a fragmentar. | Consulte Guía de referencia de configuración y límites |
EncodingModel | <Método de codificación> | Enumeración de cadena | Modelo de codificación que se va a usar: - Valor predeterminado: cl100k_base (gpt4, gpt-3.5-turbo, gpt-35-turbo) - r50k_base (gpt-3) - p50k_base (gpt-3) - p50k_edit (gpt-3) - cl200k_base (gpt-4o) Para obtener más información, consulte OpenAI - Información general sobre los modelos. |
No aplicable |
TokenSize | <max-tokens-per-chunk> | Entero | Número máximo de tokens por fragmento de contenido. Valor predeterminado: ninguno |
Mínimo: 1 Máximo: 8000 |
PageOverlapLength | <número de caracteres superpuestos> | Entero | Número de caracteres del final del fragmento anterior que se va a incluir en el fragmento siguiente. Esta configuración le ayuda a evitar perder información importante al dividir el contenido en fragmentos y conserva la continuidad y el contexto entre fragmentos. Valor predeterminado: 0: no existen caracteres superpuestos. |
Mínimo: 0 |
Sugerencia
Para más información, puede hacerle estas preguntas a Azure Copilot:
- ¿Qué es PageOverlapLength en la fragmentación?
- ¿Qué es la codificación en Azure AI?
Para buscar Azure Copilot, en la barra de herramientas de Azure Portal, seleccione Copilot.
Salidas
Nombre | Tipo de datos | Descripción |
---|---|---|
Elementos de texto de resultado fragmentado | Matriz de cadenas | Una matriz de cadenas. |
Elemento de texto de resultado fragmentado | Cadena | Una sola cadena de la matriz. |
Resultado fragmentado | Object | Objeto que contiene todo el texto fragmentado. |
Flujo de trabajo de ejemplo
En el ejemplo siguiente se incluyen otras acciones que crean un patrón de flujo de trabajo completo para ingerir datos de cualquier origen:
Paso | Tarea | Operaciones subyacentes | Descripción |
---|---|---|---|
1 | Espere o compruebe si hay contenido nuevo. | Cuando se recibe una solicitud HTTP | Desencadenador que sondea o espera a que lleguen nuevos datos, ya sea en función de una periodicidad programada o en respuesta a eventos específicos, respectivamente. Este evento puede ser un nuevo archivo que se carga en un sistema de almacenamiento específico, como Azure Blob Storage, SharePoint, OneDrive, Sistema de archivos, FTP, etc. En este ejemplo, la operación de desencadenador Solicitud espera una solicitud HTTP o HTTPS enviada desde otro punto de conexión. La solicitud incluye la dirección URL de un nuevo documento cargado. |
2 | Obtenga el contenido. | HTTP | Acción HTTP que recupera el documento cargado mediante la dirección URL del archivo de la salida del desencadenador. |
3 | Redactar detalles del documento. | Compose | Acción Operaciones de datos que concatena varios elementos. En este ejemplo se concatena información de clave-valor sobre el documento. |
4 | Cree una cadena de token. | Analizar un documento | Acción de Operaciones de datos que genera una cadena con token mediante la salida de la acción Redactar. |
5 | Cree fragmentos de contenido. | Fragmento de texto | Una acción de Operaciones de datos que divide la cadena de token en partes, en función del número de tokens por fragmento de contenido. |
6 | Convierta texto con tokens y fragmentado en JSON. | Análisis del archivo JSON | Una acción Operaciones de datos que convierte la salida fragmentada en una matriz JSON. |
7 | Seleccione elementos de matriz JSON. | Seleccione | Acción Operaciones de datos que selecciona varios elementos de la matriz JSON. |
8 | Genere las incrustaciones. | Obtención de varias incrustaciones | Una acción de Azure OpenAI que crea incrustaciones para cada elemento de matriz JSON. |
9 | Seleccione Incrustaciones y otra información. | Seleccione | Acción Operaciones de datos que selecciona incrustaciones y otra información del documento. |
10 | Indexe los datos. | Indexar documentos | Una acción de Búsqueda de Azure AI que indexa los datos en función de cada inserción seleccionada. |