Explicación del resumen mediante extracción
El resumen mediante extracción produce un resumen extrayendo las frases esenciales directamente del texto original. En lugar de generar texto nuevo, usa técnicas de procesamiento de lenguaje natural para localizar las oraciones que transmiten colectivamente la idea o el contexto primario de un documento.
El resumen mediante extracción se realiza usando la función summarize_extractive()
que se encuentra en el esquema azure_cognitive
de la extensión azure_ai
. El esquema azure_cognitive
contiene tres sobrecargas de la función summarize_extractive()
. La lista de argumentos que esperan las tres sobrecargas de función son:
Argument | Tipo | Valor predeterminado | Descripción |
---|---|---|---|
text | text o text[] |
Texto para el que se deben generar resúmenes. | |
language_text | text o text[] |
Código de idioma (o matriz de códigos de idioma) que representa el idioma del texto que se va a resumir. Revise la lista de idiomas admitidos para recuperar los códigos de idioma necesarios. | |
sentence_count | integer |
3 | Número de oraciones de resumen que se van a generar. |
sort_by | text |
'offset' | Criterio de ordenación de las oraciones de resumen generadas. Los valores aceptables son "offset " y "rank", siendo "offset" la posición inicial de cada frase extraída dentro del contenido original y "rank" un indicador generado por la IA de la relevancia de una frase para la idea principal del contenido. |
batch_size | integer |
25 | Solo para las dos sobrecargas que esperan una entrada de text[] . Especifica el número de registros que se van a procesar a la vez. |
disable_service_logs | boolean |
false | Marca que indica si se van a desactivar los registros de servicio. |
timeout_ms | integer |
NULL | Tiempo de espera en milisegundos después del cual se detiene la operación. |
throw_on_error | boolean |
true | Marca que indica si la función debe (en caso de error) producir una excepción, lo que da lugar a una reversión de la transacción de ajuste. |
max_attempts | integer |
1 | Número de veces que se reintenta la llamada a Servicios de Azure AI en caso de error. |
retry_delay_ms | integer |
1000 | Cantidad de tiempo, en milisegundos, que se debe esperar antes de intentar volver a llamar al punto de conexión de Servicios de Azure AI. |
Cada función devuelve una matriz de frases extraídas y una puntuación de clasificación para cada una, usando el tipo compuesto azure_cognitive.sentence
, como se muestra en la tabla siguiente:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
azure_cognitive.sentence
es un tipo compuesto que contiene el texto de una frase de extracción y una puntuación de clasificación para cada frase. La puntuación de clasificación, un valor entre 0 y 1 (inclusivo), indica la importancia de una frase para la idea principal del documento original. El resumen de documentos clasifica las frases extraídas, y usted puede determinar si se devuelven en el orden en que aparecen o según su clasificación usando el parámetro sort_by
de la función.
Generación de resúmenes mediante extracción para descripciones de propiedades
Como desarrollador de Margie's Travel, quiere evaluar la técnica de resumen mediante extracción accesible a través de la extensión azure_ai
y los servicios de Azure AI y evaluar la capacidad del método para generar resúmenes concisos en lenguaje natural de descripciones de propiedades extensas, como esta descripción del primer registro de la base de datos:
"Siéntase en casa en este encantador apartamento de un dormitorio, situado en el lado oeste de Queen Anne Hill. Este apartamento privado elegantemente decorado (unidad inferior de un dúplex) cuenta con planta abierta, suelos de bambú, cocina totalmente equipada, TV, reproductor de DVD, cable básico y un dormitorio acogedor con cama tamaño queen. La unidad alberga hasta cuatro personas (dos en el dormitorio y dos en el cómodo sofá plegable, ropa de cama incluida) e incluye conexión Wi-Fi gratuita y lavandería. El apartamento tiene una terraza privada, con su propia barbacoa, con vistas a un jardín y un bosque de bambú negro. El apartamento está perfectamente ubicado a solo una cuadra de las líneas de autobús donde se puede coger un autobús y estar en el centro de Seattle en 15 minutos o el histórico Ballard en 10 minutos. Un rápido paseo de cinco minutos le lleva a una tienda natural de comestibles y cafeterías. O bien, a solo quince minutos a pie de la cima de Queen Anne Hill, donde se encuentran varias tiendas eclécticas, bares y restaurantes".
Se solicita un resumen de dos oraciones de la descripción de la propiedad anterior mediante la siguiente consulta:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
El resumen mediante extracción devuelve las dos frases con mayor puntuación del texto original, junto con la puntuación de clasificación de cada una:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}