Explicar a sumarização extrativa

Concluído

A sumarização extrativa produz um resumo extraindo frases essenciais diretamente do texto original. Em vez de gerar um novo texto, ele usa técnicas de processamento de linguagem natural para localizar as frases que transmitem coletivamente a ideia ou contexto principal de um documento.

A sumarização extrativa é realizada usando a função summarize_extractive() encontrada no esquema azure_cognitive da extensão azure_ai. O esquema azure_cognitive contém três sobrecargas da função summarize_extractive(). A lista de argumentos que as três sobrecargas de função esperam incluem:

Argumento Tipo Padrão Descrição
text text ou text[] Os textos para os quais os resumos devem ser gerados.
language_text text ou text[] Código de idioma (ou matriz de códigos de idioma) que representa o idioma do texto a ser resumido. Revise a lista de idiomas com suporte para obter os códigos de idioma necessários.
sentence_count integer 3 O número de frases resumidas a serem geradas.
sort_by text “deslocamento” A ordem de classificação para as frases resumidas geradas. Os valores aceitáveis são “deslocamento” e “classificação”, com deslocamento representando a posição inicial de cada frase extraída dentro do conteúdo original e classificação sendo um indicador gerado por IA do grau de relevância de uma frase é para a ideia principal do conteúdo.
batch_size integer 25 Somente para as duas sobrecargas que esperam uma entrada de text[]. Especifica o número de registros a serem processados por vez.
disable_service_logs boolean false Sinalizador que indica se os logs de serviço devem ser desativados.
timeout_ms integer NULO Tempo limite em milissegundos após o qual a operação é interrompida.
throw_on_error boolean true Sinalizador que indica se a função deve, em caso de erro, gerar uma exceção que resulte em uma reversão das transações de encapsulamento.
max_attempts integer 1 Número de novas tentativas de chamar os Serviços de IA do Azure em caso de falha.
retry_delay_ms integer 1000 Tempo, em milissegundos, para aguardar antes de tentar chamar novamente o ponto de extremidade dos Serviços de IA do Azure.

Cada função retorna uma matriz de frases extraídas e uma pontuação de classificação para cada uma, usando o tipo composto azure_cognitive.sentence, conforme mostrado na tabela abaixo:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

O azure_cognitive.sentence é um tipo composto que contém o texto de uma frase extraída e uma pontuação de classificação para cada frase. A pontuação de classificação, um valor entre 0 e 1 (inclusive), indica o grau de relevância de uma frase para a ideia principal do documento original. A sumarização de documentos classifica as frases extraídas, e você pode determinar se elas serão retornadas na ordem em que aparecem ou de acordo com sua classificação usando o parâmetro sort_by da função.

Gerar sumarizações extrativas para descrições de propriedade

Como desenvolvedor da Margie's Travel, você quer avaliar a técnica de sumarização extrativa acessível por meio da extensão azure_ai e dos Serviços de IA do Azure, bem como avaliar a capacidade do método de gerar resumos concisos em linguagem natural de descrições longas de propriedades, como esta descrição da primeira listagem no banco de dados:

“Sinta-se em casa nesse charmoso apartamento de um quarto, com localização central no lado oeste da Queen Anne Hill. Esse apartamento privativo elegantemente decorado (unidade inferior de um duplex) tem uma planta baixa aberta, pisos de bambu, uma cozinha totalmente equipada, TV, DVD Player, cabo básico e um quarto aconchegante com uma cama queen. A unidade acomoda até quatro pessoas (duas no quarto e duas no confortável sofá dobrável, com roupa de cama incluída) e inclui Wi-Fi gratuito e lavanderia. O apartamento se abre para um deck privativo, completo com sua própria churrasqueira, com vista para um jardim e uma floresta de bambu negro. O apartamento está perfeitamente localizado a apenas uma quadra das linhas de ônibus, onde você pode pegar um ônibus e chegar ao centro de Seattle em 15 minutos ou à histórica Ballard em 10 minutos. Uma rápida caminhada de cinco minutos levará você a uma mercearia natural e a cafeterias. Ou simplesmente faça uma caminhada de 15 minutos até o topo da Queen Anne Hill, onde você encontrará várias lojas, bares e restaurantes ecléticos.”

Solicite um resumo de duas frases da descrição da propriedade acima usando a seguinte consulta:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

A sumarização extrativa retorna as duas frases com maior pontuação do texto original, juntamente com a pontuação de classificação de cada:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}