Extrair frases-chave
A extração de frase-chave é uma capacidade oferecida pela Linguagem de IA do Azure. Ela identifica as frases-chave ou os principais conceitos no texto.
Há várias maneiras de chamar a API de extração de frase-chave. Aqui, você usa a extensão azure_ai
para extrair frases-chave em consultas SQL.
Pré-requisitos
Você precisará de um servidor flexível do Banco de Dados do Azure para PostgreSQL, com a extensão azure_ai
habilitada e configurada. Você também precisará autorizá-lo com os Serviços Cognitivos do Azure definindo a chave e o ponto de extremidade de um recurso de linguagem.
Cenários
A extração de frase-chave se aplica a várias tarefas:
- Sumarização: Use frases-chave para reduzir documentos longos a tópicos principais, como identificar tópicos discutidos em transcrições de áudio ou anotações de reunião.
- Categorização de conteúdo: Use frases-chave para indexar documentos para pesquisa e navegação. Frases-chave também podem ser usadas para visualizar documentos em nuvens de palavras.
- Clustering de documentos: Coleções extensas de tíquetes de suporte, revisões de produto e outras entradas não estruturadas podem ser agrupadas e analisadas usando frases-chave.
Usando o SQL de extração de frase-chave com os Serviços Cognitivos do Azure
A extensão azure_ai para o servidor flexível do Banco de Dados do Azure para PostgreSQL fornece UDFs (funções definidas pelo usuário), para acessar recursos de IA diretamente no SQL. A API de extração de frase-chave é acessada com a função azure_cognitive.extract_key_phrases
:
azure_cognitive.extract_key_phrases(
text TEXT,
language TEXT,
timeout_ms INTEGER DEFAULT 3600000,
throw_on_error BOOLEAN DEFAULT TRUE,
disable_service_logs BOOLEAN DEFAULT FALSE
)
Os parâmetros necessários são text
, a entrada e language
, a linguagem na qual o text
texto é gravado. Por exemplo, en-us
é inglês dos EUA e fr
é francês. Consulte o suporte a idiomas para obter a lista completa de idiomas disponíveis.
Por padrão, a extração de frase-chave será interrompida se ela não terminar em 3.600.000 ms, que é igual a uma hora. Personalize esse atraso alterando timeout_ms
.
Se ocorrer um erro, o comportamento padrão será gerar uma exceção, resultando em uma reversão de transação. Desabilite esse comportamento definindo throw_on_error
como false.
Consulte a documentação de extensão dos Serviços Cognitivos do Azure, para obter a documentação completa do parâmetro.
Por exemplo, invocando esta consulta:
SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');
Fornece este resultado:
extract_key_phrases
---------------------
{food,staff}
Use colunas de tabela para o texto de entrada:
SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;
Que retorna (com \x
ativado para exibição estendida):
description | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}
Resumo
A extração de frase-chave seleciona os principais conceitos do texto. O modelo de linguagem dos Serviços Cognitivos do Azure é responsável pela síntese da linguagem natural em palavras-chave ou frases. A extensão azure_ai
do Banco de Dados do Azure para PostgreSQL fornece a API azure_cognitive.extract_key_phrases
, para acessar a extração de frases-chave diretamente em consultas SQL.