Extrakce klíčových frází
Extrakce klíčových frází je funkce nabízená jazykem Azure AI. V textu identifikuje klíčové fráze nebo hlavní koncepty.
Existuje několik způsobů, jak volat rozhraní API pro extrakci klíčových frází. V této části azure_ai
použijete rozšíření k extrakci klíčových frází v dotazech SQL.
Požadavky
Potřebujete flexibilní server Azure Database for PostgreSQL s povoleným azure_ai
a nakonfigurovaným rozšířením. Musíte ho také autorizovat ve službě Azure Cognitive Services nastavením klíče a koncového bodu prostředku jazyka.
Scénáře
Extrakce klíčových frází se vztahuje na různé úkoly:
- Shrnutí: Pomocí klíčových frází můžete zkrátit dlouhé dokumenty na základní témata, jako je identifikace témat probíraných v přepisech zvuku nebo poznámkách ze schůzky.
- Kategorizace obsahu: Pomocí klíčových frází indexujte dokumenty pro vyhledávání a procházení. Klíčové fráze se dají použít také k vizualizaci dokumentů ve wordových cloudech.
- Clustering dokumentů: Rozsáhlé kolekce lístků podpory, recenzí produktů a dalších nestrukturovaných vstupů je možné seskupit a analyzovat pomocí klíčových frází.
Použití extrakce klíčových frází SQL se službou Azure Cognitive Services
Rozšíření azure_ai pro flexibilní server Azure Database for PostgreSQL poskytuje uživatelem definované funkce (UDF) pro přímý přístup k funkcím AI z SQL. K rozhraní API pro extrakci klíčových frází se přistupuje pomocí azure_cognitive.extract_key_phrases
funkce:
azure_cognitive.extract_key_phrases(
text TEXT,
language TEXT,
timeout_ms INTEGER DEFAULT 3600000,
throw_on_error BOOLEAN DEFAULT TRUE,
disable_service_logs BOOLEAN DEFAULT FALSE
)
Požadované parametry jsou text
, vstup a language
jazyk, ve kterém text
je zapsán. Například en-us
angličtina v USA a fr
francouzština. Úplný seznam dostupných jazyků najdete v podpoře jazyků.
Ve výchozím nastavení se extrakce klíčových frází zastaví, pokud nedokončí 3 600 000 ms, což je 1 hodina. Toto zpoždění můžete přizpůsobit změnou timeout_ms
.
Pokud dojde k chybě, výchozí chování je vyvolání výjimky, což vede k vrácení transakce zpět. Toto chování můžete zakázat nastavením throw_on_error
na false.
Kompletní dokumentaci k parametrům najdete v dokumentaci k rozšíření Azure Cognitive Services.
Například vyvolání tohoto dotazu:
SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');
Vrátí tento výsledek:
extract_key_phrases
---------------------
{food,staff}
Pro vstupní text můžete použít sloupce tabulky:
SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;
Která vrátí hodnotu (s \x
zapnutou pro rozšířený displej):
description | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}
Shrnutí
Extrakce klíčových frází vybere hlavní koncepty textu. Jazykový model Azure Cognitive Services zodpovídá za vaření přirozeného jazyka do klíčových slov nebo frází. Rozšíření azure_ai
pro Azure Database for PostgreSQL poskytuje azure_cognitive.extract_key_phrases
rozhraní API pro přístup k extrakci klíčových frází přímo v rámci dotazů SQL.