Wyodrębnianie kluczowych fraz
Wyodrębnianie kluczowych fraz to funkcja oferowana przez język azure AI. Identyfikuje kluczowe frazy lub główne pojęcia w tekście.
Istnieje kilka sposobów wywoływania interfejsu API wyodrębniania kluczowych fraz. W tym miejscu użyjesz azure_ai
rozszerzenia , aby wyodrębnić kluczowe frazy w zapytaniach SQL.
Wymagania wstępne
Potrzebujesz serwera elastycznego usługi Azure Database for PostgreSQL z włączonym i skonfigurowanym azure_ai
rozszerzeniem. Należy również autoryzować ją za pomocą usług Azure Cognitive Services, ustawiając klucz i punkt końcowy zasobu języka.
Scenariusze
Wyodrębnianie kluczowych fraz dotyczy różnych zadań:
- Podsumowanie: użyj kluczowych fraz, aby zmniejszyć długie dokumenty do podstawowych tematów, takich jak identyfikowanie tematów omówionych w transkrypcjach audio lub notatkach ze spotkania.
- Kategoryzacja zawartości: użyj kluczowych fraz do indeksowania dokumentów na potrzeby wyszukiwania i przeglądania. Frazy kluczowe mogą być również używane do wizualizowania dokumentów w chmurach słów.
- Klastrowanie dokumentów: obszerne kolekcje biletów pomocy technicznej, przeglądów produktów i innych danych wejściowych bez struktury można klasterować i analizować przy użyciu kluczowych fraz.
Używanie wyodrębniania kluczowych fraz SQL z usługami Azure Cognitive Services
Rozszerzenie azure_ai dla elastycznego serwera usługi Azure Database for PostgreSQL zapewnia funkcje zdefiniowane przez użytkownika (UDF) umożliwiające bezpośredni dostęp do funkcji sztucznej inteligencji z poziomu programu SQL. Interfejs API wyodrębniania kluczowych fraz jest dostępny za pomocą azure_cognitive.extract_key_phrases
funkcji :
azure_cognitive.extract_key_phrases(
text TEXT,
language TEXT,
timeout_ms INTEGER DEFAULT 3600000,
throw_on_error BOOLEAN DEFAULT TRUE,
disable_service_logs BOOLEAN DEFAULT FALSE
)
Wymagane parametry to text
, dane wejściowe i language
, język, w którym jest zapisywany text
. Na przykład en-us
jest to angielski USA i fr
francuski. Zobacz Obsługa języków, aby uzyskać pełną listę dostępnych języków.
Domyślnie wyodrębnianie kluczowych fraz jest zatrzymywane, jeśli nie kończy się w 3600 000 ms, czyli 1 godzinę. To opóźnienie można dostosować, zmieniając zmienną timeout_ms
.
Jeśli wystąpi błąd, domyślnym zachowaniem jest zgłoszenie wyjątku, co spowoduje wycofanie transakcji. To zachowanie można wyłączyć, ustawiając wartość throw_on_error
false.
Aby uzyskać pełną dokumentację parametrów, zobacz dokumentację rozszerzenia usług Azure Cognitive Services.
Na przykład wywołanie tego zapytania:
SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');
Daje ten wynik:
extract_key_phrases
---------------------
{food,staff}
Możesz użyć kolumn tabeli dla tekstu wejściowego:
SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;
Które zwraca wartość (w \x
przypadku wyświetlania rozszerzonego):
description | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}
Podsumowanie
Wyodrębnianie kluczowych fraz wybiera główne pojęcia z tekstu. Model językowy usług Azure Cognitive Services jest odpowiedzialny za wrzanie języka naturalnego do słów kluczowych lub fraz. azure_ai
Rozszerzenie usługi Azure Database for PostgreSQL udostępnia azure_cognitive.extract_key_phrases
interfejs API umożliwiający uzyskiwanie dostępu do wyodrębniania kluczowych fraz bezpośrednio w zapytaniach SQL.