Извлечение ключевых фраз

Завершено

Извлечение ключевых фраз — это возможность, предлагаемая языком ИИ Azure. Он определяет ключевые фразы или основные понятия в тексте.

Существует несколько способов вызова API извлечения ключевых фраз. Здесь вы используете azure_ai расширение для извлечения ключевых фраз в запросах SQL.

Необходимые компоненты

Вам нужен гибкий сервер База данных Azure для PostgreSQL с включенным и настроенным расширением.azure_ai Кроме того, необходимо авторизовать его с помощью Azure Cognitive Services, задав ключ и конечную точку ресурса языка.

Сценарии

Извлечение ключевых фраз применяется к различным задачам:

  • Сводка. Используйте ключевые фразы для уменьшения длинных документов до основных тем, таких как определение тем, обсуждаемых в аудиокрипциях или заметках на собраниях.
  • Классификация контента: используйте ключевые фразы для индексирования документов для поиска и просмотра. Ключевые фразы также можно использовать для визуализации документов в облаках word.
  • Документ кластеризация: обширные коллекции запросов в службу поддержки, проверки продуктов и другие неструктурированные входные данные можно кластеризировать и анализировать с помощью ключевых фраз.

Использование извлечения ключевых фраз SQL с Помощью Azure Cognitive Services

Расширение azure_ai для гибкого сервера База данных Azure для PostgreSQL предоставляет определяемые пользователем функции (UDFs) для доступа к возможностям искусственного интеллекта из SQL напрямую. Доступ к API извлечения ключевых фраз осуществляется с azure_cognitive.extract_key_phrases помощью функции:

azure_cognitive.extract_key_phrases(
 text TEXT,
 language TEXT,
 timeout_ms INTEGER DEFAULT 3600000,
 throw_on_error BOOLEAN DEFAULT TRUE,
 disable_service_logs BOOLEAN DEFAULT FALSE
)

Обязательные параметры : textвходные данные и languageязык, на котором text записывается запись. Например, en-us это английский и fr французский. Полный список доступных языков см . в поддержке языков.

По умолчанию извлечение ключевых фраз останавливается, если он не завершается в 3600 000 мс, что составляет 1 час. Эту задержку можно настроить, изменив timeout_ms.

Если возникает ошибка, по умолчанию создается исключение, что приводит к откату транзакции. Это поведение можно отключить, установив throw_on_error значение false.

См. документацию по расширению Azure Cognitive Services для полной документации по параметрам.

Например, вызов этого запроса:

SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');

Дает следующий результат:

 extract_key_phrases 
---------------------
 {food,staff}

Столбцы таблицы можно использовать для входного текста:

SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;

Возвращается (с \x расширенным отображением):

description    | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}

Итоги

Извлечение ключевых фраз выбирает основные понятия из текста. Модель языка Azure Cognitive Services отвечает за кипение естественного языка до ключевое слово или фраз. Расширение azure_ai для База данных Azure для PostgreSQL предоставляет azure_cognitive.extract_key_phrases API для доступа к извлечению ключевых фраз непосредственно в запросах SQL.