Функция ai_extract
Область применения: Databricks SQL Databricks Runtime
Внимание
Эта функция предоставляется в режиме общедоступной предварительной версии.
В предварительной версии:
- Базовая языковая модель может обрабатывать несколько языков, однако эти функции настраиваются для английского языка.
- Существует ограничение скорости для базовых API-интерфейсов модели Foundation. Ознакомьтесь
с этих ограничений. - Из-за ограничения скорости эта функция предназначена для тестирования на небольших наборах данных, которые имеют менее 100 строк. Для вариантов использования с более чем 100 строками данных Databricks рекомендует использовать
ai_query
и подготовленную конечную точку пропускной способности. См. раздел Пакетный вывод LLM с помощью ai_query.
Эта ai_extract()
функция позволяет вызывать модель создания искусственного интеллекта для извлечения сущностей, указанных метками из заданного текста с помощью SQL. Эта функция использует конечную точку обслуживания чата , доступную API модели Databricks Foundation.
Требования
Внимание
Базовые модели, которые могут использоваться в настоящее время, лицензируются в соответствии с лицензией Apache 2.0, © Apache Software Foundation или LLAMA 3.1 Community License Meta © Platform, Inc. Все права защищены. Клиенты отвечают за обеспечение соответствия применимым лицензиям модели.
Databricks рекомендует просматривать эти лицензии, чтобы обеспечить соответствие любым применимым условиям. Если в будущем появятся модели, которые показывают лучшие результаты согласно внутренним эталонам Databricks, Databricks может изменить модель (и list применимых лицензий, указанных на этой странице).
В настоящее время Meta-Llama-3.1-70B-Instruct является базовой моделью, которая управляет этими функциями ИИ.
- Эта функция доступна только в рабочих областях в функциях ИИ с помощью поддерживаемых регионов API модели Foundation.
- Эта функция недоступна в Классической версии SQL Azure Databricks.
- Проверьте страницу цен на Databricks SQL.
Примечание.
В Databricks Runtime 15.1 и более поздних версиях эта функция поддерживается в записных книжках Databricks, включая записные книжки, которые выполняются как задача в рабочем процессе Databricks.
Синтаксис
ai_extract(content, labels)
Аргументы
-
content
: ВыражениеSTRING
. -
labels
: литералARRAY<STRING>
. Каждый элемент — это тип извлекаемой сущности.
Возвраты
STRUCT
where каждое поле соответствует типу сущности, указанному в labels
. Каждое поле содержит строку, представляющую извлеченную сущность. Если найдено несколько кандидатов для любого типа сущности, возвращается только один.
Если content
равно NULL
, то результат – NULL
.
Примеры
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}