Compartir a través de


ai_extractFunción

Se aplica a: casilla marcada como Sí Databricks SQL casilla marcada como Sí Databricks Runtime

Importante

Esta característica está en versión preliminar pública.

En la versión preliminar:

  • El modelo de lenguaje subyacente puede manejar varios idiomas; sin embargo, estas funciones están ajustadas para el inglés.
  • Hay una limitación de volumen para las API subyacentes de Foundation Model. Consulte límites de las API de Foundation Model para actualizar estos límites.

La función ai_extract() permite invocar un modelo de IA generativo de última generación para extraer entidades especificadas por etiquetas de un texto determinado mediante SQL. Esta función usa un modelo de chat que sirve el punto de conexión que ofrece databricks Foundation Model API.

Requisitos

Importante

Los modelos subyacentes que se pueden usar en este momento tienen licencia bajo la licencia de Apache 2.0, Copyright © The Apache Software Foundation o llama 3.1 Community License © Meta Platforms, Inc. Todos los derechos reservados. Los clientes son responsables de garantizar el cumplimiento de las licencias de modelo aplicables.

Databricks recomienda revisar estas licencias para garantizar el cumplimiento de los términos aplicables. Si los modelos surgen en el futuro que funcionan mejor según las pruebas comparativas internas de Databricks, Databricks podría cambiar el modelo (y la lista de licencias aplicables proporcionadas en esta página).

Actualmente, Meta-Llama-3.1-70B-Instruct es el modelo subyacente que impulsa estas funciones de IA.

Nota:

En Databricks Runtime 15.1 y versiones posteriores, esta función se admite en cuadernos de Databricks, incluidos los cuadernos que se ejecutan como una tarea en un flujo de trabajo de Databricks.

Sintaxis

ai_extract(content, labels)

Argumentos

  • content: expresión STRING.
  • labels: Un ARRAY<STRING> literal. Cada elemento es un tipo de entidad que se va a extraer.

Devoluciones

Un STRUCT donde cada campo corresponde a un tipo de entidad especificado en labels. Cada campo contiene una cadena que representa la entidad extraída. Si se encuentra más de un candidato para cualquier tipo de entidad, solo se devuelve uno.

Si content es NULL, el resultado es NULL.

Ejemplos

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}