Partilhar via


Função ai_extract

Aplica-se a: Marque Sim Databricks SQL Marque Sim Databricks Runtime

Importante

Esta funcionalidade está em Pré-visualização Pública.

Na pré-visualização:

  • O modelo de linguagem subjacente pode lidar com vários idiomas, no entanto, essas funções são ajustadas para o inglês.
  • Há limite de taxa para as APIs subjacentes do Modelo de Base. Consulte Limites das APIs do Modelo de Base para atualizar esses limites.

A ai_extract() função permite que você invoque um modelo de IA generativa de última geração para extrair entidades especificadas por rótulos de um determinado texto usando SQL. Essa função usa um modelo de chat que serve o ponto de extremidade disponibilizado pelas APIs do Databricks Foundation Model.

Requisitos

Importante

Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License Copyright Meta © Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.

A Databricks recomenda a revisão dessas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os benchmarks internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).

Atualmente, o Meta-Llama-3.1-70B-Instruct é o modelo subjacente que alimenta essas funções de IA.

  • Esta função só está disponível em espaços de trabalho em AI Functions usando regiões suportadas por APIs do Foundation Model.
  • Esta função não está disponível no Azure Databricks SQL Classic.
  • Verifique a página de preços do Databricks SQL.

Nota

No Databricks Runtime 15.1 e superior, essa função é suportada em blocos de anotações Databricks, incluindo blocos de anotações que são executados como uma tarefa em um fluxo de trabalho Databricks.

Sintaxe

ai_extract(content, labels)

Argumentos

  • content: Uma STRING expressão.
  • labels: Um ARRAY<STRING> literal. Cada elemento é um tipo de entidade a ser extraída.

Devoluções

A STRUCT onde cada campo corresponde a um tipo de entidade especificado em labels. Cada campo contém uma cadeia de caracteres que representa a entidade extraída. Se mais de um candidato para qualquer tipo de entidade for encontrado, apenas um será retornado.

Se content for NULL, o resultado é NULL.

Exemplos

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}