Compartilhar via


Função ai_extract

Aplica-se a: marca de seleção positiva SQL do Databricks marca de seleção positiva Runtime do Databricks

Importante

Esse recurso está em uma versão prévia.

Na versão preliminar:

  • O modelo de idioma subjacente pode lidar com vários idiomas; no entanto, essas funções são ajustadas para inglês.
  • Há limitação de fluxo para as APIs subjacentes do modelo de base. Confira Limites de APIs do modelo de base para atualizar esses limites.

A função ai_extract() permite que você invoque um modelo de IA generativo de última geração para extrair entidades especificadas por rótulos de um determinado texto usando SQL. Essa função usa um ponto de extremidade de atendimento do modelo de chat disponibilizado pelas APIs de modelo do Databricks Foundation.

Requisitos

Importante

Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença Apache 2.0, Copyright © The Apache Software Foundation ou a Licença da Comunidade LLAMA 3.1 Copyright © Meta Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.

O Databricks recomenda revisar essas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os parâmetros de comparação internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).

Atualmente, Meta-Llama-3.1-70B-Instruct é o modelo subjacente que alimenta essas funções de IA.

Observação

No Databricks Runtime 15.1 e superior, essa função tem suporte nos notebooks do Databricks, incluindo notebooks que são executados como uma tarefa em um fluxo de trabalho do Databricks.

Sintaxe

ai_extract(content, labels)

Argumentos

  • content: uma expressão STRING.
  • labels: um ARRAY<STRING> literal. Cada elemento é um tipo de entidade a ser extraída.

Retornos

Um STRUCT em que cada campo corresponde a um tipo de entidade especificado em labels. Cada campo contém uma cadeia de caracteres que representa a entidade extraída. Se for encontrado mais de um candidato para qualquer tipo de entidade, apenas um será retornado.

Se content for NULL, o resultado é NULL.

Exemplos

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}