Função ai_summarize
Aplica-se a: SQL do Databricks Runtime do Databricks
Importante
Esse recurso está em uma versão prévia.
Na versão preliminar:
- O modelo de idioma subjacente pode lidar com vários idiomas; no entanto, essas funções são ajustadas para inglês.
- Há limitação de fluxo para as APIs subjacentes do modelo de base. Consulte Limites de APIs do modelo de base para atualizar esses limites.
A função ai_summarize()
permite invocar um modelo de IA generativo de última geração para gerar um resumo de um determinado texto usando SQL. Essa função utiliza um ponto final de serviço de modelo de chat disponibilizado pelas APIs Databricks Foundation Model.
Requisitos
Importante
Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença Apache 2.0, Copyright © The Apache Software Foundation ou a Licença da Comunidade LLAMA 3.1 Copyright © Meta Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.
O Databricks recomenda revisar essas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os parâmetros de comparação internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).
Atualmente, Meta-Llama-3.1-70B-Instruct é o modelo subjacente que alimenta essas funções de IA.
- Essa função só está disponível em workspaces em Funções de IA usando regiões compatíveis com APIs do Foundation Model.
- Essa função não está disponível no SQL Clássico do Azure Databricks.
- Confira a página de preços do SQL do Databricks.
Observação
No Databricks Runtime 15.1 e superior, essa função tem suporte nos notebooks do Databricks, incluindo notebooks que são executados como uma tarefa em um fluxo de trabalho do Databricks.
Sintaxe
ai_summarize(content[, max_words])
Argumentos
content
: UmaSTRING
expressão, o texto a ser resumido.max_words
: Uma expressão numérica integral não negativa opcional que representa o número alvo de palavras de melhor esforço no texto de resumo retornado. O valor padrão é 50. Se definido como 0, não há limite de palavras.
Retornos
Um STRING
.
Se content
for NULL
, o resultado é NULL
.
Exemplos
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
)
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."