Delen via


ai_summarize-functie

Van toepassing op:vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime

Belangrijk

Deze functie is beschikbaar als openbare preview.

In de preview:

  • Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
  • Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie Foundation Model API's limieten om deze limieten bij te werken.
  • Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om ai_query en een ingerichte doorvoereindpunt te gebruiken. Zie Voer batch LLM-afleiding uit met behulp van ai_query.

Met de functie ai_summarize() kunt u een state-of-the-art AI-model aanroepen om een samenvatting van een bepaalde tekst te genereren met behulp van SQL. Deze functie maakt gebruik van een chatmodel voor eindpunten dat beschikbaar wordt gesteld door Databricks Foundation Model-API's.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.

Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als modellen in de toekomst beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de lijst met toepasselijke licenties op deze pagina) wijzigen.

Momenteel is Meta-Llama-3.1-70B-Instruct het onderliggende model dat deze AI-functies mogelijk maakt.

Notitie

In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.

Syntaxis

ai_summarize(content[, max_words])

Argumenten

  • content: Een STRING expressie, de tekst die moet worden samengevat.
  • max_words: Een optionele niet-negatieve integrale numerieke expressie die het best effort-doelaantal woorden in de geretourneerde samenvattingstekst vertegenwoordigt. De standaardwaarde is 50. Als deze optie is ingesteld op 0, is er geen woordlimiet.

Retouren

A STRING.

Als content dat het is NULL, is NULLhet resultaat .

Voorbeelden

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."