Delen via


ai_classify-functie

Van toepassing op:vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime

Belangrijk

Deze functie is beschikbaar als openbare preview.

In de preview:

  • Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
  • Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie Foundation Model API's limieten om deze limieten bij te werken.
  • Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om ai_query en een ingerichte doorvoereindpunt te gebruiken. Zie Voer batch LLM-inferentie uit met behulp van ai_query.

Met ai_classify() de functie kunt u een state-of-the-art AI-model aanroepen om invoertekst te classificeren op basis van labels die u opgeeft met behulp van SQL. Deze functie maakt gebruik van een chatmodel voor eindpunten dat beschikbaar wordt gesteld door Databricks Foundation Model-API's.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.

Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als modellen in de toekomst beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de lijst met toepasselijke licenties op deze pagina) wijzigen.

Momenteel is Meta-Llama-3.1-70B-Instruct het onderliggende model dat deze AI-functies mogelijk maakt.

Notitie

In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.

Syntaxis

ai_classify(content, labels)

Argumenten

  • content: Een STRING expressie, de te classificeren tekst.
  • labels: Een ARRAY<STRING> letterlijke, de verwachte uitvoerclassificatielabels. Moet ten minste 2 elementen bevatten en niet meer dan 20 elementen.

Retouren

A STRING. De waarde komt overeen met een van de tekenreeksen die in het labels argument zijn opgegeven. Retourneert null als de content functie niet kan worden geclassificeerd.

Voorbeelden

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products
  LIMIT 10;