Sdílet prostřednictvím


Funkce ai_classify

Platí pro:zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview.

Ve verzi Preview:

  • Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
  • Pro základní rozhraní API základního modelu existuje omezení rychlosti. Podívejte se na omezení rozhraní API základního modelu od do týkající se těchto limitů update.
  • Kvůli omezování rychlosti je tato funkce určená pro testování malých datových sad, které mají méně než 100 řádků. Pro případy použití s více než 100 řádky dat doporučuje Databricks používat ai_query a koncový bod zřízené propustnosti. Viz Provedení dávkového zpracování pomocí LLM dotazu ai_query.

Tato ai_classify() funkce umožňuje vyvolat nejmodernější model generující umělé inteligence ke klasifikaci vstupního textu podle popisků, které zadáte pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.

Požadavky

Důležité

Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence Apache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za zajištění dodržování předpisů s příslušnými licencemi modelu.

Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se v budoucnu objeví modely, které fungují lépe podle interních referenčních testů společnosti Databricks, Databricks může změnit model (a také list příslušných licencí uvedených na této stránce).

Meta-Llama-3.1-70B-Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.

Poznámka:

V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.

Syntaxe

ai_classify(content, labels)

Argumenty

  • content: Výraz STRING , text, který se má klasifikovat.
  • labels ARRAY<STRING>: Literál, očekávané popisky klasifikace výstupu. Musí obsahovat alespoň 2 prvky a nesmí obsahovat více než 20 prvků.

Návraty

Úloha STRING. Hodnota odpovídá jednomu z řetězců zadaných v argumentu labels . Vrátí null , pokud content nelze klasifikovat.

Příklady

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products
  LIMIT 10;