Freigeben über


ai_classify-Funktion

Gilt für: durch Häkchen mit „Ja“ markiert Databricks SQL durch Häkchen mit „Ja“ markiert Databricks Runtime

Wichtig

Dieses Feature befindet sich in der Public Preview.

In der Preview ist Folgendes enthalten:

  • Das zugrunde liegende Sprachmodell kann mehrere Sprachen verarbeiten. Diese Funktionen sind jedoch für Englisch optimiert.
  • Für die zugrunde liegenden Foundation-Modell-APIs gibt es Ratenbegrenzung. Weitere Informationen finden Sie unter Foundation Model-APIs, um diese Grenzwerte zu aktualisieren.

Mit der ai_classify()-Funktion können Sie ein hochmodernes Modell für generative KI aufrufen, um Eingabetext mithilfe von SQL nach Bezeichnungen zu klassifizieren, die Sie bereitstellen. Diese Funktion verwendet einen Bereitstellungsendpunkt für Chatmodelle, der durch die Basismodell-APIs von Databricks verfügbar gemacht wird.

Anforderungen

Wichtig

Die zugrunde liegenden Modelle, die derzeit verwendet werden können, sind unter der Apache 2.0-Lizenz, Copyright The Apache Software Foundation oder der LLAMA 3.1 Community License Copyright © © Meta Platforms, Inc. lizenziert. Alle Rechte vorbehalten. Kunden sind dafür verantwortlich, die Einhaltung anwendbarer Modelllizenzen sicherzustellen.

Databricks empfiehlt, diese Lizenzen zu überprüfen, um die Einhaltung der geltenden Bedingungen zu gewährleisten. Wenn in Zukunft Modelle entstehen, die gemäß den internen Benchmarks von Databricks besser funktionieren, kann Databricks das Modell (und die Liste der anwendbaren Lizenzen auf dieser Seite) ändern.

Derzeit ist Meta-Llama-3.1-70B-Instruct das zugrunde liegende Modell, das diese KI-Funktionen unterstützt.

Hinweis

In Databricks Runtime 15.1 und höher wird diese Funktion in Databricks-Notebooks unterstützt, einschließlich in Notebooks, die als Task in einem Databricks-Workflow ausgeführt werden.

Syntax

ai_classify(content, labels)

Argumente

  • content: Ein STRING-Ausdruck – der Text, der klassifiziert werden soll
  • labels: Ein ARRAY<STRING>-Literal – die erwarteten Klassifizierungsbezeichnungen der Ausgabe. Es muss zwei bis 20 Elemente enthalten.

Gibt zurück

Ein STRING. Der Wert stimmt mit einer der Zeichenfolgen überein, die im labels-Argument angegeben sind. Gibt null zurück, wenn content nicht klassifiziert werden kann

Beispiele

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products