次の方法で共有


ai_classify 関数

適用対象:「はい」のチェック マーク Databricks SQL 「はい」のチェック マーク Databricks Runtime

重要

この機能はパブリック プレビュー段階にあります。

このプレビューでは:

  • 基になる言語モデルでは複数の言語を処理できますが、これらの関数は英語用にチューニングされています。
  • 基になる Foundation Model API にはレート制限があります。 これらの制限を更新するには、「Foundation Model API の制限」を参照してください。
  • レート制限のため、この関数は 100 行未満の小さなデータセットでテストするように設計されています。 データが 100 行を超えるユース ケースの場合、Databricks では、ai_query とプロビジョニングされたスループット エンドポイントの使用をお勧めします。 を参照して、ai_queryを使用したバッチLLM推論を実行してください。

ai_classify() 関数を使用すると、最先端の生成 AI モデルを呼び出し、SQL を使用して指定したラベルに従って入力テキストを分類できます。 この関数は、Databricks Foundation Model API によって利用できるチャット モデル提供エンドポイントを使用します。

要件

重要

現時点で使用できる基になるモデルは、 Apache 2.0 ライセンス、Copyright © The Apache Software Foundation または LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. に基づきライセンスされます。すべての権限が予約されています。 お客様は、該当するモデル ライセンスへのコンプライアンスを遵守する責任を負います。

Databricks では、該当する使用条件に準拠するために、これらのライセンスを確認することをお勧めしています。 Databricks の内部ベンチマークに従ってパフォーマンスが向上するモデルが将来出現した場合、Databricks によってモデルが変更される可能性があります (および、このページで提供されている該当するライセンスの一覧)。

現在、 Meta-Llama-3.1-70B-Instruct はこれらの AI 関数を実行する基になるモデルです。

Note

Databricks Runtime 15.1 以上では、この関数は Databricks ノートブック内でサポートされ、これには Databricks ワークフロー内でタスクとして実行されるノートブックも含まれます。

構文

ai_classify(content, labels)

引数

  • content: STRING 式。分類するテキスト。
  • labels: ARRAY<STRING> リテラル。期待される出力の分類ラベル。 2 個以上 20 個以下の要素を含む必要があります。

返品

STRING です。 この値は、labels 引数で指定された文字列のいずれかとマッチします。 null が分類できない場合は content を返します。

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products
  LIMIT 10;