Sdílet prostřednictvím


Funkce ai_mask

Platí pro:zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview.

Ve verzi Preview:

  • Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
  • Pro základní rozhraní API základního modelu existuje omezení rychlosti. Podívejte se na omezení rozhraní API základního modelu na tyto limity update.
  • Kvůli omezování rychlosti je tato funkce určená pro testování malých datových sad, které mají méně než 100 řádků. Pro případy použití s více než 100 řádky dat doporučuje Databricks používat ai_query a koncový bod zřízené propustnosti. Viz Provedení dávkového odvozování LLM pomocí ai_query.

Funkce ai_mask() umožňuje vyvolat nejmodernější model generující umělé inteligence k maskování zadaných entit v daném textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.

Požadavky

Důležité

Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence Apache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za zajištění dodržování předpisů s příslušnými licencemi modelu.

Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely v budoucnu objeví, které podle interních srovnávacích testů Databricks fungují lépe, Databricks může změnit model (a příslušné licence list uvedené na této stránce).

Meta-Llama-3.1-70B-Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.

Poznámka:

V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.

Syntaxe

ai_mask(content, labels)

Argumenty

  • content: Výraz STRING .
  • labels: Literál ARRAY<STRING> . Každý prvek představuje typ informací, které mají být maskovány.

Návraty

STRING where zadané informace jsou maskované.

Pokud content je NULL, výsledek je NULL.

Příklady

> SELECT ai_mask(
    'John Doe lives in New York. His email is john.doe@example.com.',
    array('person', 'email')
  );
 "[MASKED] lives in New York. His email is [MASKED]."

> SELECT ai_mask(
    'Contact me at 555-1234 or visit us at 123 Main St.',
    array('phone', 'address')
  );
 "Contact me at [MASKED] or visit us at [MASKED]"