Delen via


ai_mask-functie

Van toepassing op:vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime

Belangrijk

Deze functie is beschikbaar als openbare preview.

In de preview:

  • Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
  • Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie beperkingen van Foundation Model API's om deze beperkingen bij te werken.
  • Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om ai_query en een ingerichte doorvoereindpunt te gebruiken. Zie Batch LLM-inferentie uitvoeren met behulp van ai_query.

Met ai_mask() de functie kunt u een state-of-the-art AI-model aanroepen om opgegeven entiteiten in een bepaalde tekst te maskeren met behulp van SQL. Deze functie maakt gebruik van een chatmodel voor eindpunten dat beschikbaar wordt gesteld door Databricks Foundation Model-API's.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.

Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als modellen in de toekomst beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de lijst met toepasselijke licenties op deze pagina) wijzigen.

Momenteel is Meta-Llama-3.1-70B-Instruct het onderliggende model dat deze AI-functies mogelijk maakt.

Notitie

In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.

Syntaxis

ai_mask(content, labels)

Argumenten

  • content: Een STRING expressie.
  • labels: Een ARRAY<STRING> letterlijke. Elk element vertegenwoordigt een type informatie dat moet worden gemaskeerd.

Retouren

Een STRING waarin de opgegeven informatie wordt gemaskeerd.

Als content dat het is NULL, is NULLhet resultaat .

Voorbeelden

> SELECT ai_mask(
    'John Doe lives in New York. His email is john.doe@example.com.',
    array('person', 'email')
  );
 "[MASKED] lives in New York. His email is [MASKED]."

> SELECT ai_mask(
    'Contact me at 555-1234 or visit us at 123 Main St.',
    array('phone', 'address')
  );
 "Contact me at [MASKED] or visit us at [MASKED]"