Dela via


Funktionen ai_mask

Gäller för:markerad ja Databricks SQL markerad ja Databricks Runtime

Viktigt!

Den här funktionen finns som allmänt tillgänglig förhandsversion.

I förhandsversionen:

  • Den underliggande språkmodellen kan hantera flera språk, men dessa funktioner är anpassade för engelska.
  • Det finns hastighetsbegränsning för de underliggande FOUNDATION Model-API:erna. Se Foundation Model API-begränsningar till update dessa gränser.
  • På grund av hastighetsbegränsning är den här funktionen utformad för testning på små datauppsättningar som har mindre än 100 rader. För användningsfall med över 100 rader data rekommenderar Databricks att du använder ai_query och en etablerad dataflödesslutpunkt. Se Utföra batch-LLM-slutsatsdragning med hjälp av ai_query.

Med ai_mask() funktionen kan du anropa en toppmodern generativ AI-modell för att maskera angivna entiteter i en viss text med hjälp av SQL. Den här funktionen använder en chattmodell som betjänar slutpunkten som görs tillgänglig av Databricks Foundation-modell-API:er.

Krav

Viktigt!

De underliggande modeller som kan användas just nu är licensierade under Apache 2.0-licensen, Copyright © Apache Software Foundation eller LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alla rättigheter reserverade. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser.

Databricks rekommenderar att du granskar dessa licenser för att säkerställa efterlevnad av tillämpliga villkor. Om modeller dyker upp i framtiden som presterar bättre enligt Databricks interna riktmärken kan Databricks ändra modellen (och list av tillämpliga licenser som tillhandahålls på den här sidan).

För närvarande är Meta-Llama-3.1-70B-Instruct den underliggande modellen som driver dessa AI-funktioner.

Kommentar

I Databricks Runtime 15.1 och senare stöds den här funktionen i Databricks Notebooks, inklusive notebook-filer som körs som en uppgift i ett Databricks-arbetsflöde.

Syntax

ai_mask(content, labels)

Argument

  • content: Ett STRING uttryck.
  • labels: En ARRAY<STRING> literal. Varje element representerar en typ av information som ska maskeras.

Returer

En STRINGwhere den angivna informationen är maskerad.

Om content är NULLär NULLresultatet .

Exempel

> SELECT ai_mask(
    'John Doe lives in New York. His email is john.doe@example.com.',
    array('person', 'email')
  );
 "[MASKED] lives in New York. His email is [MASKED]."

> SELECT ai_mask(
    'Contact me at 555-1234 or visit us at 123 Main St.',
    array('phone', 'address')
  );
 "Contact me at [MASKED] or visit us at [MASKED]"