funktion ai_extract
Gäller för: Databricks SQL
Databricks Runtime
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
I förhandsversionen:
- Den underliggande språkmodellen kan hantera flera språk, men dessa funktioner är anpassade för engelska.
- Det finns hastighetsbegränsning för de underliggande FOUNDATION Model-API:erna. Se gränserna för Foundation Model API:er för att uppdatera dessa gränser.
- En konservativ standardfrekvensgräns tillämpas på den här funktionen. Kontakta supporten för program med högt dataflöde.
Med ai_extract()
funktionen kan du anropa en toppmodern generativ AI-modell för att extrahera entiteter som anges av etiketter från en viss text med hjälp av SQL. Den här funktionen använder en chattmodell som betjänar slutpunkten som görs tillgänglig av Databricks Foundation-modell-API:er.
Krav
Viktigt!
De underliggande modeller som kan användas just nu är licensierade under Apache 2.0-licensen, Copyright © Apache Software Foundation eller LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Alla rättigheter reserverade. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser.
Databricks rekommenderar att du granskar dessa licenser för att säkerställa efterlevnad av tillämpliga villkor. Om modeller dyker upp i framtiden som presterar bättre enligt Databricks interna riktmärken kan Databricks ändra modellen (och listan över tillämpliga licenser som tillhandahålls på den här sidan).
- Den här funktionen är endast tillgänglig på arbetsytor i AI Functions som använder Foundation-modell-API:er i regioner som stöds.
- Den här funktionen är inte tillgänglig i Azure Databricks SQL Classic.
- Kontrollera prissättningssidan för Databricks SQL.
Anteckning
I Databricks Runtime 15.1 och senare stöds den här funktionen i Databricks-notebooks, inklusive notebooks som körs som en uppgift i ett Databricks-arbetsflöde.
Syntax
ai_extract(content, labels)
Argument
-
content
: EttSTRING
uttryck. -
labels
: EnARRAY<STRING>
literal. Varje element är en typ av entitet som ska extraheras.
Returer
En STRUCT
där varje fält motsvarar en entitetstyp som anges i labels
. Varje fält innehåller en sträng som representerar den extraherade entiteten. Om fler än en kandidat för någon entitetstyp hittas returneras bara en.
Om content
är NULL
, är NULL
resultatet.
Exempel
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}