Rozpoznávání entit
Rozpoznávání pojmenovaných entit je funkce nabízená jazykem Azure AI. Identifikuje a kategorizuje entity v nestrukturovaném textu. Podporuje několik kategorií entit, včetně lidí, míst, událostí, produktů, organizací atd.
Existuje několik způsobů, jak volat pojmenované rozhraní API pro rozpoznávání entit. V této části azure_ai
použijete rozšíření k rozpoznávání entit z textu v dotazech SQL.
Požadavky
Potřebujete flexibilní server Azure Database for PostgreSQL s povoleným azure_ai
a nakonfigurovaným rozšířením. Musíte ho také autorizovat ve službě Azure Cognitive Services nastavením klíče a koncového bodu prostředku jazyka.
Scénáře
Rozpoznávání entit je užitečné v několika doménách, například:
- Vyhledávání a indexování: Automaticky se vytvářejí grafy znalostí a adresáře značek s identifikovanými entitami.
- Automatizace procesů: Automaticky rozpozná produkty a umístění v nestrukturovaném textu a směruje je na žádosti o zákaznickou podporu.
- Analýza trhu: Měří nejčastější entity a clustery entit ze sociálních médií, recenzí zákazníků, lístků podpory atd., k určení relevantních témat a předvídání trendů.
Použití rozpoznávání pojmenovaných entit v SQL se službou Azure Cognitive Services
Flexibilní server Azure Database for PostgreSQL azure_ai rozšíření poskytuje uživatelem definované funkce (UDF) pro přímý přístup k funkcím AI z SQL. K rozhraní API pro rozpoznávání pojmenovaných entit se přistupuje pomocí azure_cognitive.recognize_entities
funkce poskytované azure_ai
:
azure_cognitive.recognize_entities(
text text,
language text,
timeout_ms integer DEFAULT 3600000,
throw_on_error boolean DEFAULT true,
disable_service_logs boolean DEFAULT false
)
Požadované parametry jsou text
, vstup a language
jazyk, ve kterém text
je zapsán. Například en-us
angličtina v USA a fr
francouzština. Úplný seznam dostupných jazyků najdete v podpoře jazyků.
Ve výchozím nastavení je rozpoznávání entit zastaveno, pokud se nedokončí do 3 600 000 ms = 1 hodina. Toto zpoždění můžete přizpůsobit změnou timeout_ms
.
Pokud dojde k chybě, výchozí chování je vyvolání výjimky, což vede k vrácení transakce zpět. Toto chování můžete zakázat nastavením throw_on_error
na false.
Kompletní dokumentaci k parametrům najdete v dokumentaci k rozšíření Azure Cognitive Services.
Například vyvolání tohoto dotazu:
SELECT azure_cognitive.recognize_entities('For more information, see Cognitive Services Compliance and Privacy notes.', 'en-us');
Vrátí tento výsledek:
{"(\"Cognitive Services\",Skill,\"\",0.94)"}
Indikující název entity je Cognitive Services, označuje se jako dovednost se skóre spolehlivosti 0,94.
Pro vstupní text můžete použít sloupce tabulky:
SELECT description, azure_cognitive.recognize_entities(description, 'en-us')
FROM listings LIMIT 1;
Která vrátí:
{"(house,Location,\"\",0.77)","(2013.,DateTime,DateRange,1)","(\"rooftop deck\",Location,\"\",0.88)","(\"lounge area\",Location,Structural,0.97)","(tub,Product,\"\",0.52)","
(5,Quantity,Number,0.8)","(bedrooms,Location,\"\",0.92)","(\"gourmet kitchen\",Location,\"\",0.87)","(2-3,Quantity,NumberRange,0.87)","(downtown,Location,Structural,0.8)","(\
"Queen Anne neighborhood\",Location,\"\",0.74)","(house,Location,\"\",0.96)","(barnwood,Product,\"\",0.61)","(steel,Product,\"\",0.73)","(concrete,Product,\"\",0.7)","(living
,Location,Structural,0.53)","(\"gourmet kitchen\",Location,\"\",0.7)","(kitchen,Location,\"\",0.77)","(reading,Skill,\"\",0.54)","(half,Quantity,Number,0.8)","(\"tv room\",Lo
cation,\"\",0.89)","(kitchen,Location,\"\",0.64)","(Fireplace,Product,\"\",0.91)","(sofa,Product,\"\",0.98)","(\"sitting area\",Location,\"\",0.93)","(\"Basement room\",Locat
ion,\"\",0.98)","(kids,PersonType,\"\",0.73)","(room,Location,Structural,0.78)","(patio,Location,Structural,0.75)","(basketball,Product,\"\",0.57)","(bedroom,Location,\"\",0.
8)","(basement,Location,\"\",0.94)","(\"concrete heated floors\",Product,\"\",0.95)","(\"queen sleeper sofa\",Product,\"\",0.86)","(tv,Location,\"\",0.54)","(basement,Locatio
n,\"\",0.92)","(room,Location,Structural,0.9)","(\"a second\",DateTime,Duration,0.85)","(family,PersonType,\"\",0.71)","(kids,PersonType,\"\",0.65)","(\"2nd floor\",Location,
Structural,0.56)","(4,Quantity,Number,0.8)","(bedrooms,Location,\"\",0.66)","(one,Quantity,Number,0.8)","(one,Quantity,Number,0.8)","(bedroom,Location,\"\",0.54)","(\"twin bu
nk beds\",Product,\"\",0.67)"}
Shrnutí
Rozpoznávání pojmenovaných entit identifikuje a kategorizuje entity ve vstupním textu. Jazykový model Azure Cognitive Services zpracovává náročné zpracování přirozeného jazyka. Rozšíření azure_ai
pro Azure Database for PostgreSQL poskytuje azure_cognitive.recognize_entities
rozhraní API pro přístup k rozpoznávání pojmenovaných entit přímo v rámci dotazů SQL.