Rozpoznávání entit

Dokončeno

Rozpoznávání pojmenovaných entit je funkce nabízená jazykem Azure AI. Identifikuje a kategorizuje entity v nestrukturovaném textu. Podporuje několik kategorií entit, včetně lidí, míst, událostí, produktů, organizací atd.

Existuje několik způsobů, jak volat pojmenované rozhraní API pro rozpoznávání entit. V této části azure_ai použijete rozšíření k rozpoznávání entit z textu v dotazech SQL.

Požadavky

Potřebujete flexibilní server Azure Database for PostgreSQL s povoleným azure_ai a nakonfigurovaným rozšířením. Musíte ho také autorizovat ve službě Azure Cognitive Services nastavením klíče a koncového bodu prostředku jazyka.

Scénáře

Rozpoznávání entit je užitečné v několika doménách, například:

  • Vyhledávání a indexování: Automaticky se vytvářejí grafy znalostí a adresáře značek s identifikovanými entitami.
  • Automatizace procesů: Automaticky rozpozná produkty a umístění v nestrukturovaném textu a směruje je na žádosti o zákaznickou podporu.
  • Analýza trhu: Měří nejčastější entity a clustery entit ze sociálních médií, recenzí zákazníků, lístků podpory atd., k určení relevantních témat a předvídání trendů.

Použití rozpoznávání pojmenovaných entit v SQL se službou Azure Cognitive Services

Flexibilní server Azure Database for PostgreSQL azure_ai rozšíření poskytuje uživatelem definované funkce (UDF) pro přímý přístup k funkcím AI z SQL. K rozhraní API pro rozpoznávání pojmenovaných entit se přistupuje pomocí azure_cognitive.recognize_entities funkce poskytované azure_ai:

azure_cognitive.recognize_entities(
 text text,
 language text,
 timeout_ms integer DEFAULT 3600000,
 throw_on_error boolean DEFAULT true,
 disable_service_logs boolean DEFAULT false
)

Požadované parametry jsou text, vstup a languagejazyk, ve kterém text je zapsán. Například en-us angličtina v USA a fr francouzština. Úplný seznam dostupných jazyků najdete v podpoře jazyků.

Ve výchozím nastavení je rozpoznávání entit zastaveno, pokud se nedokončí do 3 600 000 ms = 1 hodina. Toto zpoždění můžete přizpůsobit změnou timeout_ms.

Pokud dojde k chybě, výchozí chování je vyvolání výjimky, což vede k vrácení transakce zpět. Toto chování můžete zakázat nastavením throw_on_error na false.

Kompletní dokumentaci k parametrům najdete v dokumentaci k rozšíření Azure Cognitive Services.

Například vyvolání tohoto dotazu:

SELECT azure_cognitive.recognize_entities('For more information, see Cognitive Services Compliance and Privacy notes.', 'en-us');

Vrátí tento výsledek:

{"(\"Cognitive Services\",Skill,\"\",0.94)"}

Indikující název entity je Cognitive Services, označuje se jako dovednost se skóre spolehlivosti 0,94.

Pro vstupní text můžete použít sloupce tabulky:

SELECT description, azure_cognitive.recognize_entities(description, 'en-us')
FROM listings LIMIT 1;

Která vrátí:

 {"(house,Location,\"\",0.77)","(2013.,DateTime,DateRange,1)","(\"rooftop deck\",Location,\"\",0.88)","(\"lounge area\",Location,Structural,0.97)","(tub,Product,\"\",0.52)","
(5,Quantity,Number,0.8)","(bedrooms,Location,\"\",0.92)","(\"gourmet kitchen\",Location,\"\",0.87)","(2-3,Quantity,NumberRange,0.87)","(downtown,Location,Structural,0.8)","(\
"Queen Anne neighborhood\",Location,\"\",0.74)","(house,Location,\"\",0.96)","(barnwood,Product,\"\",0.61)","(steel,Product,\"\",0.73)","(concrete,Product,\"\",0.7)","(living
,Location,Structural,0.53)","(\"gourmet kitchen\",Location,\"\",0.7)","(kitchen,Location,\"\",0.77)","(reading,Skill,\"\",0.54)","(half,Quantity,Number,0.8)","(\"tv room\",Lo
cation,\"\",0.89)","(kitchen,Location,\"\",0.64)","(Fireplace,Product,\"\",0.91)","(sofa,Product,\"\",0.98)","(\"sitting area\",Location,\"\",0.93)","(\"Basement room\",Locat
ion,\"\",0.98)","(kids,PersonType,\"\",0.73)","(room,Location,Structural,0.78)","(patio,Location,Structural,0.75)","(basketball,Product,\"\",0.57)","(bedroom,Location,\"\",0.
8)","(basement,Location,\"\",0.94)","(\"concrete heated floors\",Product,\"\",0.95)","(\"queen sleeper sofa\",Product,\"\",0.86)","(tv,Location,\"\",0.54)","(basement,Locatio
n,\"\",0.92)","(room,Location,Structural,0.9)","(\"a second\",DateTime,Duration,0.85)","(family,PersonType,\"\",0.71)","(kids,PersonType,\"\",0.65)","(\"2nd floor\",Location,
Structural,0.56)","(4,Quantity,Number,0.8)","(bedrooms,Location,\"\",0.66)","(one,Quantity,Number,0.8)","(one,Quantity,Number,0.8)","(bedroom,Location,\"\",0.54)","(\"twin bu
nk beds\",Product,\"\",0.67)"}

Shrnutí

Rozpoznávání pojmenovaných entit identifikuje a kategorizuje entity ve vstupním textu. Jazykový model Azure Cognitive Services zpracovává náročné zpracování přirozeného jazyka. Rozšíření azure_ai pro Azure Database for PostgreSQL poskytuje azure_cognitive.recognize_entities rozhraní API pro přístup k rozpoznávání pojmenovaných entit přímo v rámci dotazů SQL.