Vysvětlit extrahový souhrn
extrahování souhrnů vytvoří souhrn extrahováním základních vět přímo z původního textu. Místo generování nového textu používá techniky zpracování přirozeného jazyka k vyhledání vět, které souhrnně vyjadřují primární myšlenku nebo kontext dokumentu.
Extrakce souhrnu se provádí pomocí funkce summarize_extractive()
nalezené ve schématu azure_cognitive
rozšíření azure_ai
. Schéma azure_cognitive
obsahuje tři přetížení summarize_extractive()
funkce. Seznam argumentů, které tři přetížení funkce očekávají, zahrnují:
Důvod | Typ | Výchozí | Popis |
---|---|---|---|
Text |
text nebo text[] |
Texty, pro které se mají vygenerovat souhrny. | |
language_text |
text nebo text[] |
Kód jazyka (nebo pole kódů jazyka) představující jazyk textu, který se má sumarizovat. Projděte si seznam podporovaných jazyků, a načtěte potřebné kódy jazyka. | |
sentence_count | integer |
3 | Počet souhrnných vět, které se mají vygenerovat. |
sort_by | text |
"posun" | Pořadí řazení vygenerovaných souhrnných vět Přijatelné hodnoty jsou "posun" a "pořadí", přičemž posun představuje počáteční pozici každé extrahované věty v původním obsahu a pořadí je indikátorem toho, jak je věta relevantní pro hlavní myšlenku obsahu. |
batch_size | integer |
25 | Pouze pro dvě přetížení očekává vstup text[] . Určuje počet záznamů, které se mají zpracovat najednou. |
disable_service_logs | boolean |
Nepravda | Příznak označující, jestli se mají vypnout protokoly služeb. |
timeout_ms | integer |
NULA | Časový limit v milisekundách, po kterém je operace zastavena. |
throw_on_error | boolean |
pravda | Příznak označující, zda má funkce při chybě vyvolat výjimku, která vede k vrácení zpět zabalené transakce. |
max_attempts | integer |
1 | Počet opakování volání služeb Azure AI v případě selhání |
retry_delay_ms | integer |
1000 | Doba, po kterou se v milisekundách počkáte, než se pokusíte znovu volat koncový bod služby Azure AI Services. |
Každá funkce vrátí pole extrahovaných vět a skóre pořadí pro každou z nich pomocí azure_cognitive.sentence
složeného typu, jak je znázorněno v následující tabulce:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
azure_cognitive.sentence
je složený typ obsahující text extrahující věty a skóre pořadí pro každou větu. Skóre pořadí, hodnota mezi 0 a 1 (včetně), označuje, jak relevantní je věta pro hlavní myšlenku původního dokumentu. Shrnutí dokumentu řadí extrahované věty a pomocí parametru sort_by
funkce můžete určit, jestli se vrátí v pořadí, ve kterém se zobrazují, nebo podle jejich pořadí.
Generování extrahovaných souhrnů pro popisy vlastností
Jako vývojář služby Margie's Travel chcete vyhodnotit metodu extrahování souhrnů přístupnou prostřednictvím rozšíření azure_ai
a služeb Azure AI Services a vyhodnotit schopnost generovat stručné souhrny dlouhých popisů vlastností v přirozeném jazyce, jako je tento popis z prvního výpisu v databázi:
"Udělejte si doma v tomto okouzlujícím apartmánu s 1 ložnicí, centrálně umístěným na západní straně Queen Anne Hill. Tento elegantně zařízený soukromý apartmán (spodní jednotka duplexu) má otevřený prostorový plán, bamboo podlahy, plně vybavenou kuchyň, TV, DVD přehrávač, základní kabel a útulnou ložnici s manželskou postelí velikosti Queen. Jednotka spí až čtyři (dva v ložnici a dva na pohodlném rozkládacím gauči, ložní prádlo) a zahrnuje bezplatné Wi-Fi a prádelnu. Apartmán se nachází na soukromé palubě s vlastním grilem, s výhledem do zahrady a lesa černého bamboou. Apartmán je dokonale umístěn jen jeden blok od autobusových linek, kde můžete chytit autobus a být v centru Seattlu za 15 minut nebo historické Ballard v 10. Rychlá pětiminutová procházka vás zavede do přirozeného obchodu s potravinami a kávovarů. Nebo jen 15 minut chůze od vrcholu Queen Anne Hill, kde najdete různé eclektické obchody, bary a restaurace."
Pomocí následujícího dotazu si vyžádáte dvousouvětý souhrn výše uvedeného popisu vlastnosti:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Extrakce souhrnu vrátí dvě věty s nejvyšším skóre z původního textu a skóre pořadí pro každý z nich:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}