Vysvětlit extrahový souhrn

Dokončeno

extrahování souhrnů vytvoří souhrn extrahováním základních vět přímo z původního textu. Místo generování nového textu používá techniky zpracování přirozeného jazyka k vyhledání vět, které souhrnně vyjadřují primární myšlenku nebo kontext dokumentu.

Extrakce souhrnu se provádí pomocí funkce summarize_extractive() nalezené ve schématu azure_cognitive rozšíření azure_ai. Schéma azure_cognitive obsahuje tři přetížení summarize_extractive() funkce. Seznam argumentů, které tři přetížení funkce očekávají, zahrnují:

Důvod Typ Výchozí Popis
Text text nebo text[] Texty, pro které se mají vygenerovat souhrny.
language_text text nebo text[] Kód jazyka (nebo pole kódů jazyka) představující jazyk textu, který se má sumarizovat. Projděte si seznam podporovaných jazyků, a načtěte potřebné kódy jazyka.
sentence_count integer 3 Počet souhrnných vět, které se mají vygenerovat.
sort_by text "posun" Pořadí řazení vygenerovaných souhrnných vět Přijatelné hodnoty jsou "posun" a "pořadí", přičemž posun představuje počáteční pozici každé extrahované věty v původním obsahu a pořadí je indikátorem toho, jak je věta relevantní pro hlavní myšlenku obsahu.
batch_size integer 25 Pouze pro dvě přetížení očekává vstup text[]. Určuje počet záznamů, které se mají zpracovat najednou.
disable_service_logs boolean Nepravda Příznak označující, jestli se mají vypnout protokoly služeb.
timeout_ms integer NULA Časový limit v milisekundách, po kterém je operace zastavena.
throw_on_error boolean pravda Příznak označující, zda má funkce při chybě vyvolat výjimku, která vede k vrácení zpět zabalené transakce.
max_attempts integer 1 Počet opakování volání služeb Azure AI v případě selhání
retry_delay_ms integer 1000 Doba, po kterou se v milisekundách počkáte, než se pokusíte znovu volat koncový bod služby Azure AI Services.

Každá funkce vrátí pole extrahovaných vět a skóre pořadí pro každou z nich pomocí azure_cognitive.sentence složeného typu, jak je znázorněno v následující tabulce:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

azure_cognitive.sentence je složený typ obsahující text extrahující věty a skóre pořadí pro každou větu. Skóre pořadí, hodnota mezi 0 a 1 (včetně), označuje, jak relevantní je věta pro hlavní myšlenku původního dokumentu. Shrnutí dokumentu řadí extrahované věty a pomocí parametru sort_by funkce můžete určit, jestli se vrátí v pořadí, ve kterém se zobrazují, nebo podle jejich pořadí.

Generování extrahovaných souhrnů pro popisy vlastností

Jako vývojář služby Margie's Travel chcete vyhodnotit metodu extrahování souhrnů přístupnou prostřednictvím rozšíření azure_ai a služeb Azure AI Services a vyhodnotit schopnost generovat stručné souhrny dlouhých popisů vlastností v přirozeném jazyce, jako je tento popis z prvního výpisu v databázi:

"Udělejte si doma v tomto okouzlujícím apartmánu s 1 ložnicí, centrálně umístěným na západní straně Queen Anne Hill. Tento elegantně zařízený soukromý apartmán (spodní jednotka duplexu) má otevřený prostorový plán, bamboo podlahy, plně vybavenou kuchyň, TV, DVD přehrávač, základní kabel a útulnou ložnici s manželskou postelí velikosti Queen. Jednotka spí až čtyři (dva v ložnici a dva na pohodlném rozkládacím gauči, ložní prádlo) a zahrnuje bezplatné Wi-Fi a prádelnu. Apartmán se nachází na soukromé palubě s vlastním grilem, s výhledem do zahrady a lesa černého bamboou. Apartmán je dokonale umístěn jen jeden blok od autobusových linek, kde můžete chytit autobus a být v centru Seattlu za 15 minut nebo historické Ballard v 10. Rychlá pětiminutová procházka vás zavede do přirozeného obchodu s potravinami a kávovarů. Nebo jen 15 minut chůze od vrcholu Queen Anne Hill, kde najdete různé eclektické obchody, bary a restaurace."

Pomocí následujícího dotazu si vyžádáte dvousouvětý souhrn výše uvedeného popisu vlastnosti:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

Extrakce souhrnu vrátí dvě věty s nejvyšším skóre z původního textu a skóre pořadí pro každý z nich:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}