Prozkoumání abstrakčního souhrnu

Dokončeno

Shrnutí abstrakce

abstraktní shrnutí spoléhá na možnosti zpracování přirozeného jazyka generujících jazykové modely AI, jako je Azure OpenAI, k vytváření původních vět, které zachycují hlavní myšlenku původního obsahu. Generuje souhrnné věty pomocí parafrázování a přehrazování původního obsahu. Tato metoda umožňuje větší flexibilitu a kreativitu, zachycení základních informací a zároveň umožňuje stručné vyjádření.

Abstrakční shrnutí se provádí pomocí funkce summarize_abstractive(), která se nachází ve schématu azure_cognitive rozšíření azure_ai. Schéma azure_cognitive obsahuje tři přetížení summarize_abstractive() funkce. Seznam argumentů, které tři přetížení funkce očekávají, zahrnují:

Důvod Typ Výchozí Popis
Text text nebo text[] Texty, pro které se mají vygenerovat souhrny.
language_text text nebo text[] Kód jazyka (nebo pole kódů jazyka) představující jazyk textu, který se má sumarizovat. Projděte si seznam podporovaných jazyků, a načtěte potřebné kódy jazyka.
sentence_count integer 3 Počet souhrnných vět, které se mají vygenerovat.
batch_size integer 25 Pouze pro dvě přetížení očekává vstup text[]. Určuje počet záznamů, které se mají zpracovat najednou.
disable_service_logs boolean Nepravda Příznak označující, jestli se mají vypnout protokoly služeb.
timeout_ms integer NULA Časový limit v milisekundách, po kterém je operace zastavena.
throw_on_error boolean pravda Příznak označující, zda má funkce při chybě vyvolat výjimku, která vede k vrácení zpět zabalené transakce.
max_attempts integer 1 Počet opakování volání služeb Azure AI v případě selhání
retry_delay_ms integer 1000 Doba, po kterou se v milisekundách počkáte, než se pokusíte znovu volat koncový bod služby Azure AI Services.

Každé přetížení funkce vrátí pole vět (text[]) obsahující vygenerovaný souhrn.

Generování abstraktních souhrnů pro popisy vlastností

Jako vývojář služby Margie's Travel chcete vyhodnotit abstrakční techniku přístupnou prostřednictvím rozšíření azure_ai a služeb Azure AI Services a vyhodnotit schopnost metody generovat stručné souhrny dlouhých popisů vlastností v přirozeném jazyce, jako je tento popis z prvního výpisu v databázi:

"Udělejte si doma v tomto okouzlujícím apartmánu s 1 ložnicí, centrálně umístěným na západní straně Queen Anne Hill. Tento elegantně zařízený soukromý apartmán (spodní jednotka duplexu) má otevřený prostorový plán, bamboo podlahy, plně vybavenou kuchyň, TV, DVD přehrávač, základní kabel a útulnou ložnici s manželskou postelí velikosti Queen. Jednotka spí až čtyři (dva v ložnici a dva na pohodlném rozkládacím gauči, ložní prádlo) a zahrnuje bezplatné Wi-Fi a prádelnu. Apartmán se nachází na soukromé palubě s vlastním grilem, s výhledem do zahrady a lesa černého bamboou. Apartmán je dokonale umístěn jen jeden blok od autobusových linek, kde můžete chytit autobus a být v centru Seattlu za 15 minut nebo historické Ballard v 10. Rychlá pětiminutová procházka vás zavede do přirozeného obchodu s potravinami a kávovarů. Nebo jen 15 minut chůze od vrcholu Queen Anne Hill, kde najdete různé eclektické obchody, bary a restaurace."

Pomocí následujícího dotazu si vyžádáte dvousouvětý souhrn výše uvedeného popisu vlastnosti:

SELECT
  azure_cognitive.summarize_abstractive(description, 'en', 2) AS abstractive_summary
FROM listings
WHERE id = 1;

Shrnutí abstrakce vrátí dvě vygenerované věty:

{
  "The document describes a one-bedroom apartment located on the west side of Queen Anne Hill, featuring an open floor plan, bamboo floors, a fully equipped kitchen, a queen-size bed, and a private deck with a BBQ. It is conveniently located near bus lines, historic Ballard, a grocery store, coffee shops, and various shops and restaurants."
}