Extraheerelijke samenvatting uitleggen

Voltooid

Extraheerlijk samenvatting produceert een samenvatting door essentiële zinnen rechtstreeks uit de oorspronkelijke tekst te extraheren. In plaats van nieuwe tekst te genereren, wordt gebruikgemaakt van technieken voor natuurlijke taalverwerking om de zinnen te vinden die gezamenlijk het primaire idee of de context van een document overbrengen.

Extractieve samenvatting wordt bereikt met behulp van de summarize_extractive() functie die in het azure_cognitive schema van de azure_ai extensie is gevonden. Het azure_cognitive schema bevat drie overbelastingen van de summarize_extractive() functie. De lijst met argumenten die de drie functie-overbelastingen verwachten, zijn onder andere:

Argument Type Default Beschrijving
sms verzenden text of text[] De tekst(en) waarvoor samenvattingen moeten worden gegenereerd.
language_text text of text[] Taalcode (of matrix met taalcodes) die de taal van de tekst vertegenwoordigt die moet worden samengevat. Bekijk de lijst met ondersteunde talen om de benodigde taalcodes op te halen.
sentence_count integer 3 Het aantal samenvattingszinnen dat moet worden gegenereerd.
sort_by text 'offset' De sorteervolgorde voor de gegenereerde samenvattingszinnen. Acceptabele waarden zijn 'offset' en 'rangschikking', met offset die de beginpositie van elke geëxtraheerde zin binnen de oorspronkelijke inhoud vertegenwoordigt en rangschikking een door AI gegenereerde indicator is van hoe relevant een zin is voor het belangrijkste idee van de inhoud.
batch_size integer 25 Alleen voor de twee overbelasting die een invoer van text[]. Hiermee geeft u het aantal records dat tegelijk moet worden verwerkt.
disable_service_logs boolean false Vlag die aangeeft of servicelogboeken moeten worden uitgeschakeld.
timeout_ms integer NULL Time-out in milliseconden waarna de bewerking is gestopt.
throw_on_error boolean true Vlag die aangeeft of de functie bij een fout een uitzondering moet genereren die resulteert in een terugdraaiactie van de teruglooptransactie.
max_attempts integer 1 Aantal keren dat de aanroep naar Azure AI Services opnieuw moet worden uitgevoerd in het geval van een fout.
retry_delay_ms integer 1000 Hoeveelheid tijd, in milliseconden, om te wachten voordat u het Azure AI Services-eindpunt opnieuw probeert aan te roepen.

Elke functie retourneert een matrix met geëxtraheerde zinnen en een rangschikkingsscore voor elke zin, met behulp van het azure_cognitive.sentence samengestelde type, zoals wordt weergegeven in de onderstaande tabel:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

Het azure_cognitive.sentence is een samengesteld type dat de tekst van een extraf zin en een rangschikkingsscore voor elke zin bevat. De rangscore, een waarde tussen 0 en 1 (inclusief), geeft aan hoe relevant een zin is voor het belangrijkste idee van het oorspronkelijke document. Documentsamenvatting rangschikt geëxtraheerde zinnen en u kunt bepalen of ze worden geretourneerd in de volgorde waarin ze worden weergegeven of volgens hun rang met behulp van de sort_by parameter van de functie.

Extractieve samenvattingen genereren voor eigenschapsbeschrijvingen

Als ontwikkelaar van Margie's Travel wilt u de extractieve samenvattingstechniek evalueren die toegankelijk is via de azure_ai extensie en Azure AI Services en de mogelijkheid van de methode evalueren om beknopte, natuurlijke taalsamenvattingen van lange beschrijvingen van eigenschappen te genereren, zoals deze beschrijving uit de eerste vermelding in de database:

"Maak jezelf thuis in dit charmante appartement met één slaapkamer, centraal gelegen aan de westkant van Queen Anne Hill. Dit elegant ingerichte, privé appartement (onderste eenheid van een duplex) heeft een open plattegrond, bamboe vloeren, een volledig uitgeruste keuken, een tv, dvd-speler, basiskabel en een gezellige slaapkamer met een queen-size bed. De accommodatie slaapt maximaal vier (twee in de slaapkamer en twee op de comfortabele uitvouwbare bank, linnengoed inbegrepen) en omvat gratis Wi-Fi en wasgoed. Het appartement wordt geopend op een eigen terras, compleet met een eigen barbecue, met uitzicht op een tuin en een bos van zwarte bamboe. Het appartement is perfect gelegen op slechts één blok van de buslijnen waar u een bus kunt nemen en het centrum van Seattle in 15 minuten of historische Ballard in 10 kunt nemen. Een korte wandeling van vijf minuten brengt u naar een natuurlijke supermarkt en koffiebars. Of neem een kwartier lopen naar de top van Queen Anne Hill waar u verschillende eclectische winkels, bars en restaurants vindt.

U vraagt een samenvatting van twee zinnen van de bovenstaande eigenschapsbeschrijving aan met behulp van de volgende query:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

Extractieve samenvatting retourneert de twee zinnen met de hoogste score uit de oorspronkelijke tekst, samen met de rangscore voor elk:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}