Extraheerelijke samenvatting uitleggen
Extraheerlijk samenvatting produceert een samenvatting door essentiële zinnen rechtstreeks uit de oorspronkelijke tekst te extraheren. In plaats van nieuwe tekst te genereren, wordt gebruikgemaakt van technieken voor natuurlijke taalverwerking om de zinnen te vinden die gezamenlijk het primaire idee of de context van een document overbrengen.
Extractieve samenvatting wordt bereikt met behulp van de summarize_extractive()
functie die in het azure_cognitive
schema van de azure_ai
extensie is gevonden. Het azure_cognitive
schema bevat drie overbelastingen van de summarize_extractive()
functie. De lijst met argumenten die de drie functie-overbelastingen verwachten, zijn onder andere:
Argument | Type | Default | Beschrijving |
---|---|---|---|
sms verzenden | text of text[] |
De tekst(en) waarvoor samenvattingen moeten worden gegenereerd. | |
language_text | text of text[] |
Taalcode (of matrix met taalcodes) die de taal van de tekst vertegenwoordigt die moet worden samengevat. Bekijk de lijst met ondersteunde talen om de benodigde taalcodes op te halen. | |
sentence_count | integer |
3 | Het aantal samenvattingszinnen dat moet worden gegenereerd. |
sort_by | text |
'offset' | De sorteervolgorde voor de gegenereerde samenvattingszinnen. Acceptabele waarden zijn 'offset' en 'rangschikking', met offset die de beginpositie van elke geëxtraheerde zin binnen de oorspronkelijke inhoud vertegenwoordigt en rangschikking een door AI gegenereerde indicator is van hoe relevant een zin is voor het belangrijkste idee van de inhoud. |
batch_size | integer |
25 | Alleen voor de twee overbelasting die een invoer van text[] . Hiermee geeft u het aantal records dat tegelijk moet worden verwerkt. |
disable_service_logs | boolean |
false | Vlag die aangeeft of servicelogboeken moeten worden uitgeschakeld. |
timeout_ms | integer |
NULL | Time-out in milliseconden waarna de bewerking is gestopt. |
throw_on_error | boolean |
true | Vlag die aangeeft of de functie bij een fout een uitzondering moet genereren die resulteert in een terugdraaiactie van de teruglooptransactie. |
max_attempts | integer |
1 | Aantal keren dat de aanroep naar Azure AI Services opnieuw moet worden uitgevoerd in het geval van een fout. |
retry_delay_ms | integer |
1000 | Hoeveelheid tijd, in milliseconden, om te wachten voordat u het Azure AI Services-eindpunt opnieuw probeert aan te roepen. |
Elke functie retourneert een matrix met geëxtraheerde zinnen en een rangschikkingsscore voor elke zin, met behulp van het azure_cognitive.sentence
samengestelde type, zoals wordt weergegeven in de onderstaande tabel:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
Het azure_cognitive.sentence
is een samengesteld type dat de tekst van een extraf zin en een rangschikkingsscore voor elke zin bevat. De rangscore, een waarde tussen 0 en 1 (inclusief), geeft aan hoe relevant een zin is voor het belangrijkste idee van het oorspronkelijke document. Documentsamenvatting rangschikt geëxtraheerde zinnen en u kunt bepalen of ze worden geretourneerd in de volgorde waarin ze worden weergegeven of volgens hun rang met behulp van de sort_by
parameter van de functie.
Extractieve samenvattingen genereren voor eigenschapsbeschrijvingen
Als ontwikkelaar van Margie's Travel wilt u de extractieve samenvattingstechniek evalueren die toegankelijk is via de azure_ai
extensie en Azure AI Services en de mogelijkheid van de methode evalueren om beknopte, natuurlijke taalsamenvattingen van lange beschrijvingen van eigenschappen te genereren, zoals deze beschrijving uit de eerste vermelding in de database:
"Maak jezelf thuis in dit charmante appartement met één slaapkamer, centraal gelegen aan de westkant van Queen Anne Hill. Dit elegant ingerichte, privé appartement (onderste eenheid van een duplex) heeft een open plattegrond, bamboe vloeren, een volledig uitgeruste keuken, een tv, dvd-speler, basiskabel en een gezellige slaapkamer met een queen-size bed. De accommodatie slaapt maximaal vier (twee in de slaapkamer en twee op de comfortabele uitvouwbare bank, linnengoed inbegrepen) en omvat gratis Wi-Fi en wasgoed. Het appartement wordt geopend op een eigen terras, compleet met een eigen barbecue, met uitzicht op een tuin en een bos van zwarte bamboe. Het appartement is perfect gelegen op slechts één blok van de buslijnen waar u een bus kunt nemen en het centrum van Seattle in 15 minuten of historische Ballard in 10 kunt nemen. Een korte wandeling van vijf minuten brengt u naar een natuurlijke supermarkt en koffiebars. Of neem een kwartier lopen naar de top van Queen Anne Hill waar u verschillende eclectische winkels, bars en restaurants vindt.
U vraagt een samenvatting van twee zinnen van de bovenstaande eigenschapsbeschrijving aan met behulp van de volgende query:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Extractieve samenvatting retourneert de twee zinnen met de hoogste score uit de oorspronkelijke tekst, samen met de rangscore voor elk:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}