Erklären der extrahierenden Zusammenfassung

Abgeschlossen

Die Extrahierende Zusammenfassung erzeugt eine Zusammenfassung, indem wesentliche Sätze direkt aus dem Originaltext extrahiert werden. Anstatt neuen Text zu generieren, verwendet es Techniken zur Verarbeitung natürlicher Sprache, um die Sätze zu finden, die zusammen die primäre Idee oder den Kontext eines Dokuments vermitteln.

Die extrahierende Zusammenfassung erfolgt mithilfe der summarize_extractive()-Funktion, die im azure_cognitive-Schema der azure_ai-Erweiterung enthalten ist. Das azure_cognitive-Schema enthält drei Überladungen der summarize_extractive()-Funktion. Die Liste der Argumente, welche die drei erwarteten Funktionsüberladungen umfassen:

Argument Typ Standard Beschreibung
Text text oder text[] Die Texte, für die Zusammenfassungen generiert werden sollen.
language_text text oder text[] Sprachcode (oder Array von Sprachcodes), der die Sprache des zusammenzufassenden Texts darstellt. Überprüfen Sie die Liste der unterstützten Sprachen, um die erforderlichen Sprachcodes abzurufen.
sentence_count integer 3 Die Anzahl der zu generierenden Sammelsätze.
sort_by text 'offset' Die Sortierreihenfolge für die generierten Sammelsätze. Zulässige Werte sind „offset“ und „rank“, wobei der Offset die Startposition jedes extrahierten Satzes innerhalb des ursprünglichen Inhalts darstellt und als KI-generierter Indikator für die Relevanz eines Satzes für die Hauptidee des Inhalts einen Rang zuweist.
batch_size integer 25 Nur für die beiden Überladungen, die eine Eingabe von text[] erwarten. Gibt die Anzahl der gleichzeitig zu verarbeitenden Datensätze an.
disable_service_logs boolean false Flag, das angibt, ob Dienstprotokolle deaktiviert werden sollen.
timeout_ms integer NULL Timeout in Millisekunden, nach dem der Vorgang beendet wird.
throw_on_error boolean true Kennzeichnung, die angibt, ob die Funktion beim Fehler eine Ausnahme auslösen soll, was zu einem Rollback der Umbruchtransaktionen führt.
max_attempts integer 1 Anzahl der Wiederholungen des Aufrufs an die Azure KI Services im Falle eines Fehlers.
retry_delay_ms integer 1.000 Die Zeit (in Millisekunden), die gewartet werden muss, bevor versucht wird, den Azure KI Services-Endpunkt erneut aufzurufen.

Jede Funktion gibt ein Array extrahierter Sätze und einer Priorisierungsbewertung für jeden Satz zurück, wobei der zusammengesetzte Typ azure_cognitive.sentence verwendet wird, wie in der folgenden Tabelle dargestellt:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

Die azure_cognitive.sentence ist ein zusammengesetzter Typ, der den Text eines extrahierenden Satzes und eine Priorisierungsbewertung für jeden Satz enthält. Die Priorisierungsbewertung, ein Wert zwischen 0 und 1 (inklusiv), gibt an, wie relevant ein Satz für die Hauptidee des ursprünglichen Dokuments ist. Die Dokumentzusammenfassung bewertet extrahierte Sätze, und Sie können bestimmen, ob sie in der Reihenfolge zurückgegeben werden, in der sie erscheinen oder entsprechend ihrer Rangfolge mithilfe des sort_by-Parameters der Funktion.

Generieren von extrahierenden Zusammenfassungen für Eigenschaftenbeschreibungen

Als Entwickler für Margies Travel möchten Sie die extrahierende Zusammenfassungstechnik auswerten, die über die azure_ai-Erweiterung und Azure KI Services zugänglich ist, und die Fähigkeit der Methode bewerten, präzise, natürliche Sprachzusammenfassungen von langwierigen Eigenschaftenbeschreibungen zu generieren, z. B. diese Beschreibung aus dem ersten Listing in der Datenbank:

„Fühlen Sie sich zu Hause in dieser charmanten Ein-Zimmer-Wohnung, zentral auf der Westseite von Queen Anne Hill. Diese elegant eingerichtete, private Wohnung (untere Einheit eines Duplexs) verfügt über einen offenen Grundriss, Bambusböden, eine voll ausgestattete Küche, einen Fernseher, DVD-Player, einfaches Kabelfernsehen und ein gemütliches Schlafzimmer mit einem Queen-Bett. Die Einheit hat Schlafplätze für bis zu vier Personen (zwei im Schlafzimmer und zwei auf der komfortablen ausfaltbaren Couch, Bettwäsche inklusive) und beinhaltet kostenloses WLAN und eine Möglichkeit zum Wäsche waschen. Die Wohnung hat einen privaten Balkon, komplett mit eigenem Grill, mit Blick auf einen Garten und einen Wald mit schwarzem Bambus. Das Apartment ist perfekt gelegen nur einen Block von den Buslinien entfernt, wo Sie einen Bus nehmen können, mit dem Sie in 15 Minuten die Innenstadt von Seattle oder in 10 Minuten den historischen Ballard erreichen. Ein schneller fünfminütiger Spaziergang bringt Sie zu einem Lebensmittelgeschäft und Cafés. Oder gehen Sie nur 15 Minuten zum Gipfel von Queen Anne Hill, wo Sie vielseitige Geschäfte, Bars und Restaurants finden.“

Sie fordern eine Zusammenfassung in zwei Sätzen der obigen Eigenschaftsbeschreibung mithilfe der folgenden Abfrage an:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

Die extrahierende Zusammenfassung gibt die beiden Sätze mit der höchsten Punktzahl aus dem ursprünglichen Text zusammen mit der Priorisierungsbewertung für die einzelnen Sätze zurück:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}