抽出要約について
抽出要約は、元のテキストから重要な文を直接抽出することによって要約を生成します。 新たなテキストを生成するのではなく、自然言語処理手法を使用して、ドキュメントの主要な考えまたはコンテキストをまとめて伝える文を見つけます。
抽出要約は、azure_ai
拡張機能の azure_cognitive
スキーマにある summarize_extractive()
関数を使用して実行されます。 azure_cognitive
スキーマには、summarize_extractive()
関数の 3 つのオーバーロードが含まれています。 3 つの関数オーバーロードで想定される引数の一覧を次に示します。
引数 | 型 | Default | 説明 |
---|---|---|---|
text | text または text[] |
概要を生成するテキスト。 | |
language_text | text または text[] |
要約するテキストの言語を表す言語コード (または言語コードの配列)。 サポートされている言語のリストを確認して、必要な言語コードを取得します。 | |
sentence_count | integer |
3 | 生成する要約文の数。 |
sort_by | text |
'offset' | 生成された要約文の並べ替え順序。 指定できる値は "offset" と "rank" で、"offset" は元のコンテンツ内の抽出された各文の開始位置を表し、"rank" は文がコンテンツの主要な概念にどれほど関連しているかを示す AI 生成インジケーターになります。 |
batch_size | integer |
25 | text[] の入力を期待する 2 つのオーバーロード専用。 同時に処理する行数を指定します。 |
disable_service_logs | boolean |
false | サービス ログをオフにするかどうかを示すフラグ。 |
timeout_ms | integer |
NULL | 操作が停止するまでのタイムアウト時間 (ミリ秒単位)。 |
throw_on_error | boolean |
true | 関数がエラー時に例外をスローしてトランザクションの折り返しのロールバックを行うかどうかを示すフラグ。 |
max_attempts | integer |
1 | エラー発生時の Azure AI サービスへの呼び出しの再試行回数。 |
retry_delay_ms | integer |
1000 | Azure AI サービス エンドポイントの呼び出しを再試行する前の待機時間 (ミリ秒単位)。 |
各関数は、次の表に示すように、azure_cognitive.sentence
複合型を使用して、抽出された文の配列と各文のランク スコアを返します。
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
azure_cognitive.sentence
は、抽出文のテキストと各文のランク スコアを含む複合型です。 ランク スコアは、0 から 1 (両端を含む) の値で、文が元のドキュメントの主要な考えにどの程度関連しているかを示します。 ドキュメント要約では、抽出された文がランク付けされ、関数の sort_by
パラメーターを使用して、出現順に返すか、ランクに従って返すかを決定できます。
プロパティの説明の抽出の概要を生成する
あなたは Margie's Travel の開発者として、azure_ai
拡張機能と Azure AI サービスから利用できる抽出要約手法を評価する必要があります。データベースの最初の一覧から次のような、長いプロパティの説明の簡潔で自然な言語の要約を生成する能力について評価します。
"クイーン・アン・ヒルの西側に位置する魅力的な 1 ベッドルームのアパートメントで、おくつろぎください。 エレガントな内装のプライベート アパートメントで、デュプレックスの 1 階部分は開放的な空間になっており、竹の床、設備が充実したキッチン、テレビ、DVD プレーヤー、基本的なケーブルが完備され、快適なベッドルーム (クイーンサイズ ベッド 1 台付) があります。 このアパートメントには最大 4 名まで宿泊可能で (ベッドルームに 2 名、快適な折りたたみ式ソファに 2 名)、4 名分のアメニティが含まれています。無料 Wi-Fi とランドリーも利用可能です。 このアパートメントには専用デッキがあり、バルコニーからは庭園と黒竹の竹林を見渡せます。 路線バスのバス停からわずか 1 ブロックに位置し、バスでシアトルのダウンタウンまで 15 分、歴史情緒あふれるバラードまで 10 分です。 徒歩 5 分圏内に自然食料を扱う店やコーヒー ショップがあります。 また、クイーン・アン・ヒルの頂上まで徒歩 15 分で、そこには様々な店があり、バーやレストランもあります。"
次のクエリを使用して、上記のプロパティの説明を 2 文に要約することを要求します。
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
抽出要約では、元のテキストから最もスコアの高い 2 つの文と、それぞれのランク スコアが返されます。
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}