[用語抽出変換エディタ] ([詳細設定] タブ)
[用語抽出変換エディタ] ダイアログ ボックスの [詳細設定] タブを使用すると、頻度、長さ、語または句の抽出など、抽出に関するプロパティを指定できます。
用語抽出変換の詳細については、「用語抽出変換」を参照してください。
オプション
- [名詞]
変換によって個別の名詞のみを抽出するように指定します。
- [名詞句]
変換によって個別の名詞句のみを抽出するように指定します。
- [名詞と名詞句]
変換によって名詞と名詞句を両方とも抽出するように指定します。
- [頻度]
スコアが用語の頻度であることを指定します。
- [TFIDF]
スコアが用語の TFIDF 値であることを指定します。TFIDF スコアは、Term Frequency と Inverse Document Frequency の積です。用語 T の TFIDF = (T の使用頻度) * log( (入力された行数) / (T の含まれる行数) ) として定義されます。
- [頻度のしきい値]
語または句を抽出する前の語または句の出現回数を指定します。既定値は 2 です。
- [用語の最大長]
句の最大長を語数で指定します。このオプションは、名詞句のみに影響を与えます。既定値は 12 です。
- [用語抽出で大文字と小文字を区別する]
抽出で大文字と小文字を区別するかどうかを指定します。既定値は False です。
- [エラー出力の構成]
[エラー出力の構成] ダイアログ ボックスを使用すると、エラーが発生した行に対するエラー処理を指定できます。
参照
関連項目
[用語抽出変換エディタ] ([用語抽出] タブ)
[用語抽出変換エディタ] ([除外] タブ)
その他の技術情報
Integration Services のエラーおよびメッセージのリファレンス
用語参照変換