Integration Services の国際化に関する注意点
Microsoft SQL Server 2005 Integration Services は、多言語データの解析および操作と、すべての Windows ロケールをサポートし、文字列データの並べ替えおよび比較のための特殊な比較オプションを提供します。
テキスト マイニングのための Integration Services 変換およびあいまい一致は、英語が使用された場合に比べて英語以外の言語でうまく動作しない可能性があります。ただし、テキスト マイニングおよびあいまい一致変換のどちらも、英語以外の言語で使用したときに、言語によっては有用な結果が得られる場合もあります。
ロケールに非依存の解析
Integration Services には、特定の形式のデータに対して使用できる、ロケールに非依存の解析ルーチンが含まれています。総称して「高速解析」と呼ばれるこれらの解析ルーチンでは、最もよく使用される日付形式表現だけがサポートされます。これらの解析ルーチンでは、ロケール固有の解析、通貨データの特殊文字の認識、整数の 16 進表現または科学的表現の変換を行うことができません。高速解析は、ロケール依存関係を持たない Integration Services パッケージのパフォーマンスを大幅に改善できます。詳細については、「データの解析」を参照してください。
ロケール設定
Integration Services では、パッケージ オブジェクト、コンテナ、タスク、およびデータ フロー コンポーネントのレベルでロケールをサポートしています。また、イベント ハンドラのロケールも設定できます。
1 つのパッケージで複数の異なるロケールを使用できます。たとえば、パッケージで英語 (米国) ロケールを使用している一方で、パッケージ内の 1 つのタスクでドイツ語 (ドイツ) ロケールを使用し、別のタスクで日本語 (日本) ロケールを使用できます。
Integration Services パッケージでは、任意の Windows ロケールを使用できます。ロケールは、パッケージを作成するときに設定できます。ロケールのプロパティを更新する構成を使用していない限り、パッケージは、開発環境と異なる地域と言語のオプションが使用されているコンピュータに配置されたときでも同じ動作を行うことが保証されます。
ただし、パッケージを異なるサーバーに配置するときに異なるロケールを使用する必要がある場合は、パッケージの実行時に使用する、更新されたロケールを提供する構成を作成できます。詳細については、「パッケージのプロパティの設定」および「パッケージ構成」を参照してください。
比較オプション
ロケールは、データ フロー内の文字列データを比較するための基本的な規則を提供します。たとえば、ロケールは、アルファベットの各文字の並べ替え位置を指定します。ただし、目的の比較操作を行うのにこれらの規則では不十分な場合もあります。そこで、Integration Services では、ロケールの比較規則を超える高度な比較オプションのセットをサポートしています。たとえば、分音文字を無視することを選択した場合、比較目的では "a" と "á" は等価です。詳細については、「文字列データの比較」を参照してください。
テキスト マイニング
テキスト マイニングのための変換である用語抽出と用語参照では、独自の辞書が使用されます。この辞書は英語版のみ用意されていて、英語以外の言語でテキスト マイニング変換を使用した場合の結果は制限される場合があります。Microsoft では、英語での使用のみこれらの変換をサポートします。
ただし、英語以外の言語と英語との間の言語的類似性によっては、テキスト抽出変換で英語以外の言語の用語を抽出できる場合があります。また、用語参照変換を使用して、用語を参照したり、用語の頻度を計算したりできる場合もあります。言語間の類似性が大きいほど、用語マイニングが成功する可能性が高くなります。たとえば、スウェーデン語では英語に類似した単語および文の区切り記号が使用されているので、用語抽出変換をスウェーデン語の文字列のテキスト マイニングに使用することは効果的です。これに対し、日本語に対してテキスト抽出変換を使用しても、良い結果は得られません。詳細については、「用語抽出変換」および「用語参照変換」を参照してください。
あいまい一致
あいまいグループ化とあいまい参照の 2 つの変換では、データセット内の類似レコードをグループ化したり、参照テーブル内で参照を実行したりする場合に、あいまい一致を使用します。どちらの変換でも、空白または区切り記号で区切られた複数の長い単語がテキスト データに含まれている場合に、最も効果的な照合を行うことができます。単語がいくつかの文字から構成されて空白で区切られないことが多い中国語のような表意言語には、これらの変換は対応できない場合があります。通常、表意言語では、これらの変換は、スペルミス、余分な単語、および欠落している単語を検出することが困難になります。詳細については、「あいまいグループ化変換」および「あいまい参照変換」を参照してください。
参照
概念
SQL Server Integration Services