エスケープ シーケンスと制御文字の使用
アプリケーションは、文字列を ASCII または Windows (ANSI) コード ページ から Unicode に変換する場合、エスケープ シーケンスを文字単位で Unicode に変換する必要があります。 ASCII またはその他の 8 ビット テキスト ファイルが Unicode に変換されると、その後変換が戻される可能性があります。 エスケープ シーケンスを 1 つの Unicode 文字として組み合わせる代わりに、文字単位で Unicode に変換すると、エスケープ シーケンスを認識して解析しなくても逆変換を実行できます。 たとえば、ESC + A は、0x411Bではなく0x001B (ESC)、0x0041 (A) になります。
Unicode の最初の 32 の 16 ビット コード値は、32 個の制御文字を対象としています。 この仕様では、書式設定のためにコントロール文字の既存の使用がサポートされています。 Unicode アプリケーションでは、これらの制御文字を ASCII と同等の方法で処理するのとまったく同じ方法で処理できます。
関連トピック