Zeichensätze
Ein "Zeichensatz" ist eine Zuordnung von Zeichen zu ihren identifizierenden Codewerten. Der Zeichensatz, der heute am häufigsten auf Computern verwendet wird, ist Unicode, ein globaler Standard für die Zeichencodierung. Intern verwenden Windows-Anwendungen die UTF-16-Implementierung von Unicode. In UTF-16 werden die meisten Zeichen durch Zwei-Byte-Codes identifiziert. Die weniger häufig verwendeten ergänzenden Zeichen werden jeweils durch ein Ersatzzeichenpaar dargestellt, bei dem es sich um ein Paar aus Zwei-Byte-Codes handelt. Weitere Informationen finden Sie unter Ersatzzeichen und Ergänzende Zeichen.
Einige Windows-Anwendungen müssen mit den älteren Zeichensätzen funktionieren, die nativ für Windows Me/98/95 sind. Windows-Codepages ermöglichen es Ihrer Anwendung, mit diesen Zeichensätzen zu arbeiten. Diese Zeichensätze können unterteilt werden in:
- Single-Byte-Zeichensätze (Single-Byte Character Sets , SBCS). In einem SBCS wird jedes Zeichen durch einen Wert von einem Byte breit identifiziert.
- Multibyte-Zeichensätze, insbesondere die Double-Byte-Zeichensätze (DBCS). Multibytezeichensätze bieten ein Mittel zur Darstellung der großen Anzahl von Zeichen in vielen asiatischen Sprachen.
Weitere Informationen finden Sie in den folgenden Themen:
Zugehörige Themen