Invoertekenset (Entiteit SQL)
Entity SQL accepteert UNICODE-tekens die zijn gecodeerd in UTF-16.
Letterlijke tekenreeksen kunnen een UTF-16-teken tussen enkele aanhalingstekens bevatten. Bijvoorbeeld N'文字列リテラル'. Wanneer letterlijke tekenreeksen worden vergeleken, worden de oorspronkelijke UTF-16-waarden gebruikt. N'ABC' is bijvoorbeeld anders in Japanse en Latijnse codepagina's.
Opmerkingen kunnen een UTF-16-teken bevatten.
Escape-id's kunnen elk UTF-16-teken tussen vierkante haken bevatten. Bijvoorbeeld [エスケープされた識別子]. De vergelijking van UTF-16 escaped id's is niet hoofdlettergevoelig. Entity SQL behandelt versies van letters die hetzelfde lijken, maar afkomstig zijn van verschillende codepagina's als verschillende tekens. [ABC] is bijvoorbeeld gelijk aan [abc] als de bijbehorende tekens afkomstig zijn van dezelfde codepagina. Als dezelfde twee id's echter afkomstig zijn van verschillende codepagina's, zijn ze niet gelijkwaardig.
Witruimte is een UTF-16 witruimteteken.
Een nieuwe regel is een genormaliseerd UTF-16-teken. '\n' en '\r\n' worden bijvoorbeeld beschouwd als nieuweregeltekens, maar '\r' is geen nieuwlijnteken.
Trefwoorden, expressies en interpunctie kunnen UTF-16 tekens zijn die worden genormaliseerd naar Latijns. SELECT in een Japanse codepagina is bijvoorbeeld een geldig trefwoord.
Trefwoorden, expressies en leestekens kunnen alleen Latijnse tekens zijn. SELECT
in een Japanse codepagina is geen trefwoord. +, -, *, /, =, (, ), ', [, ] en andere taalconstructies die hier niet worden genoemd, kunnen alleen Latijnse tekens zijn.
Eenvoudige id's kunnen alleen Latijnse tekens zijn. Dit voorkomt dubbelzinnigheid tijdens de vergelijking, omdat oorspronkelijke waarden worden vergeleken. ABC is bijvoorbeeld anders in Japanse en Latijnse codepagina's.