문자 및 엔터티 참조
문자 및 엔터티 참조를 사용하면 문서에 직접 문자를 입력하는 대신 참조에 의해 XML 문서에 정보를 포함할 수 있습니다. 이는 다음과 같은 경우 유용합니다.
문서에서 문자가 태그로 해석되기 때문에 문서에 직접 문자를 입력할 수 없는 경우
입력 장치 제한으로 인해 문서에 직접 문자를 입력할 수 없는 경우
1바이트 문자로 제한되는 프로세서를 통해 안전하게 문자를 전송할 수 없는 경우
문자열 또는 문서 단편이 반복적으로 나타나며 간략화할 수 있는 경우
내용 표현에 대해 XML에서는 앰퍼샌드(&)로 시작하여 세미콜론(;)으로 끝나는 여러 가지 구문을 제공합니다.
문자 참조를 통해 유니코드 코드 포인트를 가리키는 숫자로 식별되는 유니코드 문자를 삽입할 수 있습니다. 10진수 또는 16진수 노테이션을 사용하여 코드 포인트를 식별할 수 있습니다.
- & #value;
10진수 참조에 사용되는 구문입니다.
- &# xvalue;
16진수 참조에 사용되는 구문입니다.
예를 들어, 여전히 대부분의 키보드에 없는 유로 기호를 삽입하려면 €
또는 €
를 문서에 삽입합니다.
다음 표에는 XML 태그에 사용되는 문자의 기본 제공 엔터티 5개가 나열되어 있습니다.
엔터티 | 엔터티 참조 | 의미 |
---|---|---|
lt |
< |
<(보다 작음) |
gt |
> |
>(보다 큼) |
amp |
& |
&(앰퍼샌드) |
apos |
' |
'(아포스트로피 또는 작은따옴표) |
quot |
" |
"(큰따옴표) |
문자로 인해 XML 파서에서 문서 구조를 잘못 해석할 수 있을 경우 문자를 입력하는 대신 엔터티를 사용합니다. '
및 "
엔터티 참조는 특성 값에서 가장 일반적으로 사용됩니다.
예를 들어, Me&You를 쓰려면 Me&You
를 사용하고 a<b를 쓰려면 a<b
를 사용합니다. 또한 b>c를 쓰려면 b>c
를 사용합니다.
HTML에서 HTML에 사용할 엔터티 집합을 정의하는 것과 마찬가지로 사용자 지정 엔터티도 정의할 수 있습니다. '
는 HTML 파일로 인식되지 않습니다. HTML로 변환할 경우 $#....
를 사용해야 합니다.
엔터티를 정의한 DTD(문서 종류 정의)로 작업하는 경우 다음 구문을 사용하여 문서 내용에서 이 엔터티를 참조할 수 있습니다.
&entityName;