문자 이스케이프
업데이트: 2007년 11월
대부분의 주요 정규식 언어 연산자는 이스케이프되지 않은 단일 문자입니다. 정규식 파서에서는 이스케이프 문자 \(단일 백슬래시) 다음에 나오는 문자를 연산자로 인식하지 않습니다. 예를 들어, 정규식 파서에서는 별표(*)를 반복 수량자로 취급하고 백슬래시 뒤에 별표가 있으면(\*) 유니코드 문자 002A로 간주합니다.
다음 표에는 정규식과 바꾸기 패턴에서 모두 인식되는 문자 이스케이프가 나열되어 있습니다.
이스케이프된 문자 |
설명 |
||
---|---|---|---|
일반 문자 |
. $ ^ { [ ( | ) * + ? \ 이외의 문자는 문자 그 자체를 나타냅니다. $ ^ { [ ( | ) * + ? |
||
\a |
벨(경보)을 의미하는 \u0007을 나타냅니다. |
||
\b |
[] 문자 클래스에 포함된 경우에는 백스페이스인 \u0008을 나타냅니다. 그렇지 않은 경우에 대해서는 표 아래의 "참고"에 설명되어 있습니다. |
||
\t |
탭을 의미하는 \u0009를 나타냅니다. |
||
\r |
캐리지 리턴 문자인 \u000D를 나타냅니다. |
||
\v |
세로 탭인 \u000B를 나타냅니다. |
||
\f |
용지 공급을 의미하는 \u000C를 나타냅니다. |
||
\n |
줄 바꿈을 의미하는 \u000A를 나타냅니다. |
||
\e |
이스케이프인 \u001B를 나타냅니다. |
||
\040 |
문자 번호를 8진수로 표시(최대 세 자리)한 ASCII 문자입니다. 앞에 0이 없는 경우, 한 자리 숫자이거나 캡처하는 그룹 번호에 해당하면 역참조를 나타냅니다. 자세한 내용은 역참조를 참조하십시오. 예를 들어, 문자 \040은 공백을 나타냅니다. |
||
\x20 |
문자 번호를 16진수로 표시(두 자리)한 ASCII 문자입니다. |
||
\cC |
해당 ASCII 제어 문자를 나타냅니다. 예를 들어, \cC는 제어 문자 C를 나타냅니다. |
||
\u0020 |
문자 번호를 16진수로 표시(네 자리)한 유니코드 문자입니다.
|
||
\ |
이스케이프된 문자로 인식되지 않는 문자를 이 문자 다음에 넣어 문자 자체를 나타냅니다. 예를 들어, \*는 \x2A와 같습니다. |
참고: |
---|
이스케이프된 문자 \b는 특별한 경우입니다. 정규식에서 사용할 때 \b는 단어 경계(\w와 \W 문자 사이)를 나타내지만 [] 문자 클래스 내에서는 예외적으로 \b가 백스페이스 문자를 나타냅니다. 바꾸기 패턴에서 \b는 항상 백스페이스를 나타냅니다. |