동아시아 언어에 대한 Factoid
동아시아 언어는 일본어, 중국어(간체), 중국어(번체) 및 한국어로 정의됩니다. 다음 표의 factoids 내의 형식은 각 언어의 인식기별로 다릅니다.
예를 들어 전화 팩토이드는 각 언어마다 다릅니다. 또한 각 factoid는 특정 인식기와 관련이 있습니다. 예를 들어 일본 어 전화 팩토이드만 일본어 인식기에서 사용할 수 있습니다. 다음 표의 factoids 외에도 모든 언어는 Factoids Commonacross Languages에 나열된 factoid를 사용합니다.
참고
동아시아 언어에 대한 factoid는 허용 가능한 유니코드 문자 목록을 지정하여 구현됩니다. 서양 언어에 대한 factoid는 예상된 입력을 설명하는 정규식을 사용하여 구현됩니다. 이는 서양 언어가 단어를 만들기 위해 결합된 문자로 구성된 반면 동아시아 언어는 문자 기반이기 때문입니다.
동아시아 문자 인식기는 최대 10개의 팩토이드를 함께 결합하는 것을 지원합니다. 이러한 팩토이드 조합은 논리적 OR 연산자를 사용합니다. 따라서 입력은 식의 팩토이드와 일치할 수 있습니다.
Factoid | OneChar | 퍼센트 | PostalCode | UpperChar |
---|---|---|---|---|
Description |
한 문자. |
백분율 기호가 있는 숫자입니다. |
숫자 우편 번호입니다. |
대문자 라틴어 스크립트 문자입니다. |
유니코드 값 |
U+0020 U+0021 U+0022 U+0023 U+0024 U+0025 U+0026 U+0027 U+0028 U+0029 U+002A U+002B U+002C U+002D U+002E U+002F U+0030 U+0031 U+0032 U+0033 U+0034 U+0035 U+0036 U+0037 U+0038 U+0039 U+003A U+003B U+003C U+003D U+003E U+003F U+0040 U+0041 U+0042 U+0043 U+0044 U+0045 U+0046 U+0047 U+0048 U+0049 U+004A U+004B U+004C U+004D U+004E U+004F U+0050 U+0051 U+0052 U+0053 U+0054 U+0055 U+0056 U+0057 U+0058 U+0059 U+005A U+005B U+005C U+005D U+005E U+005F U+0060 U+0061 U+0062 U+0063 U+0064 U+0065 U+0066 U+0067 U+0068 U+0069 U+006A U+006B U+006C U+006D U+006E U+006F U+0070 U+0071 U+0072 U+0073 U+0074 U+0075 U+0076 U+0077 U+0078 U+0079 U+007A U+007B U+007C U+007D U+007E |
U+0025 U+002E U+0030 U+0031 U+0032 U+0033 U+0034 U+0035 U+0036 U+0037 U+0038 U+0039 |
U+002D U+0030 U+0031 U+0032 U+0033 U+0034 U+0035 U+0036 U+0037 U+0038 U+0039 |
U+0041 U+0042 U+0043 U+0044 U+0045 U+0046 U+0047 U+0048 U+0049 U+004A U+004B U+004C U+004D U+004E U+004F U+0050 U+0051 U+0052 U+0053 U+0054 U+0055 U+0056 U+0057 U+0058 U+0059 U+005A |
다음 topics 일본어, 중국어(간체), 중국어(번체) 및 한국어로 각 팩토이드에 지원되는 형식을 보여 줍니다.