Поделиться через


Фактоиды для восточноазиатских языков

Восточноазиатские языки определяются как японский, китайский (упрощенное письмо), китайский (традиционный) и корейский. Форматы в пределах фактоидов в следующей таблице зависят от распознавателя каждого языка.

Например, телефонной фактоид отличается в каждом языке. Кроме того, каждый фактоид зависит от определенного распознавателя. Например, с японским распознавательом можно использовать только японский телефонный фактоид. Помимо фактоидов в следующей таблице все языки используют фактоиды, перечисленные в Factoids Common Languages.

Заметка

Фактоиды для восточноазиатских языков реализуются путем указания списка допустимых символов Юникода. Фактоиды для западных языков реализуются с помощью регулярных выражений, описывающих ожидаемые входные данные. Это связано с тем, что западные языки состоят из букв, которые объединяются для создания слов, в то время как восточноазиатские языки основаны на символах.

Распознаватели восточноазиатских символов поддерживают объединение до десяти фактоидов вместе. Эти сочетания фактоидов используют логический оператор OR; таким образом, входные данные могут соответствовать любому из фактоидов в выражении.

Фактоид OneChar процент почтовых индексов UpperChar
Описание
Один символ.
Числа с символом процента.
Числовые почтовые индексы.
Символы латинского скрипта в верхнем регистре.
Значения Юникода
U+0020
U+0021
U+0022
U+0023
U+0024
U+0025
U+0026
U+0027
U+0028
U+0029
U+002A
U+002B
U+002C
U+002D
U+002E
U+002F
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+003A
U+003B
U+003C
U+003D
U+003E
U+003F
U+0040
U+0041
U+0042
U+0043
U+0044
U+0045
U+0046
U+0047
U+0048
U+0049
U+004A
U+004B
U+004C
U+004D
U+004E
U+004F
U+0050
U+0051
U+0052
U+0053
U+0054
U+0055
U+0056
U+0057
U+0058
U+0059
U+005A
U+005B
U+005C
U+005D
U+005E
U+005F
U+0060
U+0061
U+0062
U+0063
U+0064
U+0065
U+0066
U+0067
U+0068
U+0069
U+006A
U+006B
U+006C
U+006D
U+006E
U+006F
U+0070
U+0071
U+0072
U+0073
U+0074
U+0075
U+0076
U+0077
U+0078
U+0079
U+007A
U+007B
U+007C
U+007D
U+007E
U+0025
U+002E
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+002D
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+0041
U+0042
U+0043
U+0044
U+0045
U+0046
U+0047
U+0048
U+0049
U+004A
U+004B
U+004C
U+004D
U+004E
U+004F
U+0050
U+0051
U+0052
U+0053
U+0054
U+0055
U+0056
U+0057
U+0058
U+0059
U+005A

В следующих разделах показаны форматы, поддерживаемые для каждого фактоида на японском, китайском (упрощенном языке), китайском (традиционном) и корейском языке.