东亚语言的 Factoid

东亚语言定义为日语、中文 (简体中文) 、中文 (繁体中文) 和朝鲜语。 下表中 factoid 中的格式特定于每种语言的识别器。

例如, 电话 事实说明在每种语言中都是不同的。 此外,每个 factoid 都特定于特定的识别器。 例如,只有日语 电话 事实数据表可以与日语识别器一起使用。 除了下表中的 factoid 之外,所有语言都使用 Factoids Common Across Languages 中列出的 factoid

注意

东亚语言的 factoid 是通过指定可接受的 Unicode 字符列表来实现的。 西方语言的 factoid 是通过使用描述预期输入的正则表达式实现的。 这是因为西方语言由组合成单词的字母组成,而东亚语言则基于字符。

东亚字符的识别器支持将最多十个事实组合在一起。 这些事实组合使用逻辑 OR 运算符;因此,输入可以匹配表达式中的任何事实。

Factoid OneChar 百分比 PostalCode UpperChar
说明
一个字符。
具有百分比符号的数字。
数字邮政编码。
大写拉丁文脚本字符。
Unicode 值
U+0020
U+0021
U+0022
U+0023
U+0024
U+0025
U+0026
U+0027
U+0028
U+0029
U+002A
U+002B
U+002C
U+002D
U+002E
U+002F
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+003A
U+003B
U+003C
U+003D
U+003E
U+003F
U+0040
U+0041
U+0042
U+0043
U+0044
U+0045
U+0046
U+0047
U+0048
U+0049
U+004A
U+004B
U+004C
U+004D
U+004E
U+004F
U+0050
U+0051
U+0052
U+0053
U+0054
U+0055
U+0056
U+0057
U+0058
U+0059
U+005A
U+005B
U+005C
U+005D
U+005E
U+005F
U+0060
U+0061
U+0062
U+0063
U+0064
U+0065
U+0066
U+0067
U+0068
U+0069
U+006A
U+006B
U+006C
U+006D
U+006E
U+006F
U+0070
U+0071
U+0072
U+0073
U+0074
U+0075
U+0076
U+0077
U+0078
U+0079
U+007A
U+007B
U+007C
U+007D
U+007E
U+0025
U+002E
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+002D
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+0041
U+0042
U+0043
U+0044
U+0045
U+0046
U+0047
U+0048
U+0049
U+004A
U+004B
U+004C
U+004D
U+004E
U+004F
U+0050
U+0051
U+0052
U+0053
U+0054
U+0055
U+0056
U+0057
U+0058
U+0059
U+005A

以下主题显示了日语、中文 (简体) 、中文 (繁体中文) 和朝鲜语支持的格式。