次の方法で共有


東アジア言語のファクトロイド

東アジア言語は、日本語、中国語 (簡体字)、中国語 (繁体字)、韓国語として定義されます。 次の表の factoid 内の形式は、各言語の認識エンジンに固有です。

たとえば、 電話 ファクトロイドは言語ごとに異なります。 さらに、各 factoid は特定の認識エンジンに固有です。 たとえば、日本語認識エンジンで使用できるのは、日本語 電話 ファクトロイドだけです。 次の表の factoid に加えて、すべての言語で Factoids Common Across Languages に記載されている factoid が使用されます

注意

東アジア言語の factoid は、許容される Unicode 文字の一覧を指定することによって実装されます。 西洋言語の factoid は、予期される入力を記述する正規表現を使用して実装されます。 これは、西洋言語は単語を作成するために結合された文字で構成されているのに対し、東アジア言語は文字ベースであるためです。

東アジア文字の認識エンジンは、最大 10 個のファクトを組み合わせることをサポートしています。 これらの factoid の組み合わせは論理 OR 演算子を使用します。したがって、入力は式内の任意の factoid と一致する可能性があります。

擬似 事実 OneChar Percent PostalCode UpperChar
説明
1 文字。
パーセント記号を持つ数値。
数値の郵便番号。
大文字のラテン文字スクリプト文字。
Unicode 値
U+0020
U+0021
U+0022
U+0023
U+0024
U+0025
U+0026
U+0027
U+0028
U+0029
U+002A
U+002B
U+002C
U+002D
U+002E
U+002F
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+003A
U+003B
U+003C
U+003D
U+003E
U+003F
U+0040
U+0041
U+0042
U+0043
U+0044
U+0045
U+0046
U+0047
U+0048
U+0049
U+004A
U+004B
U+004C
U+004D
U+004E
U+004F
U+0050
U+0051
U+0052
U+0053
U+0054
U+0055
U+0056
U+0057
U+0058
U+0059
U+005A
U+005B
U+005C
U+005D
U+005E
U+005F
U+0060
U+0061
U+0062
U+0063
U+0064
U+0065
U+0066
U+0067
U+0068
U+0069
U+006A
U+006B
U+006C
U+006D
U+006E
U+006F
U+0070
U+0071
U+0072
U+0073
U+0074
U+0075
U+0076
U+0077
U+0078
U+0079
U+007A
U+007B
U+007C
U+007D
U+007E
U+0025
U+002E
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+002D
U+0030
U+0031
U+0032
U+0033
U+0034
U+0035
U+0036
U+0037
U+0038
U+0039
U+0041
U+0042
U+0043
U+0044
U+0045
U+0046
U+0047
U+0048
U+0049
U+004A
U+004B
U+004C
U+004D
U+004E
U+004F
U+0050
U+0051
U+0052
U+0053
U+0054
U+0055
U+0056
U+0057
U+0058
U+0059
U+005A

次のトピックでは、各 factoid でサポートされている形式を日本語、中国語 (簡体字)、中国語 (繁体字)、韓国語で示します。