Factoides para línguas do Leste Asiático
Os idiomas do Leste Asiático são definidos como japonês, chinês (simplificado), chinês (tradicional) e coreano. Os formatos dentro dos factoides na tabela a seguir são específicos para o reconhecedor de cada idioma.
Por exemplo, o Telefone factoide é diferente em cada língua. Além disso, cada factoide é específico de um reconhecedor particular. Por exemplo, apenas o japonês Telefone factoide pode ser usado com o reconhecedor japonês. Além dos factoides na tabela a seguir, todas as línguas usam os factoides listados em Factoids Common Across Languages.
Observação
Os factoides para idiomas do Leste Asiático são implementados especificando uma lista de caracteres Unicode aceitáveis. Os factoides para as línguas ocidentais são implementados usando expressões regulares que descrevem a entrada esperada. Isso ocorre porque as línguas ocidentais são compostas de letras que são combinadas para formar palavras, enquanto as línguas do leste asiático são baseadas em caracteres.
Reconhecedores de personagens do Leste Asiático suportam a combinação de até dez factoides. Estas combinações factoides empregam um operador lógico OR; portanto, a entrada pode corresponder a qualquer um dos factoides na expressão.
Factoide | OneChar | por cento | Código Postal | UpperChar |
---|---|---|---|---|
Descrição |
Um personagem. |
Números com um símbolo percentual. |
Códigos postais numéricos. |
Caracteres latinos maiúsculos. |
Valores Unicode |
U+0020 U+0021 U+0022 U+0023 U+0024 U+0025 U+0026 U+0027 U+0028 U+0029 U+002A U+002B U+002C U+002D U+002E U+002F U+0030 U+0031 U+0032 U+0033 U+0034 U+0035 U+0036 U+0037 U+0038 U+0039 U+003A U+003B U+003C U+003D U+003E U+003F U+0040 U+0041 U+0042 U+0043 U+0044 U+0045 U+0046 U+0047 U+0048 U+0049 U+004A U+004B U+004C U+004D U+004E U+004F U+0050 U+0051 U+0052 U+0053 U+0054 U+0055 U+0056 U+0057 U+0058 U+0059 U+005A U+005B U+005C U+005D U+005E U+005F U+0060 U+0061 U+0062 U+0063 U+0064 U+0065 U+0066 U+0067 U+0068 U+0069 U+006A U+006B U+006C U+006D U+006E U+006F U+0070 U+0071 U+0072 U+0073 U+0074 U+0075 U+0076 U+0077 U+0078 U+0079 U+007A U+007B U+007C U+007D U+007E |
U+0025 U+002E U+0030 U+0031 U+0032 U+0033 U+0034 U+0035 U+0036 U+0037 U+0038 U+0039 |
U+002D U+0030 U+0031 U+0032 U+0033 U+0034 U+0035 U+0036 U+0037 U+0038 U+0039 |
U+0041 U+0042 U+0043 U+0044 U+0045 U+0046 U+0047 U+0048 U+0049 U+004A U+004B U+004C U+004D U+004E U+004F U+0050 U+0051 U+0052 U+0053 U+0054 U+0055 U+0056 U+0057 U+0058 U+0059 U+005A |
Os tópicos a seguir mostram os formatos suportados para cada factoide em japonês, chinês (simplificado), chinês (tradicional) e coreano.