Extrair datas e números de documentos
Embora muitos campos a serem extraídos sejam textos simples, há casos em que a informação a ser extraída é uma data ou um número incluindo valores.
Importar esses dados para um sistema de destino pode ser complicado, exigindo bastante lógica de conversão personalizada. A maioria dos conectores de importação e APIs aceitam apenas datas normalizadas no formato ISO 8601 YYYY-MM-DD
. Eles também aceitam apenas números usando ponto (.
) como separador decimal sem um separador de milhares como NNN.DD
.
Para saber mais sobre o formato de data, acesse Formato de data e hora ISO 8601.
Adicionamos a capacidade de declarar esse tipo durante a etapa de criação do campo do assistente e de escolher uma convenção de data ou número (equivalente a uma localidade).
Convenções de data
O exemplo a seguir mostra um extrato de hipoteca com um campo de data.
O exemplo a seguir mostra formatos de campo de data.
Formatos de data com suporte
Ao definir o campo, escolha entre Ano, Mês, Dia, Mês, Dia, Ano ou Dia, Mês, Ano.
Os seguintes caracteres podem ser usados como delimitadores de data: ,
-
/
.
\
. Um espaço em branco não pode ser usado como delimitador. Por exemplo:
- 01,01,2020
- 01-01-2020
- 01/01/2020
O dia e o mês podem ser escritos com um ou dois dígitos, e o ano com dois ou quatro dígitos:
- 1-1-2020
- 1-01-20
Se uma cadeia de caracteres de data tiver oito dígitos, o delimitador é opcional:
- 01012020
- 01 01 2020
O mês também pode ser escrito como seu nome completo ou abreviado. Se o nome for usado, os caracteres delimitadores são opcionais. No entanto, esse formato pode ser reconhecido com menos precisão do que outros.
- 01/Jan/2020
- 01Jan2020
- 01 Jan 2020
Convenções numéricas
O exemplo a seguir mostra um extrato de hipoteca com campos numéricos.
O exemplo a seguir mostra formatos de campo numérico.
Observação
Para cada campo, apenas uma convenção é permitida para um determinado campo para todas as coleções deste modelo. Por exemplo, se você extrair um valor de campo selecionando Usar vírgula (,) como separador decimal, o seguinte texto 1234,56 ou 1 234,56 será convertido em 1234,56. Valores com formato 12,34,576.78 ou 1.234,56 não são convertidos.
Durante a extração, o texto é convertido automaticamente de acordo com a convenção fornecida. Esse valor convertido pode ser recuperado usando o resultado YOURFIELDNAME value
. Este valor ficará vazio, se a conversão não for possível. O texto original pode ser recuperado usando o resultado YOURFIELDNAME text
.
Formatos de número permitidos
Ao definir o campo, escolha Usar ponto (.) como separador decimal ou Usar vírgula (,) como separador decimal.
Quando o separador decimal for um ponto (.
), os separadores de milhar podem ser omitidos e uma vírgula (,
) ou espaço em branco pode ser usado. Por exemplo:
- 1234.56
- 1,234.56
- 1 234.56
Quando o separador decimal for uma vírgula (,
), os separadores de milhar ou espaços em branco podem ser omitidos. Por exemplo:
- 1234,56
- 1 234.56
Próxima etapa
Treinar e publicar seu modelo de processamento de documentos
Informações relacionadas
Treinamento: Processar documentos personalizados com o AI Builder (módulo)