Extraire des dates et des nombres de documents
Alors que de nombreux champs à extraire sont des textes simples, il existe des cas où l’information à extraire est une date ou un nombre contenant des montants.
L’importation de ces données dans un système cible peut être compliquée et nécessiter une importante logique de conversion personnalisée. La plupart des connecteurs d’importation et des API n’acceptent que les dates normalisées au format ISO 8601 comme YYYY-MM-DD
. Ils n’acceptent également que les nombres utilisant le point (.
) comme séparateur décimal sans séparateur de milliers, comme NNN.DD
.
Pour en savoir plus sur le format de date, accédez à Format de date et d’heure ISO 8601.
Nous avons ajouté la possibilité de déclarer ce type lors de l’étape de création du champ de l’assistant et de choisir une convention de date ou de nombre (équivalente à un paramètre régional).
Conventions de date
L’exemple suivant montre un relevé hypothécaire avec un champ de date.
L’exemple suivant montre les formats du champ de date.
Formats de date pris en charge
Lors de la définition du champ, choisissez parmi Année, Mois, Jour, Mois, Jour, Année ou Jour, Mois, Année.
Les caractères suivants peuvent être utilisés comme délimiteurs de date : ,
-
/
.
\
. Les espaces blancs ne peuvent pas être utilisés comme délimiteurs. Par exemple :
- 01,01,2020
- 01-01-2020
- 01/01/2020
Le jour et le mois peuvent chacun être écrits avec un ou deux chiffres, et l’année peut être deux ou quatre chiffres :
- 1-1-2020
- 1-01-20
Si une chaîne de date comporte huit chiffres, le délimiteur est facultatif :
- 01012020
- 01 01 2020
Le mois peut également être écrit avec son nom complet ou abrégé. Si le nom est utilisé, les caractères du délimiteur sont facultatifs. Cependant, ce format peut être reconnu comme moins précis que les autres.
- 01/Jan/2020
- 01Jan2020
- 01 Jan 2020
Conventions de nombre
L’exemple suivant montre un relevé hypothécaire avec des champs de nombre.
L’exemple suivant montre les formats du champ de nombre.
Note
Pour chaque champ, une seule convention est autorisée pour un champ donné pour toutes les collections de ce modèle. Par exemple, si vous extrayez le montant d’un champ en sélectionnant Utiliser la virgule (,) comme séparateur décimal, le texte suivant 1234,56 ou 1 234,56 est converti en 1234.56. Les montants avec le format 12,34,576.78 ou 1,234.56 ne sont pas convertis.
Lors de l’extraction, le texte est automatiquement converti selon la convention fournie. Cette valeur convertie peut être récupérée en utilisant le résultat YOURFIELDNAME value
. Cette valeur est vide si la conversion n’est pas possible. Le texte d’origine peut être récupéré en utilisant le résultat YOURFIELDNAME text
.
Formats de nombre pris en charge
Lors de la définition de ce champ, choisissez Utiliser le point (.) comme séparateur décimal ou Utilier la virgule (,) comme séparateur décimal.
Lorsque le séparateur décimal est un point (.
), les séparateurs de milliers peuvent être omis et une virgule (,
) ou un espace blanc peut être utilisé. Par exemple :
- 1234.56
- 1,234.56
- 1 234.56
Lorsque le séparateur décimal est une virgule (,
), les séparateurs de milliers peuvent être omis et l’espace blanc peuvent être omis. Par exemple :
- 1234,56
- 1 234.56
Étape suivante
Effectuer l’apprentissage de votre modèle de traitement de documents et le publier
Informations associées
Formation : traiter les documents personnalisés avec AI Builder (module)