Извлечение дат и чисел из документов
Хотя многие извлекаемые поля представляют собой простые текстовые поля, бывают случаи, когда информация для извлечения представляет собой дату или число, включая суммы.
Импорт этих данных в целевую систему может быть неудобным и требовать значительной пользовательской логики преобразования. Большинство соединителей импорта и API принимают только стандартизированные даты в формате ISO 8601, например YYYY-MM-DD
. Также принимаются только числа, использующие точку (.
) в качестве десятичного разделителя без разделителя тысяч NNN.DD
.
Чтобы узнать больше о формате даты, перейдите к разделу Формат даты и времени ISO 8601.
Мы добавили возможность объявлять этот тип на этапе создания поля в мастере и выбирать условное обозначение дат или чисел (эквивалентно языковому стандарту).
Соглашения о форматах дат
В следующем примере показана выписка об ипотеке с полем даты.
В следующем примере показаны форматы полей даты.
Поддерживаемые форматы даты
При определении поля выберите Год, Месяц, День; Месяц, День, Год; или День, Месяц, Год.
В качестве разделителей даты можно использовать следующие символы: ,
-
/
.
\
. Пробелы нельзя использовать в качестве разделителя. Например:
- 01,01,2020
- 01-01-2020
- 01/01/2020
День и месяц могут быть записаны одной или двумя цифрами, а год может быть двух- или четырехзначным:
- 1-1-2020
- 1-01-20
Если строка даты состоит из восьми цифр, разделитель необязателен:
- 01012020
- 01 01 2020
Месяц также может быть записан как его полное или сокращенное название. Если используется название, символы-разделители необязательны. Однако этот формат может распознаваться менее точно, чем другие.
- 01/янв/2020
- 01янв2020
- 01 янв 2020
Соглашения о форматах чисел
В следующем примере показана выписка об ипотеке с числовыми полями.
В следующем примере показаны форматы числовых полей.
Заметка
Для каждого поля разрешено только одно условное обозначение для данного поля для всех коллекций этой модели. Например, если вы извлекаете сумму поля, выбрав Использовать запятую (,) в качестве десятичного разделителя, следующий текст 1234,56 или 1 234,56 преобразуется в 1234.56. Суммы в формате 12,34,576.78 или 1,234.56 не преобразуются.
Во время извлечения текст автоматически преобразуется в соответствии с предоставленным обозначением. Это преобразованное значение можно получить с помощью результата YOURFIELDNAME value
. Это значение остается пустым, если преобразование невозможно. Исходный текст можно получить, используя результат YOURFIELDNAME text
.
Поддерживаемые числовые форматы
При определении поля выберите или Использовать точку (.) в качестве десятичного разделителя или Использовать запятую (,) в качестве десятичного разделителя.
Если десятичным разделителем является точка (.
), можно опустить разделители тысяч и использовать запятую (,
) или пробел. Например:
- 1234.56
- 1,234.56
- 1 234.56
Если десятичным разделителем является запятая (,
), разделители тысяч или пробелы можно опустить. Например:
- 1234,56
- 1 234.56
Следующий шаг
Обучение и публикация модели для обработки документов
Дополнительные сведения
Обучение. Обработка произвольных документов с помощью AI Builder (модуль)