Поделиться через


Извлечение дат и чисел из документов

Хотя многие извлекаемые поля представляют собой простые текстовые поля, бывают случаи, когда информация для извлечения представляет собой дату или число, включая суммы.

Импорт этих данных в целевую систему может быть неудобным и требовать значительной пользовательской логики преобразования. Большинство соединителей импорта и API принимают только стандартизированные даты в формате ISO 8601, например YYYY-MM-DD. Также принимаются только числа, использующие точку (.) в качестве десятичного разделителя без разделителя тысяч NNN.DD.

Чтобы узнать больше о формате даты, перейдите к разделу Формат даты и времени ISO 8601.

Мы добавили возможность объявлять этот тип на этапе создания поля в мастере и выбирать условное обозначение дат или чисел (эквивалентно языковому стандарту).

Соглашения о форматах дат

В следующем примере показана выписка об ипотеке с полем даты.

Снимок экрана с полем «Дата» в «Обзоре».

В следующем примере показаны форматы полей даты.

Снимок экрана с форматами для «Поля даты».

Поддерживаемые форматы даты

При определении поля выберите Год, Месяц, День; Месяц, День, Год; или День, Месяц, Год.

В качестве разделителей даты можно использовать следующие символы: ,-/.\. Пробелы нельзя использовать в качестве разделителя. Например:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

День и месяц могут быть записаны одной или двумя цифрами, а год может быть двух- или четырехзначным:

  • 1-1-2020
  • 1-01-20

Если строка даты состоит из восьми цифр, разделитель необязателен:

  • 01012020
  • 01 01 2020

Месяц также может быть записан как его полное или сокращенное название. Если используется название, символы-разделители необязательны. Однако этот формат может распознаваться менее точно, чем другие.

  • 01/янв/2020
  • 01янв2020
  • 01 янв 2020

Соглашения о форматах чисел

В следующем примере показана выписка об ипотеке с числовыми полями.

Снимок экрана с «Числовыми полем» в «Обзоре».

В следующем примере показаны форматы числовых полей.

Снимок экрана с форматами «числового поля».

Заметка

Для каждого поля разрешено только одно условное обозначение для данного поля для всех коллекций этой модели. Например, если вы извлекаете сумму поля, выбрав Использовать запятую (,) в качестве десятичного разделителя, следующий текст 1234,56 или 1 234,56 преобразуется в 1234.56. Суммы в формате 12,34,576.78 или 1,234.56 не преобразуются.

Во время извлечения текст автоматически преобразуется в соответствии с предоставленным обозначением. Это преобразованное значение можно получить с помощью результата YOURFIELDNAME value. Это значение остается пустым, если преобразование невозможно. Исходный текст можно получить, используя результат YOURFIELDNAME text.

Поддерживаемые числовые форматы

При определении поля выберите или Использовать точку (.) в качестве десятичного разделителя или Использовать запятую (,) в качестве десятичного разделителя.

Если десятичным разделителем является точка (.), можно опустить разделители тысяч и использовать запятую (,) или пробел. Например:

  • 1234.56
  • 1,234.56
  • 1 234.56

Если десятичным разделителем является запятая (,), разделители тысяч или пробелы можно опустить. Например:

  • 1234,56
  • 1 234.56

Следующий шаг

Обучение и публикация модели для обработки документов

Обучение. Обработка произвольных документов с помощью AI Builder (модуль)