從文件擷取日期和數字
雖然許多要擷取的欄位都是簡單文字,但在某些情況下,要擷取的資訊是日期或包含金額的數字。
將此資料匯入目標系統可能會相當麻煩,需要大量的自訂轉換邏輯。 大部分匯入連接器和 API 只接受採用 ISO 8601 格式的標準化日期,例如 YYYY-MM-DD
。 它們也只接受使用點 (.
) 作為小數點分隔符的數位,而沒有千位分隔符,例如:NNN.DD
。
如果要瞭解有關日期格式的更多資訊,請前往 ISO 8601 日期和時間格式。
我們新增了功能,可在精靈的欄位建立步驟中宣告此類型,以及選擇日期或數字慣例 (等同於地區設定)。
日期慣例
以下範例顯示帶有日期欄位的抵押貸款對帳單。
以下範例顯示日期欄位格式。
支援的日期格式
定義欄位時,在年, 月, 日、月, 日, 年或日, 月, 年中進行選擇。
下列字元可以做為日期分隔符號:,
-
/
.
\
。 空白字元不能做為分隔符號。 例如:
- 01,01,2020
- 01-01-2020
- 01/01/2020
日和月可以各寫為一位或兩位數字,而年可以是兩位或四位數字:
- 1-1-2020
- 1-01-20
如果日期字串有八位數字,分隔符號為選用:
- 01012020
- 01 01 2020
月份也可以寫為完整名稱或簡短名稱。 如果使用名稱,則分隔符號是選用字元。 不過,此格式辨識起來可能不如其他格式正確。
- 01/Jan/2020
- 01Jan2020
- 01 Jan 2020
數字慣例
以下範例顯示帶有數字欄位的抵押貸款對帳單。
以下範例顯示數字欄位格式。
注意
對於每個欄位,此模型所有集合的指定欄位只允許一個慣例。 例如,如果通過選擇 使用逗號 (,) 作為小數點分隔符來擷取欄位數量,則以下文字 1234,56 或 1 234,56 將轉換為 1234.56。 格式為 12,34,576.78 或 1,234.56 的金額不會轉換。
在提取過程中,文字會根據提供的約定自動轉換。 可以使用 YOURFIELDNAME value
結果,擷取轉換後的值。 如果無法轉換,則此值為空。 可以使用 YOURFIELDNAME text
結果,擷取原始文字。
支援的數字格式
定義欄位時,選擇使用點 (.) 做為小數分隔符號或使用逗號 (,) 做為小數分隔符號。
當小數點分隔符號為點 (.
) 時,可以省略千位分隔符號,並可使用逗號 (,
) 或空白字元。 例如:
- 1234.56
- 1,234.56
- 1 234.56
當小數分隔符號是逗號 (,
) 時,可以省略千位數分隔符號或空白字元。 例如:
- 1234,56
- 1 234.56