共用方式為


Document Intelligence 名片模型

重要

從文件智慧服務 v4.0 (預覽) 開始,即將淘汰名片模型 (prebuilt-businessCard)。 若要從名片格式中擷取資料,請使用以下版本:

功能 version Model ID
名片模型 • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

此內容適用於: 勾選記號 v3.1 (GA) | 較舊版本: blue-checkmark v3.0 blue-checkmark v2.1

此內容適用於:勾選記號 v3.0 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) purple-checkmark v3.1 | 舊版:blue-checkmark v2.1

[!INCLUDE [適用於 v2.1]。。/(includes/applies-to-v21.md)]

Document Intelligence 名片模型結合了功能強大的光學字元辨識 (OCR) 功能,以及深度學習模型,以便分析和擷取名片影像中的資料。 API 會分析印刷名片;擷取重要資訊,例如名字、姓氏、公司名稱、電子郵件地址和電話號碼,並傳回結構化的 JSON 資料表示法。

名片資料擷取

名片是代表商務或專業人員的絕佳方式。 名片中的公司標誌、字型和背景影像有助於推廣公司商標,並與其他品牌區別。 應用 OCR 和機器學習技術來自動掃描名片是常見的影像處理案例。 銷售與行銷小組所使用的企業系統通常會整合名片資料擷取功能,讓使用者受益。

使用 Document Intelligence Studio 處理的名片範例

Document Intelligence Studio 中分析的名片範例螢幕擷取畫面。

使用 Document Intelligence 範例標籤工具處理的名片範例

使用 Document Intelligence 範例標籤工具分析的名片範例螢幕擷取畫面。

開發選項

文件智慧服務 v3.1:2023-07-31 (GA) 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
名片模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

文件智慧服務 v3.0:2022-08-31 (GA) 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
名片模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

文件智慧服務 v2.1 (GA) 支援下列工具、應用程式和程式庫:

功能 資源
名片模型 文件智慧服務標記工具
REST API
用戶端程式庫 SDK
文件智慧服務 Docker 容器

試用名片資料擷取

查看如何從名片擷取資料,包括姓名、職稱、地址、電子郵件和公司名稱。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

Document Intelligence Studio

注意

Document Intelligence Studio 有 v3.1 和 v3.0 API 可供使用。

  1. 文件智慧服務工作室首頁上,選取 [名片]

  2. 您可以分析範例名片或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,並視需要設定 [分析選項]

    文件智慧服務工作室中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。

    版面配置模型分析結果作業的螢幕擷取畫面。

  3. 從下拉式功能表選取要分析的 [表單類型]

  4. 從下列選項中選擇您想要分析的檔案 URL:

  5. 在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。

    來源位置下拉式功能表的螢幕擷取畫面。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    [選取表單類型] 下拉式功能表的螢幕擷取畫面。

  8. 選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果 - 查看擷取的索引鍵/值組、明細行項目、擷取的反白顯示文字,以及偵測到的資料表。

    名片模型分析結果作業的螢幕擷取畫面。

注意

範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

輸入需求

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置 ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為 4 MB。

  • 影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1 GB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1 GB (上限為 10,000 頁)。 對於 2024-07-31-preview 和更新版本,定型資料的大小總計為 2 GB,最多 10,000 頁。

  • 受支援的檔案格式:JPEG、PNG、PDF 和 TIFF
  • PDF 和 TIFF,最多可以處理 2,000 頁。 若是免費層訂閱者,只會處理前兩頁。
  • 檔案大小必須小於 50 MB,尺寸至少 50 x 50 像素,最大可到 10000 x 10000 像素。

支援的語言和地區設定

如需支持語言的完整清單, 請參閱 我們 預先建置的模型語言支持 頁面。

欄位擷取

如需支持的檔擷取欄位,請參閱 GitHub 範例存放庫中的 名片模型架構 頁面。

擷取的欄位

名稱 類型​​ 描述 Text
ContactNames 物件陣列 連絡人名稱 (擷取自名片) [{ "FirstName": "John", "LastName": "Doe" }]
FirstName string 連絡人名字 "John"
LastName string 連絡人姓氏 "Doe"
ContactNames 字串陣列 公司名稱 (擷取自名片) ["Contoso"]
部門 字串陣列 部門或連絡人組織 ["R&D"]
JobTitles 字串陣列 連絡人所列職稱 ["Software Engineer"]
電子郵件 字串陣列 從名片擷取的連絡人電子郵件 [“”johndoe@contoso.com]
網站 字串陣列 網站 (擷取自名片) [“https://www.contoso.com"]
地址 字串陣列 地址 (擷取自名片) ["123 Main Street, Redmond, Washington 98052"]
MobilePhones 電話號碼陣列 行動電話號碼 (擷取自名片) ["+19876543210"]
傳真 電話號碼陣列 傳真電話號碼 (擷取自名片) ["+19876543211"]
職務電話 電話號碼陣列 公司電話號碼 (擷取自名片) ["+19876543231"]
OtherPhones 電話號碼陣列 其他電話號碼 (擷取自名片) ["+19876543233"]

支援的地區設定

預建名片 v2.1 支援下列地區設定:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

移轉指南和 REST API v3.1

下一步