使用者入門:文件智慧服務工作室
此內容適用於: v4.0 (預覽版) | 舊版: v3.1 (GA) v3.0 (GA)
文件智慧服務工作室 (英文) 是一項線上工具,可讓您以視覺化的方式探索、了解,並將文件智慧服務的功能整合到您的應用程式中。 使用範例或您自己的文件探索預先定型的模型,即可開始使用。 您也可以建立專案來建置自訂範本模型,並使用 Python SDK 和其他快速入門來參考應用程式中的模型。
新使用者的必要條件
若要使用文件智慧服務工作室,您需要下列資產和設定:
提示
如果您打算在單一端點/金鑰下存取多個 Azure AI 服務,請建立 Azure AI 服務資源。 若為僅限文件智慧服務存取,請建立文件智慧服務資源。 請注意,如果您想要使用 Microsoft Entra 驗證 (部分機器翻譯),需要使用單一服務資源。
在存取文件智慧服務資源和儲存體帳戶時,除了本機 (金鑰型) 驗證外,文件智慧服務現在還支援 AAD 權杖驗證。 請務必遵循下列指示來設定正確的存取角色,特別是當您的資源套用 DisableLocalAuth
原則時。
適當規劃 Azure 角色指派範圍 對於文件分析和預先建置的模型,不同案例所需的角色指派如下。
基本 ✔️ 認知服務使用者:您需要文件智慧服務或 Azure AI 服務資源的這個角色,才能進入分析頁面。
進階 ✔️ 參與者:您需要這個角色才能建立資源群組、文件智慧服務或 Azure AI 服務資源。
如需授權的詳細資訊,請參閱文件智慧服務工作室授權原則 (部分機器翻譯)。
注意
如果文件智慧服務資源停用本機 (金鑰型) 驗證,請務必取得認知服務使用者角色,且系統會使用您的 AAD 權杖在文件智慧服務工作室上驗證要求。 參與者角色只允許您列出金鑰,而不會在金鑰存取停用時提供您使用資源的權限。
一旦設定了資源,您就可以試用文件智慧服務工作室所提供的不同模型。 從首頁中,選取任何文件智慧服務模型,嘗試與無程式碼方法搭配使用。
若要測試任何文件分析或預建模型,請選取模型並使用其中一個範例文件,或上傳您自己的文件來分析。 分析結果會顯示在 content-result-code 視窗中的右邊。
自訂模型必須根據您的文件進行定型。 如需自訂模型的概觀,請參閱自訂模型概觀。
驗證
瀏覽至文件智慧服務工作室。 若您是第一次登入,會出現快顯視窗來提示您設定服務資源。 根據貴組織的原則,您有一或兩個選項:
Microsoft Entra 驗證:依資源存取 (建議)。
選擇現有的訂用帳戶
建立新的資源群組,或從您的訂用帳戶中選取現有的資源群組。
選取您現有的文件智慧服務或 Azure AI 服務資源。
本機驗證:依 API 端點和金鑰存取。
從 Azure 入口網站擷取端點和金鑰。
前往您的資源 [概觀] 頁面,然後從左側導覽列中選取 [金鑰和端點]。
在適當欄位中輸入該值。
在驗證文件智慧服務工作室中的案例之後,請使用 C#、Java、JavaScript 或 Python 用戶端程式庫或 REST API,以開始將文件智慧服務模型納入您自己的應用程式中。
若要深入了解每個模型,請參閱我們的概念頁面。
檢視資源詳細資料
若要檢視名稱與定價層等資源詳細資料,請選取文件智慧服務器工作室首頁右上角的 [設定] 圖示,然後選取 [資源] 索引標籤。如果您有其他資源的存取權,也可以切換資源。
已新增自訂專案的必要條件
除了 Azure 帳戶和文件智慧服務或 Azure AI 服務資源之外,您還需要:
Azure Blob 儲存體容器
標準效能 Azure Blob 儲存體帳戶。 您會建立容器,以在您的儲存體帳戶內儲存和整理定型文件。 如果您不知道如何使用容器建立 Azure 儲存體帳戶,請遵循下列快速入門:
- 建立儲存體帳戶。 建立儲存體帳戶時,請務必在 [執行個體詳細資料] → [效能] 欄位中選取標準效能。
- 建立容器。 建立容器時,在 [新增容器] 視窗中,將 [公用存取層級] 欄位設定為 [容器] (容器和 Blob 的匿名讀取權限)。
Azure 角色指派
對於自訂專案,不同案例所需的角色指派如下。
基本
- 認知服務使用者:您需要文件智慧服務或 Azure AI 服務資源的這個角色,才能定型自訂模型或使用定型模型進行分析。
- 儲存體 Blob 資料參與者:您需要儲存體帳戶的這個角色,才能建立專案並標記資料。
進階
- 儲存體帳戶參與者:您需要儲存體帳戶的這個角色,才能設定 CORS 設定 (如果重複使用相同的儲存體帳戶,則只須進行一次這個動作)。
- 參與者:您需要這個角色,才能建立資源群組和資源。
注意
如果您的文件智慧服務資源和儲存體帳戶停用本機 (金鑰型) 驗證,請務必分別取得認知服務使用者和儲存體 Blob 資料參與者角色,以便有足夠的權限可以使用文件智慧服務工作室。 儲存體帳戶參與者和參與者角色只允許您列出金鑰,而不會在金鑰存取停用時提供您使用資源的權限。
設定 CORS
必須在您的 Azure 儲存體帳戶上設定 CORS (跨原始來源資源共用),才能從文件智慧服務工作室存取 CORS。 若要在 Azure 入口網站中設定 CORS,您會需要存取儲存體帳戶的 CORS 索引標籤。
選取儲存體帳戶的 [CORS] 索引標籤。
首先,在 Blob 服務中建立一個新的 CORS 項目。
將 [允許的來源] 設定為
https://documentintelligence.ai.azure.com
。提示
您可以使用萬用字元 '*' 而非指定的網域,以此允許所有原始網域透過 CORS 提出要求。
選取 [允許的方法] 中所有可用的 8 個選項。
在每個欄位中輸入 *,以此來核准所有允許的標頭和公開標頭。
將 [存留期上限] 設定為 120 秒或任何可接受的值。
若要儲存變更,選取頁面頂端的 [儲存] 按鈕。
CORS 現在應該已設定為使用來自文件智慧服務工作室的儲存體帳戶。
範例文件集
登入 Azure 入口網站並瀏覽至儲存體帳戶>資料儲存體>容器。
從清單中選取一個容器。
從頁面頂端的功能表中選取 [上傳]。
[上傳 Blob] 視窗隨即出現。
選取要上傳的檔案。
注意
根據預設,工作室會使用位於容器根目錄的文件。 不過,您可以在自訂表單專案建立步驟中指定資料夾路徑,以此來使用組織在資料夾中的資料。 請參閱在子資料夾中組織您的資料
使用 Document Intelligence Studio 功能
使用預先建置的模型或您自己的一個模型來自動標記文件
在自訂擷取模型標記頁面中,您現在可以使用其中一個文件智慧服務預建模型或您定型的模型來自動標記文件。
對於某些文件,在執行自動標記之後可能會有重複的標籤。 請務必修改標籤,以便之後在標籤頁面中沒有重複的標籤。
自動標記表格
您現在可以在自訂擷取模型標籤頁面中自動標記文件中的資料表,而不需要手動標記資料表。
將測試檔案直接新增至您的訓練資料集
一旦您定型了自訂擷取模型,如有必要,請將測試文件上傳至定型資料集,以使用測試頁面來改善您的模型品質。
如果某些標籤傳回較低的信賴度分數,則請務必正確標記您的內容。 如果未正確標記,請將它們新增至定型資料集並重新標記,以改善模型品質。
在自訂專案中利用文件清單選項和篩選
使用自訂擷取模型標記頁面,透過利用搜尋、篩選和依功能排序來輕鬆瀏覽定型文件。
利用格線檢視來預覽文件,或使用清單檢視更輕鬆地捲動瀏覽文件。
專案共用
輕鬆共用自訂擷取專案。 如需詳細資訊,請參閱以自訂模型共用專案 (部分機器翻譯)。
下一步
- 請遵循我們的文件智慧服務 v3.1 移轉指南,以了解其與上一版 REST API 的差異。
- 探索我們的 v4.0 SDK 快速入門,以使用新的用戶端程式庫在您的應用程式中試用 v3.0 功能。
- 請參閱我們的 v4.0 REST API 快速入門,以便使用新的 REST API 來試用 v3.0 功能。