共用方式為


將 AI 產生的註解新增至 Unity Catalog 物件

本文介紹 AI 產生的 Unity Catalog 物件和資料表資料行註解 (也稱為 AI 產生的文件),說明其運作方式、示範如何進行新增和編輯,以及回答常見問題。

支援的物件

下列 Unity Catalog 物件支援 AI 產生的註解:

  • 目錄
  • 結構描述
  • 資料表
  • 表格欄
  • 函式
  • 模型
  • 磁碟區

AI 產生的註解不支援檢視或具體化檢視。

AI 產生的註解如何運作?

身為物件擁有者或具有修改物件權限的使用者,您可以使用目錄總管來檢視和新增 Unity Catalog 所管理之物件和資料表資料行的 AI 產生的註解。 註解是由將物件中繼資料納入考慮的大型語言模型 (LLM) 所提供,例如資料表結構描述和資料行名稱。

AI 產生的註解提供快速方式,可協助使用者探索 Unity Catalog 所管理的資料。

重要

AI 產生的註解旨在根據結構描述提供物件和資料表資料行的一般描述。 這些描述會針對商務和企業內容中的資料進行調整,使用來自不同產業之數個開放資料集的範例結構描述。 模型已使用數百個模擬樣本進行評估,以驗證其可避免產生有害或不當的描述。

AI 模型不一定正確,而且必須在儲存之前先檢閱註解。 Databricks 強烈建議人工檢閱 AI 產生的註解,以檢查是否有不準確之處。 模型不應該依賴資料分類工作,例如使用 PII 偵測資料行。

若要在加入註解之後檢視註解,必須擁有物件的 SELECT 權限、父結構描述上的 USE SCHEMA 和父目錄上的 USE CATALOG

如需用來產生註解建議之模型的相關資訊,請參閱 AI 產生註解的常見問題

開始之前

在您可以使用 AI 產生的註解之前,工作區管理員必須啟用 Azure AI 服務支援的輔助功能:

  1. 在 [設定] 中,移至 [進階] 索引標籤,然後向下捲動至 [其他]區段。
  2. 開啟 [Azure AI 服務支援的 AI 輔助功能]選項。

新增 AI 產生的註解

您必須使用目錄總管來檢視建議的註解、進行編輯,以及將其新增至物件和資料表資料行。

需要權限:您必須是物件擁有者,或擁有物件的 MODIFY 權限,才能檢視 AI 建議的註解、編輯並新增。

將 AI 建議的註解新增至物件

  1. 在您的 Azure Databricks 工作區中,按下 目錄圖示 [目錄]

  2. 搜尋或瀏覽物件並加以選取。

  3. 在 [關於此 <object>] 面板中,按下 [AI 產生]

    AI 產生的註解按鈕

    AI 可能需要一些時間才能產生註解。

  4. 按下 [接受]依現狀接受註解,或按下 [編輯]以在儲存註解之前加以修改。

將 AI 建議的註解新增至資料表資料行

  1. 在您的 Azure Databricks 工作區中,按下 目錄圖示 [目錄]

  2. 搜尋、瀏覽並選取資料表。

  3. 在資料表資料行標題上方,按下 [AI 產生]

    每個資料行都會產生註解。

  4. 按下資料行註解旁的核取記號以接受,或在未儲存的情況下關閉。

更新 AI 產生的註解

具有物件 MODIFY 權限的物件擁有者或使用者可隨時使用目錄總管 UI 來更新註解。 內嵌聊天助理可協助編輯註解,為不同語言提供 [縮短文字]或 [翻譯文字]的選項。

AI 產生的註解內嵌助理

您也可以使用 ALTERCOMMENT ON SQL 命令。

關於 AI 產生註解的常見問題

本章節會以常見問題的形式提供 AI 產生的註解 (也稱為 AI 產生的文件) 的一般資訊。

AI 產生的文件功能會使用哪些服務?

AI 產生的註解會針對資料表和資料行使用內部大型語言模型 (LLM)。 他們可能會針對其他 Unity Catalog 物件和內嵌助理使用外部模型合作夥伴。 傳送至外部服務的資料不會用於模型訓練。 模型本身是無狀態的:模型供應商不會儲存任何提示或完成狀況。

模型服務端點託管於哪些區域?

針對歐盟 (EU) 工作區,AI 輔助功能會使用託管於歐盟的外部模型。 所有其他區域都會使用託管於美國的模型。

Azure Databricks 與 Azure AI 服務之間的資料如何加密?

Databricks 與 Azure AI 服務之間的流量會透過業界標準 TLS 1.2 加密在傳輸中加密。

是否所有內容都待用加密?

儲存在 Azure Databricks 工作區內的任何資料都會經過 AES-256 位元加密。 我們的外部合作夥伴不會儲存傳送給他們的任何提示或完成狀況。

哪些資料會傳送至模型?

Azure Databricks 會使用各個 API 要求,將下列中繼資料傳送至模型:

  • 目錄 (目錄名稱、目前註解、目錄類型)
  • 結構描述 (目錄名稱、結構描述名稱、目前註解)
  • 資料表 (目錄名稱、結構描述名稱、資料表名稱、目前註解)
  • 函式 (目錄名稱、結構描述名稱、函式名稱、目前註解、參數、定義)
  • 模型 (目錄名稱、結構描述名稱、模型名稱、目前註解、別名)
  • 磁碟區 (目錄名稱、結構描述名稱、磁碟區名稱、目前註解)
  • 資料行名稱 (資料行名稱、類型、主索引鍵與否、目前資料行註解)

核准的註解會在 Azure Databricks 控制平面資料庫中,與 Unity Catalog 中繼資料的其餘部分一起儲存。 控制平面資料庫為 AES-256 位元加密。

使用方式受客戶在使用 Azure Databricks 時已同意的現有 Azure Databricks 條款及條件所控管。