共用方式為


步驟 2。 部署 POC 以收集利害關係人意見反應

在此步驟結束時,您將部署完代理程式評估檢閱應用程式,讓您的利害關係人能夠測試並提供有關 POC 的意見反應。 項目關係人使用量的詳細記錄及其意見反應將流向 Lakehouse 中的 Delta 數據表。

RAG 應用程式概念證明

需求

如需本節中的範例程式碼,請參閱 GitHub 存放庫

概念證明 RAG 應用程式

評估驅動開發的第一個步驟是建立概念證明 (POC)。 POC 提供下列優點:

  • 針對使用案例與 RAG 的可行性提供方向性檢視
  • 允許從項目關係人收集初始意見反應,進而讓您建立評估集的第一個版本
  • 建立品質的基準測量,以開始逐一查看

Databricks 建議使用最簡單的 RAG 架構來建置 POC,並且 Databricks 建議針對每個參數建置預設值。

此建議是因為您可以微調 RAG 應用程式內的數百個可能參數組合。 您可以輕鬆地花數週時間調整這些設定,但如果您在系統地評估 RAG 之前這麼做,最終會陷入所謂的 POC 災難迴圈 - 在設定上不斷迭代,但沒有任何辦法客觀地知道您是否進行了改進,而您的利害關係人卻不耐煩地等待檢閱。

本教學課程中的POC樣本是考慮到品質反覆專案所設計。 它們會根據 Databricks 研究團隊所顯示的內容進行參數化,進行微調以提升 RAG 品質。 這些範本不是「三行程式碼就能神奇地構成一個 RAG」,而是結構完善的 RAG 應用程式,可在評估驅動開發工作流程的下列步驟中調整品質。

這可讓您快速部署 POC,但不需要重寫程式碼,即可快速轉換到品質反覆項目。

以下是 POC 應用程式的技術架構:

POC 應用程式架構

注意

根據預設,POC 會使用 Mosaic AI 基礎模型服務上提供的開放原始碼模型。 不過,由於 POC 使用 Mosaic AI 模型服務,該服務支援任何基礎模型,因而使用不同的模型很簡單 - 只要在模型服務中設定該模型,然後在 embedding_endpoint_name 筆記本中取代 llm_endpoint_name00_config

部署 POC 以收集意見反應的步驟

下列步驟示範如何執行和部署 POC 生成式 AI 應用程式。 部署之後,您會取得檢閱應用程式的URL,您可以與專案關係人共用以收集意見反應。

  1. 根據您的資料類型,開啟 A_POC_app 內的 POC 程式碼資料夾:

    如果您的資料不符合上述任一項需求,可以在上述 POC 目錄中 parser_udf 內自訂剖析函式 (02_poc_data_pipeline),以使用您的檔案類型。

    在 POC 資料夾內,您會看到下列筆記本:

    筆記本檔案

    注意

    這些筆記本與您所選的特定 POC 相關。 例如,如果您看到 00_config 的參考,而且您已選擇 pdf_uc_volume,可以在 00_config 中找到相關的 筆記本。

  2. 選擇性地檢閱預設參數。

    在上述 POC 目錄中開啟 00_config 筆記本,以檢視數據管線和 RAG 鏈結的 POC 應用程式預設參數。

    重要

    Databricks 建議的預設參數並非旨在達到完美,而是作為起點。 此工作流程的後續步驟會引導您逐一查看這些參數。

  3. 驗證設定。

    執行 01_validate_config 來檢查您的組態是否有效,且所有資源皆可供使用。 rag_chain_config.yaml 檔案會出現在您的目錄中,用於部署應用程式。

  4. 執行資料管線。

    POC 資料管線是以 Apache Spark 為基礎的 Databricks 筆記本。 開啟 02_poc_data_pipeline 筆記本,然後按 [全部執行] 以執行管線。 該管線會執行下列動作:

    • 從 UC 磁碟區載入原始文件
    • 剖析每個文件,將結果儲存至 Delta 表格
    • 將每個文件分塊,並將結果儲存至Delta表格
    • 使用 Mosaic AI 向量搜尋內嵌文件並建立向量索引

    有關資料管線的輸出資料表和組態等元數據會記錄至 MLflow:

    顯示資料管線的 GIF

    您可以在筆記本底部尋找 Delta 資料表或向量索引輸出的連結來檢查輸出:

    Vector index: https://<your-workspace-url>.databricks.com/explore/data/<uc-catalog>/<uc-schema>/<app-name>_poc_chunked_docs_gold_index
    
    Output tables:
    
    Bronze Delta Table w/ raw files: https://<your-workspace-url>.databricks.com/explore/data/<uc-catalog>/<uc-schema>/<app-name>__poc_raw_files_bronze
    Silver Delta Table w/ parsed files: https://<your-workspace-url>.databricks.com/explore/data/<uc-catalog>/<uc-schema>/<app-name>__poc_parsed_docs_silver
    Gold Delta Table w/ chunked files: https://<your-workspace-url>.databricks.com/explore/data/<uc-catalog>/<uc-schema>/<app-name>__poc_chunked_docs_gold
    
  5. 將 POC 鏈結部署至檢閱應用程式。

    預設 POC 鏈結是使用 LangChain 建置的多回合交談 RAG 鏈結。

    注意

    POC 鏈結會使用 MLflow 程式碼型記錄。 若要深入了解程式碼型記錄,請參閱記錄和註冊 AI 代理程式

    1. 開啟 03_deploy_poc_to_review_app 筆記本

    2. 執行筆記本的每個儲存格。

    3. MLflow 追蹤會顯示 POC 應用程式的運作方式。 將輸入問題調整為與您的使用案例相關的輸入問題,然後重新執行儲存格以「檢查」應用程式。

      顯示 MLflow 追蹤的 GIF

    4. 修改預設指示,以與您的使用案例相關聯。 這些項目會在檢閱應用程式中顯示。

         instructions_to_reviewer = f"""## Instructions for Testing the {RAG_APP_NAME}'s Initial Proof of Concept (PoC)
      
         Your inputs are invaluable for the development team. By providing detailed feedback and corrections, you help us fix issues and improve the overall quality of the application. We rely on your expertise to identify any gaps or areas needing enhancement.
      
         1. **Variety of Questions**:
            - Please try a wide range of questions that you anticipate the end users of the application will ask. This helps us ensure the application can handle the expected queries effectively.
      
         2. **Feedback on Answers**:
            - After asking each question, use the feedback widgets provided to review the answer given by the application.
            - If you think the answer is incorrect or could be improved, please use "Edit Answer" to correct it. Your corrections will enable our team to refine the application's accuracy.
      
         3. **Review of Returned Documents**:
            - Carefully review each document that the system returns in response to your question.
            - Use the thumbs up/down feature to indicate whether the document was relevant to the question asked. A thumbs up signifies relevance, while a thumbs down indicates the document was not useful.
      
         Thank you for your time and effort in testing {RAG_APP_NAME}. Your contributions are essential to delivering a high-quality product to our end users."""
      
         print(instructions_to_reviewer)
      
    5. 執行部署單元以取得審查應用程式的連結。

      Review App URL: https://<your-workspace-url>.databricks.com/ml/review/<uc-catalog>.<uc-schema>.<uc-model-name>/<uc-model-version>
      
  6. 授與個別使用者存取檢閱應用程式的許可權。

    您可以遵循 設定許可權以使用檢閱應用程式中的步驟,授與非 Databricks 使用者的存取權。

  7. 自行詢問幾個問題,並提供意見反應,以測試檢閱應用程式。

    注意

    來自檢閱應用程式的 MLflow 追蹤和使用者的意見反應會出現在您設定的目錄架構中的 Delta 資料表中。 記錄可能需要最多 2 小時才會出現在這些 Delta 表格中。

  8. 與利害關係人共用檢閱應用程式

    您現在可以與專案關係人共用POC RAG應用程式,以取得其意見反應。

    重要

    Databricks 建議將POC散發給至少三個項目關係人,並讓每個項目關係人詢問 10 - 20 個問題。 務必讓多個利害關係人測試您的POC,以便您可以納入多元觀點來制定評估標準。

後續步驟

繼續進行 步驟 3。從利害關係人意見反饋策劃評估集

< 上一步:步驟 1。複製存放庫和建立計算

下一步:策劃評估集的步驟 3。>