共用方式為


步驟 5 (產生)。 如何偵錯產生品質

此頁面說明如何識別產生問題的根本原因。 當根本原因分析指出根本原因 Improve Generation 時,請使用此頁面。

即使使用最佳擷取,如果 RAG 鏈結的 LLM 元件無法有效地利用擷取的內容來產生準確、一致且相關的回覆,最終輸出品質也會受到影響。 產生品質問題可能出現的一些方式是幻覺、不一致或無法簡潔扼要地解決使用者的查詢。

指示

請遵循下列步驟來解決產生品質問題:

  1. 開啟 B_quality_iteration/01_root_cause_quality_issues 筆記本
  2. 使用查詢來載入具有產生品質問題的記錄的 MLflow 追蹤。
  3. 針對每個記錄,手動檢查產生的回應,並將它與擷取的內容和基準真相回應進行比較。
  4. 在產生品質較低的查詢中尋找模式或常見問題。 例如:
    • 產生擷取內容中不存在的資訊。
    • 產生與擷取內容不一致的諮詢 (幻覺)。
    • 無法根據提供的擷取內容,直接處理使用者的查詢。
    • 產生過於詳細、難以理解或缺乏邏輯一致性的回覆。
  5. 根據已識別的問題,假設潛在的根本原因和對應的修正。 如需指導,請參閱產生品質不佳的常見原因
  6. 請遵循實作和評估變更中的步驟來實作及評估可能的修正。 這可能涉及修改 RAG 鏈結 (例如,調整提示範本或嘗試不同的 LLM) 或資料管線 (例如,調整區塊策略以提供更多內容)。
  7. 如果產生品質仍然不盡如人意,請針對下一個最有希望的修正重複步驟 4 和 5,直到實現所需效能為止。
  8. 重新執行根本原因分析,以判定整體鏈結是否有應解決的任何其他根本原因。

產生品質不佳的常見原因

下表列出偵錯步驟和常見產生問題之可能的修正。 修正會依元件分類:

  • 鏈結設定
  • 鏈結程式碼

此元件定義了您在實作和評估變更步驟中應遵循的步驟。

重要

Databricks 建議您使用提示工程來反覆運算應用程式輸出的品質。 下列大多數步驟都使用提示工程。

產生問題 偵錯步驟 可能的修正
產生的資訊不存在於擷取內容中 (例如幻覺)。 - 比較產生的回覆與擷取的內容,以識別幻覺資訊。
- 評定特定的查詢類型或擷取的內容是否更容易發生幻覺。
- 鏈結設定 更新提示範本,強調依賴擷取的內容。
- 鏈結設定使用功能更強大的 LLM。
- 鏈結程式碼 實作產生后的事實檢查或驗證步驟。
無法直接解決使用者的查詢或提供過於泛型的回覆 - 比較產生的回覆與使用者查詢,以評定相關性和明確性。
- 檢查特定的查詢類型否會導致擷取正確的內容,但 LLM 會產生低品質輸出。
- 鏈結設定 改善提示範本,以鼓勵直接、特定的回覆。
- 鏈結設定 藉由改善擷取程序來擷取更多目標內容。
- 鏈結程式碼 重新排名擷取結果以將大部分相關的區塊放在第一位,只將這些區塊提供給 LLM。
- 鏈結設定使用功能更強大的 LLM。
產生的回覆難以理解或缺乏邏輯流程 - 評定邏輯流程、文法正確性和可理解性的輸出。
- 分析特定的查詢類型或擷取特定的內容類型時,是否經常發生不一致的情況。
- 鏈結設定 變更提示範本,以鼓勵一致且結構良好的回覆。
- 鏈結設定 藉由擷取其他相關區塊,為 LLM 提供更多內容。
- 鏈結設定使用功能更強大的 LLM。
產生的回覆並非以所需的格式或樣式表示 - 比較輸出與預期的格式和樣式指導方針。
- 評定特定的查詢類型或擷取的內容是否更可能導致格式或樣式偏離。
- 鏈結設定 更新提示範本,以指定所需的輸出格式和樣式。
- 鏈結程式碼 實作後處理步驟,將產生的響應轉換成所需的格式。
- 鏈結程式碼 新增步驟以驗證輸出結構和樣式,並視需要輸出後援回應。
- 鏈結設定 使用微調的 LLM,以特定格式或樣式提供輸出。

後續步驟

如果您也識別了擷取品質的問題,請繼續進行步驟 5 (擷取)。如何偵錯擷取品質

如果您認為您已解決所有已識別的問題,請繼續進行 步驟 6。對 AI 代理程式進行和評估品質修正。

< 上一步:步驟 5.1。偵錯擷取品質

下一步:步驟 6。反覆修正質量問題 >