Introduktion: Självstudie om generativ AI-agent från slutpunkt till slutpunkt
Den här generativa AI-agenten (kallades tidigare AI-kokboken) och dess exempelkod tar dig från ett konceptbevis (POC) till ett högkvalitativt produktionsklart program med hjälp av Mosaic AI Agent Evaluation och Mosaic AI Agent Framework på Databricks-plattformen. Du kan också använda GitHub-lagringsplatsen som en mall för att skapa dina egna AI-program.
Se en lista över sidorna i självstudien generativ AI-agent.
Dricks
Det finns några sätt att skapa en rag-app med hjälp av den här självstudien:
- Du har bara några minuter på dig och vill se en demo av Mosaic AI Agent Framework & Agent Evaluation.
- Du vill komma direkt in i koden och distribuera en RAG POC med dina data.
- Du har inga data, men vill distribuera ett RAG-exempelprogram.
Vad menar vi med högkvalitativ AI?
Självstudien databricks generativ AI-agent är en instruktionsguide för att skapa generativa AI-program av hög kvalitet. Program av hög kvalitet är:
- Korrekt: De ger rätt svar
- Säker: De ger inte skadliga eller osäkra svar
- Styrd: De respekterar databehörigheter och åtkomstkontroller och spåra ursprung
Den här självstudien beskriver bästa praxis för utveckling av arbetsflöden från Databricks för att skapa HÖGKVALITATIVa RAG-appar: utvärderingsdriven utveckling. Den beskriver de mest relevanta sätten att öka RAG-programkvaliteten och ger en omfattande lagringsplats med exempelkod som implementerar dessa tekniker.
Databricks-metoden för kvalitet
Databricks använder följande metod för AI-kvalitet:
- Snabb, kod-första utvecklarloop för att snabbt iterera på kvalitet.
- Gör det enkelt att samla in mänsklig feedback.
- Tillhandahålla ett ramverk för snabb och tillförlitlig mätning av appens kvalitet.
Den här självstudien är avsedd för användning med Databricks-plattformen. Specifikt:
- Mosaic AI Agent Framework som ger ett snabbt utvecklararbetsflöde med företagsklar LLMops och styrning.
- Mosaic AI Agent Evaluation som ger tillförlitlig kvalitetsmätning med hjälp av proprietära AI-assisterade LLM-domare för att mäta kvalitetsmått som drivs av mänsklig feedback som samlas in via ett intuitivt webbaserat chattgränssnitt.
Kodbaserade arbetsflöden
Välj det arbetsflöde nedan som bäst uppfyller dina behov:
Tid som krävs | Det här skapar du | Länk |
---|---|---|
10 minuter | Exempel på RAG-app som distribueras till en webbaserad chattapp som samlar in feedback | Rag demo |
2 timmar | POC RAG-app med dina data distribuerade till ett chattgränssnitt som kan samla in feedback från dina affärsintressenter | Skapa och distribuera en POC |
1 timme | Omfattande utvärdering av kvalitet, kostnad och svarstid för din POC-app |
-
Utvärdera din POC - Identifiera de bakomliggande orsakerna till kvalitetsproblem |