Aan de slag met de chat met uw eigen gegevensvoorbeeld voor Java
In dit artikel leest u hoe u de chat implementeert en uitvoert met uw gegevensvoorbeeld voor Java. In dit voorbeeld wordt een chat-app geïmplementeerd met Behulp van Java, Azure OpenAI Service en Rag (Retrieval Augmented Generation) in Azure AI Search om antwoorden te krijgen op de voordelen van werknemers bij een fictief bedrijf. De app wordt geseed met PDF-bestanden, waaronder het handboek voor werknemers, een document met voordelen en een lijst met bedrijfsrollen en verwachtingen.
Door de instructies in dit artikel te volgen, gaat u het volgende doen:
- Een chat-app implementeren in Azure.
- Krijg antwoorden over werknemersvoordelen.
- Wijzig de instellingen om het gedrag van reacties te wijzigen.
Zodra u dit artikel hebt voltooid, kunt u beginnen met het wijzigen van het nieuwe project met uw aangepaste code.
Dit artikel maakt deel uit van een verzameling artikelen die laten zien hoe u een chat-app bouwt met behulp van Azure OpenAI Service en Azure AI Search. Andere artikelen in de verzameling zijn:
Notitie
In dit artikel worden een of meer AI-app-sjablonen gebruikt als basis voor de voorbeelden en richtlijnen in het artikel. AI-app-sjablonen bieden u een goed onderhouden, eenvoudig te implementeren referentie-implementaties die u helpen een startpunt van hoge kwaliteit voor uw AI-apps te garanderen.
Architectuuroverzicht
In het volgende diagram ziet u een eenvoudige architectuur van de chat-app:
Belangrijke onderdelen van de architectuur zijn:
- Een webtoepassing voor het hosten van de interactieve chat-ervaring.
- Een Azure AI Search-resource om antwoorden te krijgen op basis van uw eigen gegevens.
- Een Azure OpenAI-service om het volgende te bieden:
- Trefwoorden om de zoekopdracht over uw eigen gegevens te verbeteren.
- Antwoorden van het OpenAI-model.
- Insluitingen van het ada-model
Kosten
De meeste resources in deze architectuur gebruiken een prijscategorie basic of verbruik. De prijzen voor verbruik zijn gebaseerd op gebruik, wat betekent dat u alleen betaalt voor wat u gebruikt. Om dit artikel te voltooien, worden er kosten in rekening gebracht, maar dit is minimaal. Wanneer u klaar bent met het artikel, kunt u de resources verwijderen om te stoppen met het maken van kosten.
Meer informatie over kosten in de voorbeeldopslagplaats.
Vereisten
Er is een ontwikkelcontaineromgeving beschikbaar met alle afhankelijkheden die nodig zijn om dit artikel te voltooien. U kunt de ontwikkelcontainer uitvoeren in GitHub Codespaces (in een browser) of lokaal met behulp van Visual Studio Code.
Als u dit artikel wilt gebruiken, hebt u de volgende vereisten nodig:
- Een Azure-abonnement - Een gratis abonnement maken
- Azure-accountmachtigingen: uw Azure-account moet beschikken over Microsoft.Authorization/roleAssignments/write-machtigingen, zoals Administrator voor gebruikerstoegang of Eigenaar.
- Toegang verleend tot Azure OpenAI in het gewenste Azure abonnement. Op dit moment wordt alleen toegang tot deze service verleend door een aanvraag te doen. U kunt toegang tot Azure OpenAI aanvragen door het formulier in te vullen op https://aka.ms/oai/access. Open een probleem op deze opslagplaats om contact met ons op te stellen als u een probleem hebt.
- GitHub-account
Open ontwikkelomgeving
Begin nu met een ontwikkelomgeving waarop alle afhankelijkheden zijn geïnstalleerd om dit artikel te voltooien.
GitHub Codespaces voert een ontwikkelcontainer uit die wordt beheerd door GitHub met Visual Studio Code voor het web als de gebruikersinterface. Voor de eenvoudigste ontwikkelomgeving gebruikt u GitHub Codespaces zodat u de juiste ontwikkelhulpprogramma's en afhankelijkheden vooraf hebt geïnstalleerd om dit artikel te voltooien.
Belangrijk
Alle GitHub-accounts kunnen Codespaces elke maand maximaal 60 uur gratis gebruiken met 2 kernexemplaren. Zie GitHub Codespaces maandelijks inbegrepen opslag- en kernuren voor meer informatie.
Klik met de rechtermuisknop op de volgende knop en selecteer De koppeling Openen in nieuwe vensters om zowel de ontwikkelomgeving als de documentatie tegelijkertijd beschikbaar te maken.
Controleer op de pagina Codespace maken de configuratie-instellingen voor codespace en selecteer Vervolgens Codespace maken.
Wacht tot de coderuimte is gestart. Dit opstartproces kan enkele minuten duren.
Meld u in de terminal onderaan het scherm aan bij Azure met de Azure Developer CLI.
azd auth login
Kopieer de code uit de terminal en plak deze in een browser. Volg de instructies voor verificatie met uw Azure-account.
De resterende taken in dit artikel vinden plaats in de context van deze ontwikkelingscontainer.
Implementeren en uitvoeren
De voorbeeldopslagplaats bevat alle code- en configuratiebestanden die u nodig hebt om een chat-app te implementeren in Azure. Met de volgende stappen doorloopt u het proces voor het implementeren van het voorbeeld in Azure.
Chat-app implementeren in Azure
Belangrijk
Voor Azure-resources die in deze sectie zijn gemaakt, worden directe kosten in rekening gebracht, voornamelijk op basis van de Azure AI Search-resource. Deze resources kunnen kosten genereren, zelfs als u de opdracht onderbreekt voordat deze volledig wordt uitgevoerd.
Voer de volgende Azure Developer CLI-opdracht uit om de Azure-resources in te richten en de broncode te implementeren:
azd up
Als u wordt gevraagd een omgevingsnaam in te voeren, moet u deze kort en klein houden. Bijvoorbeeld:
myenv
. Deze wordt gebruikt als onderdeel van de naam van de resourcegroep.Wanneer u hierom wordt gevraagd, selecteert u een abonnement waarin u de resources wilt maken.
Wanneer u de eerste keer wordt gevraagd om een locatie te selecteren, selecteert u een locatie bij u in de buurt. Deze locatie wordt gebruikt voor de meeste resources, waaronder hosting.
Als u wordt gevraagd om een locatie voor het OpenAI-model, selecteert u een locatie bij u in de buurt. Als dezelfde locatie beschikbaar is als uw eerste locatie, selecteert u die.
Wacht totdat de app is geïmplementeerd. Het kan 5-10 minuten duren voordat de implementatie is voltooid.
Nadat de toepassing is geïmplementeerd, ziet u een URL die wordt weergegeven in de terminal.
Selecteer die URL die is gelabeld
Deploying service web
om de chattoepassing in een browser te openen.
Chat-app gebruiken om antwoorden te krijgen uit PDF-bestanden
De chat-app wordt vooraf geladen met informatie over werknemersvoordelen van PDF-bestanden. U kunt de chat-app gebruiken om vragen te stellen over de voordelen. Met de volgende stappen doorloopt u het proces voor het gebruik van de chat-app.
Selecteer of typ in de browser 'Wat is opgenomen in mijn Northwind Health Plus-abonnement dat niet standaard is?' in het chattekstvak.
Selecteer een van de bronvermeldingen in het antwoord.
Gebruik in het rechterdeelvenster de tabbladen om te begrijpen hoe het antwoord is gegenereerd.
Tabblad Beschrijving Gedachteproces Dit is een script van de interacties in chat. Ondersteunende inhoud Dit omvat de informatie om uw vraag en het bronmateriaal te beantwoorden. Gegevensvermelding Hiermee wordt de PDF-pagina weergegeven die de bronvermelding bevat. Wanneer u klaar bent, selecteert u het geselecteerde tabblad opnieuw om het deelvenster te sluiten.
Instellingen voor chat-apps gebruiken om het gedrag van reacties te wijzigen
De intelligentie van de chat-app wordt bepaald door het OpenAI-model en de instellingen die worden gebruikt om met het model te communiceren.
Instelling | Beschrijving |
---|---|
Promptsjabloon overschrijven | Dit is de prompt die wordt gebruikt om het antwoord te genereren. |
Dit aantal zoekresultaten ophalen | Dit is het aantal zoekresultaten dat wordt gebruikt om het antwoord te genereren. U kunt deze bronnen zien die worden geretourneerd in het gedachtenproces en de tabbladen Ondersteunende inhoud van de bronvermelding. |
Categorie uitsluiten | Dit is de categorie documenten die zijn uitgesloten van de zoekresultaten. |
Semantische ranker gebruiken voor ophalen | Dit is een functie van Azure AI Search die machine learning gebruikt om de relevantie van zoekresultaten te verbeteren. |
Querycontextuele samenvattingen gebruiken in plaats van hele documenten | Wanneer beide Use semantic ranker en Use query-contextual summaries worden gecontroleerd, gebruikt de LLM bijschriften die zijn geëxtraheerd uit belangrijke passages, in plaats van alle passages, in de hoogste gerangschikte documenten. |
Vervolgvragen voorstellen | Laat de chat-app opvolgende vragen voorstellen op basis van het antwoord. |
Ophaalmodus | Vectoren + tekst betekent dat de zoekresultaten zijn gebaseerd op de tekst van de documenten en de insluitingen van de documenten. Vectoren betekent dat de zoekresultaten zijn gebaseerd op de insluitingen van de documenten. Tekst betekent dat de zoekresultaten zijn gebaseerd op de tekst van de documenten. |
Antwoorden op voltooiing van de Stream-chat | Stream-antwoord in plaats van te wachten totdat het volledige antwoord beschikbaar is voor een antwoord. |
Met de volgende stappen doorloopt u het proces voor het wijzigen van de instellingen.
Selecteer in de browser het tabblad Instellingen voor ontwikkelaars.
Schakel het selectievakje Vervolgvragen voorstellen in en stel dezelfde vraag opnieuw.
What is my deductible?
De chat heeft voorgestelde vervolgvragen geretourneerd, zoals:
1. What is the cost sharing for out-of-network services? 2. Are preventive care services subject to the deductible? 3. How does the prescription drug deductible work?
Schakel op het tabblad Instellingen de selectie van de semantische ranker gebruiken voor ophalen uit.
Dezelfde vraag opnieuw stellen?
What is my deductible?
Wat is het verschil in de antwoorden?
Het antwoord, dat de Semantische rangschikking heeft gebruikt, heeft bijvoorbeeld één antwoord gegeven:
The deductible for the Northwind Health Plus plan is $2,000 per year
.Het antwoord zonder semantische rangschikking heeft een antwoord geretourneerd, wat meer werk vereist om het antwoord te krijgen:
Based on the information provided, it is unclear what your specific deductible is. The Northwind Health Plus plan has different deductible amounts for in-network and out-of-network services, and there is also a separate prescription drug deductible. I would recommend checking with your provider or referring to the specific benefits details for your plan to determine your deductible amount
.
Resources opschonen
Azure-resources opschonen
De Azure-resources die in dit artikel zijn gemaakt, worden gefactureerd voor uw Azure-abonnement. Als u deze resources in de toekomst niet meer nodig hebt, verwijdert u deze om te voorkomen dat er meer kosten in rekening worden gebracht.
Voer de volgende Azure Developer CLI-opdracht uit om de Azure-resources te verwijderen en de broncode te verwijderen:
azd down --purge
GitHub Codespaces opschonen
Als u de GitHub Codespaces-omgeving verwijdert, zorgt u ervoor dat u de hoeveelheid gratis rechten per kernuren kunt maximaliseren die u voor uw account krijgt.
Belangrijk
Zie GitHub Codespaces maandelijks inbegrepen opslag- en kernuren voor meer informatie over de rechten van uw GitHub-account.
- Meld u aan bij het GitHub Codespaces-dashboard (https://github.com/codespaces).
- Zoek uw momenteel uitgevoerde Codespaces die afkomstig zijn uit de
Azure-Samples/azure-search-openai-demo-java
GitHub-opslagplaats. - Open het contextmenu voor de coderuimte en selecteer Vervolgens Verwijderen.
Hoe wordt de vraag beantwoord?
De app is onderverdeeld in 2 apps:
- Een front-end JavaScript-toepassing met behulp van het React-framework met het hulpprogramma Vite-build.
- Een back-end Java-toepassing beantwoordt de vraag.
De back-end-API /chat
doorloopt het proces voor het ophalen van het antwoord:
- Rag-opties bouwen: maak een set opties die worden gebruikt om een antwoord te genereren.
- Aanpak maken met behulp van RAG-opties: Gebruik een combinatie van op ophalen gebaseerde en generatieve modellen om een benadering te creëren voor het genereren van een nauwkeurige en natuurlijke klinkende reactie.
- Voer de aanpak uit met RAG-opties en vorige gesprek: gebruik de benadering en RAG-opties om een antwoord te genereren op basis van het vorige gesprek. Het antwoord bevat informatie over welke documenten zijn gebruikt om het antwoord te genereren.
Hulp vragen
Deze voorbeeldopslagplaats biedt informatie over probleemoplossing.
Als het uitgegeven probleem niet is opgelost, meldt u het probleem aan bij de problemen van de opslagplaats.
Volgende stappen
- De broncode ophalen voor het voorbeeld dat in dit artikel wordt gebruikt
- Een chat-app bouwen met de best practice-oplossingsarchitectuur van Azure OpenAI
- Toegangsbeheer in Generatieve AI-apps met Azure AI Search
- Een OpenAI-oplossing bouwen die gereed is voor ondernemingen met Azure API Management
- Outperforming vector search with hybrid retrieval and ranking capabilities (Outperforming Vector Search met hybride ophaal- en classificatiemogelijkheden)
- Meer end-to-end-sjablonen voor Azure AI