Delen via


Aan de slag met de chat met uw eigen gegevensvoorbeeld voor Java

In dit artikel leest u hoe u de chat implementeert en uitvoert met uw gegevensvoorbeeld voor Java. In dit voorbeeld wordt een chat-app geïmplementeerd met Behulp van Java, Azure OpenAI Service en Rag (Retrieval Augmented Generation) in Azure AI Search om antwoorden te krijgen op de voordelen van werknemers bij een fictief bedrijf. De app wordt geseed met PDF-bestanden, waaronder het handboek voor werknemers, een document met voordelen en een lijst met bedrijfsrollen en verwachtingen.

Door de instructies in dit artikel te volgen, gaat u het volgende doen:

  • Een chat-app implementeren in Azure.
  • Krijg antwoorden over werknemersvoordelen.
  • Wijzig de instellingen om het gedrag van reacties te wijzigen.

Zodra u dit artikel hebt voltooid, kunt u beginnen met het wijzigen van het nieuwe project met uw aangepaste code.

Dit artikel maakt deel uit van een verzameling artikelen die laten zien hoe u een chat-app bouwt met behulp van Azure OpenAI Service en Azure AI Search. Andere artikelen in de verzameling zijn:

Notitie

In dit artikel worden een of meer AI-app-sjablonen gebruikt als basis voor de voorbeelden en richtlijnen in het artikel. AI-app-sjablonen bieden u een goed onderhouden, eenvoudig te implementeren referentie-implementaties die u helpen een startpunt van hoge kwaliteit voor uw AI-apps te garanderen.

Architectuuroverzicht

In het volgende diagram ziet u een eenvoudige architectuur van de chat-app:

Diagram met architectuur van client-naar back-end-app.

Belangrijke onderdelen van de architectuur zijn:

  • Een webtoepassing voor het hosten van de interactieve chat-ervaring.
  • Een Azure AI Search-resource om antwoorden te krijgen op basis van uw eigen gegevens.
  • Een Azure OpenAI-service om het volgende te bieden:
    • Trefwoorden om de zoekopdracht over uw eigen gegevens te verbeteren.
    • Antwoorden van het OpenAI-model.
    • Insluitingen van het ada-model

Kosten

De meeste resources in deze architectuur gebruiken een prijscategorie basic of verbruik. De prijzen voor verbruik zijn gebaseerd op gebruik, wat betekent dat u alleen betaalt voor wat u gebruikt. Om dit artikel te voltooien, worden er kosten in rekening gebracht, maar dit is minimaal. Wanneer u klaar bent met het artikel, kunt u de resources verwijderen om te stoppen met het maken van kosten.

Meer informatie over kosten in de voorbeeldopslagplaats.

Vereisten

Er is een ontwikkelcontaineromgeving beschikbaar met alle afhankelijkheden die nodig zijn om dit artikel te voltooien. U kunt de ontwikkelcontainer uitvoeren in GitHub Codespaces (in een browser) of lokaal met behulp van Visual Studio Code.

Als u dit artikel wilt gebruiken, hebt u de volgende vereisten nodig:

  • Een Azure-abonnement - Een gratis abonnement maken
  • Azure-accountmachtigingen: uw Azure-account moet beschikken over Microsoft.Authorization/roleAssignments/write-machtigingen, zoals Administrator voor gebruikerstoegang of Eigenaar.
  • Toegang verleend tot Azure OpenAI in het gewenste Azure abonnement. Op dit moment wordt alleen toegang tot deze service verleend door een aanvraag te doen. U kunt toegang tot Azure OpenAI aanvragen door het formulier in te vullen op https://aka.ms/oai/access. Open een probleem op deze opslagplaats om contact met ons op te stellen als u een probleem hebt.
  • GitHub-account

Open ontwikkelomgeving

Begin nu met een ontwikkelomgeving waarop alle afhankelijkheden zijn geïnstalleerd om dit artikel te voltooien.

GitHub Codespaces voert een ontwikkelcontainer uit die wordt beheerd door GitHub met Visual Studio Code voor het web als de gebruikersinterface. Voor de eenvoudigste ontwikkelomgeving gebruikt u GitHub Codespaces zodat u de juiste ontwikkelhulpprogramma's en afhankelijkheden vooraf hebt geïnstalleerd om dit artikel te voltooien.

Belangrijk

Alle GitHub-accounts kunnen Codespaces elke maand maximaal 60 uur gratis gebruiken met 2 kernexemplaren. Zie GitHub Codespaces maandelijks inbegrepen opslag- en kernuren voor meer informatie.

  1. Klik met de rechtermuisknop op de volgende knop en selecteer De koppeling Openen in nieuwe vensters om zowel de ontwikkelomgeving als de documentatie tegelijkertijd beschikbaar te maken.

    Openen in GitHub Codespaces

  2. Controleer op de pagina Codespace maken de configuratie-instellingen voor codespace en selecteer Vervolgens Codespace maken.

    Schermopname van het bevestigingsscherm voordat u een nieuwe coderuimte maakt.

  3. Wacht tot de coderuimte is gestart. Dit opstartproces kan enkele minuten duren.

  4. Meld u in de terminal onderaan het scherm aan bij Azure met de Azure Developer CLI.

    azd auth login
    
  5. Kopieer de code uit de terminal en plak deze in een browser. Volg de instructies voor verificatie met uw Azure-account.

  6. De resterende taken in dit artikel vinden plaats in de context van deze ontwikkelingscontainer.

Implementeren en uitvoeren

De voorbeeldopslagplaats bevat alle code- en configuratiebestanden die u nodig hebt om een chat-app te implementeren in Azure. Met de volgende stappen doorloopt u het proces voor het implementeren van het voorbeeld in Azure.

Chat-app implementeren in Azure

Belangrijk

Voor Azure-resources die in deze sectie zijn gemaakt, worden directe kosten in rekening gebracht, voornamelijk op basis van de Azure AI Search-resource. Deze resources kunnen kosten genereren, zelfs als u de opdracht onderbreekt voordat deze volledig wordt uitgevoerd.

  1. Voer de volgende Azure Developer CLI-opdracht uit om de Azure-resources in te richten en de broncode te implementeren:

    azd up
    
  2. Als u wordt gevraagd een omgevingsnaam in te voeren, moet u deze kort en klein houden. Bijvoorbeeld: myenv. Deze wordt gebruikt als onderdeel van de naam van de resourcegroep.

  3. Wanneer u hierom wordt gevraagd, selecteert u een abonnement waarin u de resources wilt maken.

  4. Wanneer u de eerste keer wordt gevraagd om een locatie te selecteren, selecteert u een locatie bij u in de buurt. Deze locatie wordt gebruikt voor de meeste resources, waaronder hosting.

  5. Als u wordt gevraagd om een locatie voor het OpenAI-model, selecteert u een locatie bij u in de buurt. Als dezelfde locatie beschikbaar is als uw eerste locatie, selecteert u die.

  6. Wacht totdat de app is geïmplementeerd. Het kan 5-10 minuten duren voordat de implementatie is voltooid.

  7. Nadat de toepassing is geïmplementeerd, ziet u een URL die wordt weergegeven in de terminal.

  8. Selecteer die URL die is gelabeld Deploying service web om de chattoepassing in een browser te openen. Schermopname van de chat-app in de browser met verschillende suggesties voor chatinvoer en het tekstvak voor chat om een vraag in te voeren.

Chat-app gebruiken om antwoorden te krijgen uit PDF-bestanden

De chat-app wordt vooraf geladen met informatie over werknemersvoordelen van PDF-bestanden. U kunt de chat-app gebruiken om vragen te stellen over de voordelen. Met de volgende stappen doorloopt u het proces voor het gebruik van de chat-app.

  1. Selecteer of typ in de browser 'Wat is opgenomen in mijn Northwind Health Plus-abonnement dat niet standaard is?' in het chattekstvak.

    Schermopname van het eerste antwoord van de chat-app.

  2. Selecteer een van de bronvermeldingen in het antwoord.

    Schermopname van het eerste antwoord van de chat-app met de bronvermelding gemarkeerd in een rood vak.

  3. Gebruik in het rechterdeelvenster de tabbladen om te begrijpen hoe het antwoord is gegenereerd.

    Tabblad Beschrijving
    Gedachteproces Dit is een script van de interacties in chat.
    Ondersteunende inhoud Dit omvat de informatie om uw vraag en het bronmateriaal te beantwoorden.
    Gegevensvermelding Hiermee wordt de PDF-pagina weergegeven die de bronvermelding bevat.
  4. Wanneer u klaar bent, selecteert u het geselecteerde tabblad opnieuw om het deelvenster te sluiten.

Instellingen voor chat-apps gebruiken om het gedrag van reacties te wijzigen

De intelligentie van de chat-app wordt bepaald door het OpenAI-model en de instellingen die worden gebruikt om met het model te communiceren.

Schermopname van instellingen voor chatontwikkelaars.

Instelling Beschrijving
Promptsjabloon overschrijven Dit is de prompt die wordt gebruikt om het antwoord te genereren.
Dit aantal zoekresultaten ophalen Dit is het aantal zoekresultaten dat wordt gebruikt om het antwoord te genereren. U kunt deze bronnen zien die worden geretourneerd in het gedachtenproces en de tabbladen Ondersteunende inhoud van de bronvermelding.
Categorie uitsluiten Dit is de categorie documenten die zijn uitgesloten van de zoekresultaten.
Semantische ranker gebruiken voor ophalen Dit is een functie van Azure AI Search die machine learning gebruikt om de relevantie van zoekresultaten te verbeteren.
Querycontextuele samenvattingen gebruiken in plaats van hele documenten Wanneer beide Use semantic ranker en Use query-contextual summaries worden gecontroleerd, gebruikt de LLM bijschriften die zijn geëxtraheerd uit belangrijke passages, in plaats van alle passages, in de hoogste gerangschikte documenten.
Vervolgvragen voorstellen Laat de chat-app opvolgende vragen voorstellen op basis van het antwoord.
Ophaalmodus Vectoren + tekst betekent dat de zoekresultaten zijn gebaseerd op de tekst van de documenten en de insluitingen van de documenten. Vectoren betekent dat de zoekresultaten zijn gebaseerd op de insluitingen van de documenten. Tekst betekent dat de zoekresultaten zijn gebaseerd op de tekst van de documenten.
Antwoorden op voltooiing van de Stream-chat Stream-antwoord in plaats van te wachten totdat het volledige antwoord beschikbaar is voor een antwoord.

Met de volgende stappen doorloopt u het proces voor het wijzigen van de instellingen.

  1. Selecteer in de browser het tabblad Instellingen voor ontwikkelaars.

  2. Schakel het selectievakje Vervolgvragen voorstellen in en stel dezelfde vraag opnieuw.

    What is my deductible?
    

    De chat heeft voorgestelde vervolgvragen geretourneerd, zoals:

    1. What is the cost sharing for out-of-network services?
    2. Are preventive care services subject to the deductible?
    3. How does the prescription drug deductible work?
    
  3. Schakel op het tabblad Instellingen de selectie van de semantische ranker gebruiken voor ophalen uit.

  4. Dezelfde vraag opnieuw stellen?

    What is my deductible?
    
  5. Wat is het verschil in de antwoorden?

    Het antwoord, dat de Semantische rangschikking heeft gebruikt, heeft bijvoorbeeld één antwoord gegeven: The deductible for the Northwind Health Plus plan is $2,000 per year.

    Het antwoord zonder semantische rangschikking heeft een antwoord geretourneerd, wat meer werk vereist om het antwoord te krijgen: Based on the information provided, it is unclear what your specific deductible is. The Northwind Health Plus plan has different deductible amounts for in-network and out-of-network services, and there is also a separate prescription drug deductible. I would recommend checking with your provider or referring to the specific benefits details for your plan to determine your deductible amount.

Resources opschonen

Azure-resources opschonen

De Azure-resources die in dit artikel zijn gemaakt, worden gefactureerd voor uw Azure-abonnement. Als u deze resources in de toekomst niet meer nodig hebt, verwijdert u deze om te voorkomen dat er meer kosten in rekening worden gebracht.

Voer de volgende Azure Developer CLI-opdracht uit om de Azure-resources te verwijderen en de broncode te verwijderen:

azd down --purge

GitHub Codespaces opschonen

Als u de GitHub Codespaces-omgeving verwijdert, zorgt u ervoor dat u de hoeveelheid gratis rechten per kernuren kunt maximaliseren die u voor uw account krijgt.

Belangrijk

Zie GitHub Codespaces maandelijks inbegrepen opslag- en kernuren voor meer informatie over de rechten van uw GitHub-account.

  1. Meld u aan bij het GitHub Codespaces-dashboard (https://github.com/codespaces).
  2. Zoek uw momenteel uitgevoerde Codespaces die afkomstig zijn uit de Azure-Samples/azure-search-openai-demo-java GitHub-opslagplaats. Schermopname van alle actieve Codespaces, inclusief hun status en sjablonen.
  3. Open het contextmenu voor de coderuimte en selecteer Vervolgens Verwijderen. Schermopname van het contextmenu voor één coderuimte met de optie Verwijderen gemarkeerd.

Hoe wordt de vraag beantwoord?

De app is onderverdeeld in 2 apps:

  • Een front-end JavaScript-toepassing met behulp van het React-framework met het hulpprogramma Vite-build.
  • Een back-end Java-toepassing beantwoordt de vraag.

De back-end-API /chat doorloopt het proces voor het ophalen van het antwoord:

  • Rag-opties bouwen: maak een set opties die worden gebruikt om een antwoord te genereren.
  • Aanpak maken met behulp van RAG-opties: Gebruik een combinatie van op ophalen gebaseerde en generatieve modellen om een benadering te creëren voor het genereren van een nauwkeurige en natuurlijke klinkende reactie.
  • Voer de aanpak uit met RAG-opties en vorige gesprek: gebruik de benadering en RAG-opties om een antwoord te genereren op basis van het vorige gesprek. Het antwoord bevat informatie over welke documenten zijn gebruikt om het antwoord te genereren.

Hulp vragen

Deze voorbeeldopslagplaats biedt informatie over probleemoplossing.

Als het uitgegeven probleem niet is opgelost, meldt u het probleem aan bij de problemen van de opslagplaats.

Volgende stappen