Udostępnij za pośrednictwem


Testowanie obciążenia aplikacji czatu w języku Python przy użyciu programu RAG z locust

Ten artykuł zawiera proces przeprowadzania testów obciążeniowych w aplikacji czatu w języku Python przy użyciu wzorca RAG z Locust, popularnego narzędzia do testowania obciążenia typu open source. Głównym celem testowania obciążenia jest upewnienie się, że oczekiwane obciążenie aplikacji czatu nie przekracza bieżącego limitu przydziału transakcji usługi Azure OpenAI na minutę (TPM). Symulując zachowanie użytkownika pod dużym obciążeniem, można zidentyfikować potencjalne wąskie gardła i problemy ze skalowalnością w aplikacji. Ten proces ma kluczowe znaczenie dla zapewnienia, że aplikacja czatu pozostaje elastyczna i niezawodna, nawet w przypadku dużej liczby żądań użytkowników.

Obejrzyj pokazowy film wideo, aby dowiedzieć się więcej na temat testowania obciążenia aplikacji do czatu.

Uwaga

W tym artykule użyto co najmniej jednego szablonu aplikacji sztucznej inteligencji jako podstawy przykładów i wskazówek w artykule. Szablony aplikacji sztucznej inteligencji zapewniają dobrze utrzymywane, łatwe w wdrażaniu implementacje referencyjne, które pomagają zapewnić wysokiej jakości punkt wyjścia dla aplikacji sztucznej inteligencji.

Wymagania wstępne

Otwórz przykładową aplikację testu obciążeniowego

Test obciążeniowy jest w rozwiązaniu aplikacji do czatu w języku Python jako test locust. Aby wykonać następujące kroki, musisz wrócić do tego artykułu, wdrożyć rozwiązanie, a następnie użyć tego środowiska deweloperskiego kontenera deweloperskiego.

Uruchamianie testu

  1. Zainstaluj zależności dla testu obciążeniowego.

    python3 -m pip install -r requirements-dev.txt
    
  2. Uruchom locust, który używa pliku testowego Locust: locustfile.py znaleziony w katalogu głównym repozytorium.

    locust
    
  3. Otwórz działającą witrynę sieci Web Locust, taką jak http://localhost:8089.

  4. Wprowadź następujące informacje w witrynie sieci Web Locust.

    Właściwości Wartość
    Liczba użytkowników 20
    Zwiększ w górę 1
    Gospodarz https://<YOUR-CHAT-APP-URL>.azurewebsites.net

    Zrzut ekranu przedstawiający test locust z wypełnionymi wartościami.

  5. Wybierz pozycję Uruchom Swarm , aby rozpocząć test.

  6. Wybierz pozycję Wykresy , aby obejrzeć postęp testu.

    Zrzut ekranu przedstawiający wykres locust podczas przebiegu testu.

Czyszczenie zasobów

Po zakończeniu testowania obciążenia wyczyść zasoby. Zasoby platformy Azure utworzone w tym artykule są rozliczane z subskrypcją platformy Azure. Jeśli nie spodziewasz się, że te zasoby będą potrzebne w przyszłości, usuń je, aby uniknąć naliczania dodatkowych opłat. Po usunięciu zasobu specyficznego dla tego artykułu pamiętaj o powrocie do innego samouczka aplikacji do czatu i wykonaniu kroków czyszczenia.

Wróć do artykułu aplikacji czatu, aby wyczyścić te zasoby.

Uzyskaj pomoc

Jeśli masz problemy z używaniem tego testera obciążenia, zarejestruj problem w problemach repozytorium.