Zasady projektowania obciążeń aplikacji inteligentnych

Artykuł
01/15/2025

Wskazówki dotyczące planowania, opracowywania i obsługi inteligentnych obciążeń aplikacji są oparte na dobrze zaprojektowanej platformie Power Platform i jej pięciu filarach doskonałości architektonicznej.

Filar dobrze zaprojektowanej platformy	Podsumowanie
Niezawodność	Obciążenie inteligentnej aplikacji wymaga odporności w warstwie architektury, aby zapewnić wysoką dostępność modeli AI i przepływów pracy oraz możliwość szybkiego odzyskania sprawności po awarii. Zaimplementuj niezawodne mechanizmy obsługi błędów. Odporna architektura zachowuje również integralność danych wykorzystywanych przez modele AI, zapewniając spójne i dokładne wyniki.
Zabezpieczenia	Obciążenie inteligentnej aplikacji często obsługuje poufne dane. Chroń poufne dane używane i generowane przez modele AI. Wdrażaj szyfrowanie, kontrolę dostępu i regularne audyty bezpieczeństwa. Upewnij się, że obciążenie jest zgodne z odpowiednimi standardami regulacyjnymi, takimi jak RODO (Ogólne rozporządzenie o ochronie danych) i HIPAA (Ustawa o przenośności i odpowiedzialności ubezpieczenia zdrowotnego), aby chronić prywatność i dane użytkowników.
Efektywność wydajności	Inteligentne obciążenie aplikacji musi być zaprojektowane tak, aby można je było bezproblemowo skalować wraz ze wzrostem ilości danych i wymaganiami użytkowników. Zidentyfikuj kluczowe metryki wydajności i zaimplementuj monitorowanie, aby śledzić postęp w osiąganiu celów wydajności obciążeń. W kontekście inteligentnych obciążeń aplikacji wydajność uwzględnia również liczbę żądań i interakcji, które można wykonać za pośrednictwem samoobsługi, co w przeciwnym razie wymagałoby interwencji człowieka.
Doskonałość operacyjna	Obciążenie inteligentnej aplikacji wymaga kompleksowego monitorowania i rejestrowania w celu śledzenia wydajności i kondycji modeli AI, przepływów pracy i konwersacji. Monitorowanie pomaga szybko identyfikować i rozwiązywać problemy. Filar doskonałości operacyjnej zaleca stosowanie automatyzacji w celu usprawnienia operacji, ograniczenia ręcznych interwencji i zminimalizowania ryzyka błędu ludzkiego.
Optymalizacja środowiska	Obciążenie inteligentnej aplikacji powinno nadawać priorytet projektowi konwersacji, aby zapewnić przyjazne dla użytkownika środowisko, które umożliwia użytkownikom osiąganie celów przy minimalnym wysiłku. Projekt powinien uwzględniać tematy, z którymi generatywna sztuczna inteligencja nie może sobie poradzić, i zawierać mechanizmy rezerwowe. Zaimplementuj również mechanizmy zbierania opinii użytkowników i ciągłego udoskonalania modeli AI i obciążenia na podstawie tych opinii.

Niezawodność

Projektując obciążenie inteligentnej aplikacji z Power Platform, należy skupić się na odporności i dostępności.

Odporność to zdolność systemu do odzyskiwania sprawności po awariach i dalszego funkcjonowania.
Dostępność zapewnia nieprzerwaną dyspozycyjność. Wysoka dostępność minimalizuje przestoje aplikacji i usprawnia odzyskiwanie po zdarzeniach.

Niezawodność jest ważna w rozwoju każdego obciążenia, a generatywna sztuczna inteligencja nie jest wyjątkiem. W rzeczywistości istnieją unikatowe czynniki, które należy wziąć pod uwagę podczas projektowania obciążeń generatywnej AI. Rozpoznawanie i podkreślanie odporności ma zasadnicze znaczenie dla obciążeń generatywnej sztucznej inteligencji w celu zapewnienia dostępności organizacji i utrzymania ciągłości biznesowej.

Awarie mogą się zdarzyć w chmurze. Zamiast próbować całkowicie zapobiegać awariom, Twoim celem powinno być zminimalizowanie skutków pojedynczego uszkodzonego komponentu. Skorzystaj z poniższych informacji, aby zminimalizować przestoje i upewnić się, że zalecane rozwiązania dotyczące wysokiej dostępności są wbudowane w obciążenie aplikacji inteligentnej:

Upewnij się, że obciążenie może obsługiwać awarie i nadal działać, nawet jeśli ma ograniczoną funkcjonalność. Zidentyfikuj potencjalne usterki i spraw, aby system był odporny, aby tolerować te usterki i odzyskiwać po nich sprawność.
Zadbaj o to, aby obciążenie było obserwowalne, aby zespoły programistyczne mogły uczyć się na błędach. Szybko identyfikuj i rozwiązuj problemy, implementując mechanizmy monitorowania, rejestrowania i alertów.
Upewnij się, że obciążenie można skalować w celu obsługi różnych obciążeń, co jest szczególnie ważne w przypadku obciążeń AI, które mogą mieć zmienne wymagania.
Zaimplementuj niezawodne mechanizmy obsługi błędów i odzyskiwania. Skonfiguruj automatyczne alerty o awariach systemu i miej jasny plan szybkiego odzyskiwania.
Zweryfikuj docelową architekturę i skalę, rozumiejąc docelowe woluminy wiadomości czatu lub konwersacji. Woluminy docelowe pomagają również zweryfikować aspekty licencjonowania inteligentnej aplikacji i potencjalny wpływ na magazyn Dataverse na potrzeby transkrypcji konwersacji.

W przypadku aplikacji inteligentnych, które korzystają z możliwości generatywnej sztucznej inteligencji, należy wziąć pod uwagę nie tylko odporność i dostępność, ale także niezawodność i dokładność odpowiedzi zapewnianych przez inteligentne obciążenie. Należy wziąć pod uwagę następujące zalecenia dotyczące każdego zagadnienia projektowego:

Optymalizuj pod kątem generowania rozszerzonego wspomaganego pobieraniem (RAG): upewnij się, że dane są czyste i dobrze ustrukturyzowane, twórz wydajne osadzenia i indeksy w celu szybkiego pobierania oraz implementuj niezawodne mechanizmy monitorowania i przekazywania opinii, aby stale poprawiać wydajność obciążenia.
Skuteczne monity: projektuj precyzyjne i kontekstowo istotne monity, aby pomóc AI w tworzeniu dokładnych odpowiedzi.
Regularna ocena: wdrażaj ciągłe monitorowanie i testowanie wyników AI w celu oceny dokładności, trafności i przestrzegania zasad etycznych.
Pętle opinii: ustanów mechanizmy opinii, w których użytkownicy mogą zgłaszać nieścisłości, które można następnie wykorzystać do udoskonalenia i ulepszenia modeli. Microsoft Copilot Studio zapewnia analizę satysfakcji klienta, która dostarcza informacje z możliwością działania na temat czynników wpływających na zadowolenie lub niezadowolenie z odpowiedzi agenta.
Trenowanie specyficzne dla domeny: dostosowywanie modeli na danych specyficznych dla domeny w celu zwiększenia dokładności w określonych kontekstach.
Regularne aktualizacje: okresowo aktualizuj modele o nowe dane, aby zachować ich trafność i dokładność.
Nierozpoznane intencje: obsługuj nierozpoznane intencje przy użyciu odpowiedzi generatywnych w celu znalezienia odpowiedzi z dostępnych źródeł danych oraz przy użyciu tematu rezerwowego w celu integracji z innymi systemami.

Zabezpieczenia

W modelu wspólnej odpowiedzialności:

Organizacje są przede wszystkim odpowiedzialne za zarządzanie obciążeniami i ich obsługę.
Microsoft zarządza bezpieczeństwem podstawowej infrastruktury, w tym centrami danych, bezpieczeństwem sieci i fizycznymi środkami bezpieczeństwa oraz wbudowanymi funkcjami bezpieczeństwa, takimi jak szyfrowanie, zarządzanie tożsamością i zgodność ze standardami branżowymi. Dowiedz się więcej w temacie Zabezpieczenia w Microsoft Power Platform oraz Zabezpieczenia i ład Copilot Studio.

Zalecamy regularną ocenę usług i technologii, aby upewnić się, że stan zabezpieczeń dostosowuje się do zmieniającego się krajobrazu zagrożeń. Ustalenie jasnego zrozumienia modelu wspólnej odpowiedzialności z dostawcami jest niezbędne podczas współpracy w celu wdrożenia środków bezpieczeństwa.

W celu zabezpieczenia obciążeń aplikacji inteligentnych można użyć kilku metod:

Uwierzytelnianie użytkowników i kontrola dostępu: zaimplementuj niezawodne środki uwierzytelniania i kontroli dostępu, aby zapewnić, że tylko autoryzowani użytkownicy mogą uzyskać dostęp do obciążenia inteligentnej aplikacji. Nieautoryzowany dostęp do obciążenia aplikacji inteligentnej może spowodować naruszenie bezpieczeństwa danych, niewłaściwe użycie zasobów i potencjalne narażenie poufnych informacji. Słabe lub nieskuteczne mechanizmy uwierzytelniania mogą również spowodować naruszenie bezpieczeństwa kont użytkowników.
Zgodność: upewnij się, że dane są chronione i zarządzane zgodnie z wymaganiami prawnymi. Zapoznaj się z lokalnymi przepisami i bądź na bieżąco z lokalnymi przepisami o ochronie danych oraz upewnij się, że Twoja strategia przechowywania danych jest zgodna z tymi przepisami.
Integracja: zabezpiecz wszystkie integracje z jednostkami usługi. Monitoruj i chroń integralność sieci wewnętrznych i zewnętrznych punktów końcowych za pomocą funkcji zabezpieczeń i urządzeń, takich jak zapory lub zapory aplikacji internetowych.
Bieżące monitorowanie i inspekcja: ciągłe monitorowanie i przeprowadzanie inspekcji działań obciążeń w celu wykrywania i proaktywnego reagowania.
Narzędzia zabezpieczające Azure: użyj wbudowanych narzędzi zabezpieczeń Azure, takich jak Microsoft Defender dla Chmury i Azure Policy, do monitorowania i wymuszania zasad zabezpieczeń.
Szkolenie pracowników: szkolenie pracowników w zakresie dobrych praktyk w zakresie ochrony danych oraz znaczenie, jakie ma dla nich szkolenie w zakresie wymagań dotyczących postępowania z danymi.

Efektywność wydajności

Wydajność to zdolność aplikacji do efektywnego skalowania w celu spełnienia wymagań stawianych mu przez użytkowników.

Zwiększ wydajność poprzez:

Zrozumienie woluminów docelowych w celu zweryfikowania docelowej architektury i skali. Woluminy docelowe pomagają również zweryfikować aspekty licencjonowania generatywnej AI (agenta) i potencjalny wpływ na magazyn Dataverse na potrzeby transkrypcji konwersacji.
Zrozumienie limitów platformy. W przypadku integracji obciążenia aplikacji inteligentnej z systemami zewnętrznymi, na przykład za pośrednictwem żądań HTTP lub Power Automate, ważne jest, aby sprawdzić, czy każdy składnik może obsłużyć obciążenie.
Ciągłe monitorowanie wydajności i wykrywanie anomalii przy użyciu narzędzi, takich jak Azure Monitor, Log Analytics, Application Insights i alerty.
Zrozumienie oczekiwanych czasów odpowiedzi dla:
- Pierwsze ładowanie czatu i pierwsza odpowiedź na wiadomość
- Maksymalne opóźnienie dla agenta do odpowiedzi na zapytania użytkowników
- Podejście do obsługi długotrwałych akcji (na przykład oczekiwanie na zwrócenie danych przez system zewnętrzny)
Optymalizacja stopy odchylenia, czyli szybkości, z jaką żądania są realizowane w sposób samoobsługowy dzięki automatyzacji (zmniejszenie liczby zgłoszeń wymagających pomocy człowieka). Dowiedz się więcej w temacie Optymalizacja wydajności dla obciążeń aplikacji inteligentnych.

Uwzględnienie każdego z tych aspektów pomaga w tworzeniu obciążenia aplikacji inteligentnych ze spójnym środowiskiem użytkownika.

Doskonałość operacyjna

Doskonałość operacyjna obejmuje opracowywanie wydajnych procesów w celu obsługi obciążeń inteligentnych aplikacji.

Awarie operacyjne mogą mieć wpływ na inne obszary projektowania, a także na ogólny sukces obciążenia inteligentnej aplikacji. Ważne jest, aby dostosować procesy operacyjne do obsługi obciążenia inteligentnej aplikacji w środowisku produkcyjnym. Następujące zalecenia napędzają doskonałość operacyjną:

Automatyzowanie procesów kompilacji i wydań. W pełni zautomatyzowane procesy kompilacji i wydawania zmniejszają tarcia i zwiększają szybkość wdrażania aktualizacji, zapewniając powtarzalność i spójność w różnych środowiskach. Automatyzacja skraca pętlę opinii, od wprowadzania zmian przez deweloperów do uzyskiwania szczegółowych informacji o jakości kodu, pokrycia testami, odporności, zabezpieczeniach i wydajności, które przyczyniają się do produktywności programistów.
Utrzymuj ład i zgodność.
Analizuj wydajność i kondycję środowiska produkcji.
Utrzymuj dokumentację, która przechwytuje:
- Procedury rozwiązywania problemów
- Plany odzyskiwania po awarii
Podaj wskazówki, jak przyspieszyć proces rozwiązywania problemów.
Korzystaj z ciągłego doskonalenia operacyjnego. Nadaj priorytet rutynowemu doskonaleniu systemu i doświadczeniu użytkownika. Użyj modelu konndycji, aby zrozumieć i zmierzyć wydajność operacyjną, wraz z mechanizmami opinii, aby umożliwić zespołom aplikacji zrozumienie i wyeliminowanie luk w sposób iteracyjny.

Te zalecenia mogą pomóc Twojemu zespołowi współpracować w sposób wydajny i przejrzysty.

Optymalizacja środowiska

Obciążenie inteligentnej aplikacji powinno nadawać priorytet projektowi konwersacji, aby zapewnić przyjazne dla użytkownika środowisko, które umożliwia użytkownikom osiąganie celów przy minimalnym wysiłku. Projekt powinien dotyczyć tematów, z którymi generatywna sztuczna inteligencja nie może sobie poradzić, i obejmować mechanizmy rezerwowe. Zaimplementuj również mechanizmy zbierania opinii użytkowników i ciągłego udoskonalania modeli AI i obciążenia na podstawie tych opinii.

Optymalizowanie środowiska użytkownika dla obciążenia inteligentnej aplikacji obejmuje kilka kluczowych kwestii:

Projektowanie konwersacji: projektuj konwersacje, które są intuicyjne i łatwe w nawigacji. Używaj jasnego i zwięzłego języka oraz upewnij się, że sztuczna inteligencja może skutecznie obsługiwać typowe zapytania użytkowników. Skoncentruj się na pomaganiu użytkownikom w osiąganiu ich celów przy minimalnym wysiłku. Zrozum intencje użytkownika i szybko udzielaj odpowiednich odpowiedzi, aby zapewnić bezproblemowe i wydajne środowisko użytkownika.
Ograniczenia obsługi: implementuj mechanizmy rezerwowe dla tematów, których generatywna AI nie może obsłużyć, takich jak przekierowywanie użytkowników do pracowników działu obsługi klienta lub udostępnianie alternatywnych zasobów. Zaprojektuj niezawodne procesy obsługi błędów, aby bezpiecznie zarządzać nieoczekiwanymi danymi wejściowymi. Informuj użytkowników, gdy sztuczna inteligencja nie jest w stanie przetworzyć ich żądania, i proponuj alternatywy.
Opinie użytkowników: integruj mechanizmy ciągłego zbierania opinii użytkowników. Microsoft Copilot Studio zapewnia analizę satysfakcji klienta, co dostarcza informacje z możliwością działania na temat czynników wpływających na zadowolenie lub niezadowolenie z odpowiedzi agenta. Wykorzystaj zebrane opinie, aby doskonalić i ulepszyć modele AI oraz ogólne obciążenie. Regularne aktualizacje oparte na danych wejściowych użytkownika mogą znacznie poprawić wrażenia użytkownika.
Dostosowywanie i personalizacja: dostosuj monity i instrukcje do konkretnych przypadków użycia i potrzeb użytkowników, aby zapewnić dokładniejsze i trafniejsze odpowiedzi. Użyj dynamicznego łańcucha, aby zautomatyzować wyzwalacze i efektywnie zarządzać przepływami tematów, aby zmniejszyć potrzebę ręcznie wstępnie zdefiniowanych tematów i poprawić zdolność AI do rozpoznawania intencji użytkownika. Dowiedz się więcej w temacie Optymalizowanie monitów i konfiguracja tematu.

Następne kroki

Zasady projektowania dobrze zaprojektowanego środowiska są wbudowane w obszary projektowania obciążeń aplikacji inteligentnych. Każdy obszar projektowy zawiera ukierunkowane wskazówki, które ułatwiają szybki dostęp do informacji potrzebnych do efektywnego zwiększenia produktywności.

Zacznij od przejrzenia zagadnień projektowych, które są potrzebne do obsługi obciążenia:

Udostępnij za pośrednictwem