Designprinzipien intelligenter Anwendungs-Workloads
Die Anleitung für die Planung, Entwicklung und Wartung intelligenter Anwendungs-Workloads basiert auf Power Platform Well-Architected und seinen fünf Säulen der architektonischen Exzellenz.
Well-Architected Säulen | Übersicht |
---|---|
Zuverlässigkeit | Ein intelligenter Anwendungs-Workload erfordert Ausfallsicherheit auf Architekturebene, um sicherzustellen, dass KI-Modelle und -Workflows hochverfügbar sind und sich schnell von Fehlern erholen können. Implementieren Sie robuste Mechanismen zur Fehlerbehandlung. Eine resiliente Architektur bewahrt auch die Integrität der von den KI-Modellen verwendeten Daten und gewährleistet konsistente und genaue Ergebnisse. |
Sicherheit | Ein intelligenter Anwendungs-Workload verarbeitet häufig sensible Daten. Schützen Sie sensible Daten, die von KI-Modellen verwendet und generiert werden. Implementieren Sie Verschlüsselungen, Zugriffskontrollen und regelmäßige Sicherheitsprüfungen. Stellen Sie sicher, dass der Workload den relevanten gesetzlichen Vorschriften wie der DSGVO (Datenschutz-Grundverordnung) und HIPAA (Health Insurance Portability and Accountability Act) entspricht, um die Privatsphäre und die Daten der Benutzenden zu schützen. |
Leistungsfähigkeit | Ein intelligenter Anwendungs-Workload muss so konzipiert sein, dass er nahtlos mit steigenden Datenmengen und Benutzeranforderungen skaliert werden kann. Identifizieren Sie wichtige Leistungsmetriken und implementieren Sie Überwachung, um den Fortschritt beim Erreichen der Leistungsziele des Workload zu verfolgen. Im Kontext intelligenter Anwendungs-Workloads berücksichtigt die Leistung auch die Anzahl der Anfragen und Interaktionen, die durch Self-Service abgeschlossen werden können, was andernfalls menschliches Eingreifen erfordern würde. |
Betriebliche Effizienz | Ein intelligenter Anwendungs-Workload erfordert eine umfassende Überwachung und Protokollierung, um die Leistung und den Zustand von KI-Modellen, Workflows und Unterhaltungen nachzuverfolgen. Die Überwachung hilft, Probleme schnell zu erkennen und zu lösen. Die Säule der betrieblichen Effizienz empfiehlt den Einsatz von Automatisierung, um Abläufe zu rationalisieren, manuelle Eingriffe zu reduzieren und das Risiko menschlicher Fehler zu minimieren. |
Erfahrungsoptimierung | Eine intelligente Anwendungs-Workload sollte dem Gesprächsdesign Priorität einräumen, um eine benutzerfreundliche Erfahrung zu gewährleisten, die es den Benutzern ermöglicht, ihre Ziele mit minimalem Aufwand zu erreichen. Das Design sollte Themen berücksichtigen, welche die generative KI nicht bewältigen kann, und Fallback-Mechanismen enthalten. Implementieren Sie außerdem Mechanismen zum Sammeln von Benutzerfeedback und zur kontinuierlichen Verfeinerung der KI-Modelle und der Arbeitslast auf der Grundlage dieses Feedbacks. |
Zuverlässigkeit
Beim Entwerfen eines intelligenten Anwendungs-Workloads mit Power Platform konzentrieren Sie sich auf Ausfallsicherheit und Verfügbarkeit.
- Resilienz ist die Fähigkeit eines Systems, sich von Ausfällen zu erholen und die Funktion weiter auszuüben.
- Die Verfügbarkeit gewährleistet eine ununterbrochene Betriebszeit. Hochverfügbarkeit minimiert Ausfallzeiten von Anwendungen und verbessert die Wiederherstellung nach Vorfällen.
Zuverlässigkeit ist bei der Entwicklung jedes Workloads wichtig und generative KI ist da keine Ausnahme. Tatsächlich gibt es einzigartige Faktoren, die bei der Entwicklung generativer KI-Workloads zu berücksichtigen sind. Das Erkennen und Hervorheben von Resilienz ist für generative KI-Workloads unerlässlich, um die Verfügbarkeit für die Organisation sicherzustellen und die Geschäftskontinuität aufrechtzuerhalten.
In der Cloud kann es zu Fehlern kommen. Ihr Ziel sollte nicht sein, Fehler vollständig zu verhindern, sondern, die Auswirkungen eines einzelnen Ausfalls einer Komponente zu minimieren. Verwenden Sie die folgenden Informationen, um Ausfallzeiten zu minimieren und sicherzustellen, dass empfohlene Vorgehensweisen für Hochverfügbarkeit in Ihren Workload für intelligente Anwendungen integriert sind:
- Stellen Sie sicher, dass der Workload Fehler verarbeiten und den Betrieb, wenn auch mit eingeschränkter Funktionalität, fortsetzen kann. Identifizieren Sie potenzielle Fehler und machen Sie das System resilient, sodass es diese Fehler tolerieren und sich von ihnen erholen kann.
- Machen Sie den Workload beobachtbar, damit Entwicklungsteams aus Fehlern lernen können. Identifizieren und beheben Sie Probleme schnell, indem Sie Überwachungs-, Protokollierungs- und Warnmechanismen implementieren.
- Stellen Sie sicher, dass der Workload skaliert werden kann, sodass er unterschiedliche Lasten bewältigen kann, was besonders wichtig für KI-Workloads ist, deren Anforderungen möglicherweise schwanken.
- Implementieren Sie robuste Mechanismen für die Fehlerbehandlung und Wiederherstellung. Richten Sie automatische Warnungen bei Systemausfällen ein und haben Sie einen klaren Plan für eine schnelle Wiederherstellung.
- Überprüfen Sie die Zielarchitektur und -skalierung, indem Sie das Zielvolumen der Chatnachrichten oder Unterhaltungen herausfinden. Zielvolumes helfen auch dabei, die Lizenzierungsaspekte der intelligenten Anwendung und die potenziellen Auswirkungen auf Dataverse Speicherung von Gesprächsprotokollen zu validieren.
Bei intelligenten Anwendungen, die generative KI-Funktionen verwenden, sollten Sie nicht nur die Ausfallsicherheit und Verfügbarkeit berücksichtigen, sondern auch die Zuverlässigkeit und Genauigkeit der von dem intelligenten Workload bereitgestellten Antworten. Beachten Sie die folgenden Empfehlungen für jede Design-Betrachtung:
- Optimierung für Retrieval Augmented Generation (RAG): Stellen Sie sicher, dass Ihre Daten sauber und gut strukturiert sind, erstellen Sie effiziente Einbettungen und Indizes für einen schnellen Abruf und implementieren Sie robuste Überwachungs- und Feedbackmechanismen, um die Leistung des Workloads kontinuierlich zu verbessern.
- Effektive Eingabeaufforderungen: Entwerfen Sie präzise und kontextbezogene Eingabeaufforderungen, um die KI anzuleiten, genaue Antworten zu geben.
- Regelmäßige Bewertung: Implementieren Sie eine kontinuierliche Überwachung und Prüfung der KI-Ergebnisse, um die Genauigkeit, Relevanz und ethische Einhaltung zu bewerten.
- Feedbackschleifen: Richten Sie Feedback-Mechanismen ein, in denen Benutzer Ungenauigkeiten melden können, die dann zur Verfeinerung und Verbesserung der Modelle verwendet werden können. Microsoft Copilot Studio bietet Kundenzufriedenheitsanalysen, die umsetzbare Erkenntnisse über die Faktoren für die Zufriedenheit oder Unzufriedenheit mit den Antworten Ihres Agents liefern.
- Domänenspezifisches Training: Feinabstimmung von Modellen für domänenspezifische Daten, um die Genauigkeit in bestimmten Kontexten zu verbessern.
- Regelmäßige Updates: Aktualisieren Sie Modelle regelmäßig mit neuen Daten, um ihre Relevanz und Genauigkeit zu erhalten.
- Nicht erkannte Absichten: Behandeln Sie nicht erkannte Absichten, indem Sie generative Antworten verwenden, um Antworten aus verfügbaren Datenquellen zu finden, und indem Sie das Fallback-Thema für die Integration in andere Systeme verwenden.
Sicherheit
In einem Modell mit übergreifender Verantwortlichkeit:
- Organisationen sind in erster Linie für die Verwaltung und den Betrieb von Workloads verantwortlich.
- Microsoft verwaltet die Sicherheit der zugrunde liegenden Infrastruktur, einschließlich Rechenzentren, Netzwerksicherheit und physischer Sicherheitsmaßnahmen sowie integrierter Sicherheitsfunktionen wie Verschlüsselung, Identitätsmanagement und Einhaltung von Industriestandards. Weitere Informationen finden Sie unter Sicherheit in Microsoft Power Platform und Copilot Studio Sicherheit und Governance.
Wir empfehlen Ihnen, die Dienste und Technologien regelmäßig zu bewerten, um sicherzustellen, dass sich Ihr Sicherheitsstatus an die sich entwickelnde Bedrohungslandschaft anpasst. Wenn Sie bei der Implementierung von Sicherheitsmaßnahmen mit Anbietern zusammenarbeiten, müssen Sie unbedingt verstehen, wer wofür die Verantwortung übernimmt.
Sie können verschiedene Methoden anwenden, um Ihre intelligenten Anwendungs-Workloads abzusichern:
- Benutzerauthentifizierung und Zugriffskontrolle: Implementieren Sie robuste Authentifizierungs- und Zugriffskontrollmaßnahmen, um sicherzustellen, dass nur autorisierte Benutzer auf die intelligente Anwendungs-Workload zugreifen können. Unbefugter Zugriff auf den Workload intelligenter Anwendungen kann zu Datenschutzverletzungen, Missbrauch von Ressourcen und potenzieller Offenlegung sensibler Informationen führen. Schwache oder ineffektive Authentifizierungsmechanismen können ebenfalls die Benutzerkonten kompromittieren.
- Compliance: Stellen Sie sicher, dass Daten in Übereinstimmung mit den gesetzlichen Anforderungen geschützt und verwaltet werden. Machen Sie sich mit den lokalen Vorschriften vertraut, bleiben Sie über die lokalen Datenschutzgesetze auf dem Laufenden und stellen Sie sicher, dass Ihre Datenresidenzstrategie diesen Vorschriften entspricht.
- Integration: Sichern Sie alle Integrationen mit Dienstprinzipalen. Überwachen und schützen Sie die Netzwerkintegrität interner und externer Endpunkte durch Sicherheitsfunktionen und Appliances wie Firewalls oder Web Application Firewalls.
- Laufende Überwachung und Prüfung: Überwachen und prüfen Sie kontinuierlich die Aktivitäten der Workloads, um diese zu erkennen und proaktiv zu reagieren.
- Azure-SicherheitstoolsVerwenden Sie die integrierten Sicherheitstools von Azure, z. B. Microsoft Defender für Cloud und Azure Policy, um Sicherheitsrichtlinien zu überwachen und durchzusetzen.
- Mitarbeiterschulung: Schulen Sie Ihre Mitarbeitenden in den Best Practices im Datenschutz und darin, warum die Einhaltung der Anforderungen an die Datenresidenz so wichtig ist.
Leistungsfähigkeit
Leistungseffizienz ist die Fähigkeit Ihrer Workload, sich effizient zu skalieren, um die Anforderungen der Benutzer zu erfüllen.
Steigern Sie die Leistungseffizienz durch:
- Gründliche Kenntnisse über die Zielvolumina, um die Zielarchitektur und -skalierung überprüfen zu können. Zielvolumes helfen auch dabei, die Lizenzierungsaspekte der generativen KI (Agent) und die potenziellen Auswirkungen auf Dataverse Speicherung von Gesprächsprotokollen zu validieren.
- Grundlegendes zu Plattformgrenzen. Wenn Sie Ihre intelligente Anwendungsworkload in externe Systeme integrieren, z. B. über Power Automate oder HTTP-Anforderungen, müssen Sie überprüfen, ob jede Komponente die Last verarbeiten kann.
- Kontinuierliche Überwachung der Leistung und Erkennung von Anomalien mithilfe von Tools wie Azure Monitor, Log Analytics, Application Insights und Warnungen.
- Verstehen Sie die erwarteten Antwortzeiten für:
- Erstes Laden des Chats und erste Nachrichtenantwort
- Maximale Latenz für den Agent zum Beantworten von Benutzeranfragen
- Ansatz zum Behandeln von Aktionen mit langer Ausführungszeit (z. B. Warten auf die Rückgabe von Daten durch ein externes System)
- Optimierung der Ausweichrate, d. h. der Geschwindigkeit, mit der Anforderungen aufgrund der Automatisierung im Self-Service-Modus abgeschlossen werden (Verringerung der Anzahl der Anfragen, die menschliche Unterstützung erfordern). Weitere Informationen finden Sie unter Leistungsoptimierung für intelligente Anwendungsworkloads.
Wenn Sie jeden dieser Aspekte berücksichtigen, können Sie einen intelligenten Anwendungs-Workload mit einer konsistenten, zusammenhängenden Benutzererfahrung erstellen.
Betriebliche Effizienz
Zur Betrieblichen Effizienz gehört die Entwicklung effizienter Prozesse zur Unterstützung Ihres intelligenten Anwendungs-Workloads.
Betriebsfehler können sich auf andere Designbereiche sowie auf den Erfolg des intelligenten Anwendungs-Workloads insgesamt auswirken. Es ist wichtig, dass Sie Ihre Betriebsprozesse so anpassen, dass sie einen intelligenten Anwendungs-Workload in der Produktion unterstützen. Die folgenden Empfehlungen fördern die betriebliche Effizienz:
- Automatisieren Sie Build- und Release-Prozesse. Vollautomatische Build- und Release-Prozesse reduzieren Reibungsverluste und erhöhen die Häufigkeit der Bereitstellung von Updates, wodurch Wiederholbarkeit und Konsistenz in allen Umgebungen gewährleistet werden. Die Automatisierung verkürzt die Feedbackschleife, von Entwicklungsfachkräften, die Änderungen vorantreiben, bis hin zu Erkenntnissen über Codequalität, Testabdeckung, Resilienz, Sicherheit und Leistung, die alle zur Entwicklerproduktivität beitragen.
- Compliance- und Governance einhalten
- Analysieren Sie die Leistung und Integrität Ihrer Umgebung in der Produktion.
- Pflegen Sie eine Dokumentation, die Folgendes erfasst:
- Problembehandlungs-Verfahren
- Notfallwiederherstellungspläne
- Stellen Sie die Anleitung zur Behebung bereit, wie der Prozess der Problemlösung beschleunigt werden kann.
- Setzen Sie auf kontinuierliche betriebliche Verbesserung. Priorisieren Sie die routinemäßige Verbesserung des Systems und der Benutzererfahrung. Verwenden Sie ein Integritätsmodell, um die betriebliche Effizienz zu verstehen und zu messen, sowie Feedbackmechanismen, die es Anwendungsteams ermöglichen, Lücken iterativ zu verstehen und zu beheben.
Diese Empfehlungen können Ihrem Team helfen, effizient und transparent zusammenzuarbeiten.
Erfahrungsoptimierung
Eine intelligente Anwendungs-Workload sollte dem Gesprächsdesign Priorität einräumen, um eine benutzerfreundliche Erfahrung zu gewährleisten, die es den Benutzern ermöglicht, ihre Ziele mit minimalem Aufwand zu erreichen. Das Design sollte Themen ansprechen, welche die generative KI nicht bewältigen kann, und Fallback-Mechanismen enthalten. Implementieren Sie außerdem Mechanismen zum Sammeln von Benutzerfeedback und zur kontinuierlichen Verfeinerung der KI-Modelle und der Arbeitslast auf der Grundlage dieses Feedbacks.
Die Optimierung der Benutzererfahrung für einen intelligenten Anwendungs-Workload umfasst mehrere wichtige Überlegungen:
Unterhaltungsdesign: Entwerfen Sie Unterhaltungen, die intuitiv und einfach zu navigieren sind. Verwenden Sie eine klare und prägnante Sprache und stellen Sie sicher, dass die KI häufige Benutzeranfragen effektiv bearbeiten kann. Konzentrieren Sie sich darauf, Benutzenden zu helfen, ihre Ziele mit minimalem Aufwand zu erreichen. Verstehen Sie die Absichten der Benutzenden und geben Sie schnell relevante Antworten, um eine nahtlose und effiziente Benutzererfahrung zu gewährleisten.
Handhabungseinschränkungen: Implementieren Sie Fallback-Mechanismen für Themen, die die generative KI nicht bewältigen kann, z. B. das Umleiten von Benutzern an Kundendienstmitarbeiter oder das Bereitstellen alternativer Ressourcen. Entwerfen Sie robuste Fehlerbehandlungsprozesse, um unerwartete Eingaben korrekt zu verwalten. Informieren Sie Benutzende, wenn die KI ihre Anfrage nicht bearbeiten kann, und bieten Sie Alternativen an.
Benutzerfeedback: Integrieren Sie Mechanismen, um kontinuierlich Benutzerfeedback zu sammeln. Microsoft Copilot Studio bietet Kundenzufriedenheitsanalysen, die umsetzbare Erkenntnisse über die Faktoren für die Zufriedenheit oder Unzufriedenheit mit den Antworten Ihres Agenten liefern. Nutzen Sie das gesammelte Feedback, um die KI-Modelle und den Gesamtworkload zu verfeinern und zu verbessern. Regelmäßige Updates, die auf Benutzereingaben basieren, können die Benutzererfahrung erheblich verbessern.
Anpassung und Personalisierung: Passen Sie Eingabeaufforderungen und Anweisungen an Ihre spezifischen Anwendungsfälle und Benutzerbedürfnisse an, um genauere und relevantere Antworten zu gewährleisten. Verwenden Sie dynamische Verkettungen, um Trigger zu automatisieren und Themenflüsse effizient zu verwalten, um den Bedarf an manuell vordefinierten Themen zu reduzieren und die Fähigkeit der KI zu verbessern, Benutzerabsichten zu erkennen. Weitere Informationen unter Eingabeaufforderungen und Themenkonfiguration optimieren.
Nächste Schritte,
Die Designprinzipien des Well-Architected Framework werden in die Designbereiche für intelligente Anwendungs-Workloads integriert. Jeder Designbereich bietet gezielte Anleitungen, damit Sie schnell auf die Informationen zugreifen können, die Sie benötigen, um Ihre Produktivität effizient zu verbessern.
Sehen Sie sich zunächst die Designüberlegen an, die zur Unterstützung eines Workloads erforderlich sind: