AI-Workloads in Azure
Dieser Leitfaden befasst sich mit architektonischen Herausforderungen beim Entwerfen von KI-Workloads, wobei der Schwerpunkt auf nicht deterministische Funktionalität, Daten- und Anwendungsentwurf und -vorgänge liegt. Die Empfehlungen basieren auf den Prinzipien des Azure Well-Architected Framework (WAF) und enthalten Einblicke aus erfolgreichen Azure-Implementierungen.
Diese Artikel sind für Workloadbesitzer und technische Projektbeteiligte wie Architekten, Entwicklungsleiter und IT-Führungskräfte gedacht. Spezielle KI- und Datenrollen, z. B. Datenwissenschaftler, sollten sich dieser Anleitung bewusst sein, da die Zusammenarbeit in verschiedenen Rollen und Teams ein wichtiger Aspekt ist.
Hinweis
Microsoft Azure bietet eine Vielzahl von KI-Diensten, die in Ihre Workload integriert oder um sie herum integriert werden können. Je nach Ihren Geschäftlichen Anforderungen können Sie zwischen vollständig verwalteten SaaS-Lösungen, PaaS-Lösungen oder der Erstellung Ihrer eigenen KI-Lösung wählen. Bestimmte Azure-Dienste und ihre Funktionen werden hier nicht behandelt. Für diese empfehlen wir, auf die jeweilige Produktdokumentation zu verweisen.
Außerdem sind bestimmte KI-Workloads nicht im Umfang enthalten, z. B.:
- Workloads, die über Low-Code- und No-Code-Angebote wie Microsoft Copilot Studio realisiert werden.
- Workloads, die ein Hochleistungs computing erfordern.
- Workloads, die keine generativen oder diskriminativen KI-Anwendungsfälle implementieren.
Was ist eine KI-Workload?
Im Kontext von WAF erfüllt eine KI-Workload die Anforderungen von prädiktiven, diskriminierenden oder generativen Aufgaben. Sie konzentriert sich auf ethische Funktionen, anpassungsfähig an schnell entwickelnde KI-Technologien und bleibt relevant und erklärend. Die WAF-Säulen sollten an jedem Entscheidungspunkt angewendet werden, um sicherzustellen, dass das System zuverlässig, sicher, effizient und kostengünstig ist.
KI-Workloads unterscheiden sich von herkömmlichen, da sie deterministische Funktionen in Teilen der Workload durch nicht deterministisches Verhalten ersetzen, das für Situationen löst, in denen feste Ergebnisse unpraktisch sind. Stattdessen kombinieren sie Code und Daten in einer Entität oder einem Modell, wodurch einzigartige Erfahrungen ermöglicht werden, die herkömmliche Systeme nicht bereitstellen können.
Bevor Sie mit ihren Designstrategien beginnen, sollten Sie diese wichtigsten Punkte zuerst berücksichtigen.
Machen Sie sich mit den breiten Kategorien von Modellen vertraut
Generative KI verwendet maschinelles Lernen, um selbstständig neue Inhalte zu erstellen. Sie enthält Sprachmodelle, die mit Benutzerdaten angepasst oder als Dienste wie Azure OpenAI verwendet werden können. Beispielsweise ist GPT, eine Art von Sprachmodell, spezialisiert auf das Imitieren der menschlichen Unterhaltungssprache und eignet sich ideal für Chat- und natürliche Spracherfahrungen.
Anwendungsfälle: Generative KI kann Artikel, Geschichten, Kunst erstellen, synthetische Daten generieren, um Datasets auszugleichen und Chatbots menschlicher zu gestalten.
Diskriminative KI verwendet explizite Programmierung, um bestimmte Aufgaben basierend auf Regeln und Algorithmen auszuführen. Sie kann unterteilt werden in:
Modellbasiert. Prädiktive Systeme, die Muster auf der Grundlage von Schulungen aus früheren Beobachtungen finden, um Vorhersagen zu erstellen, aber keine neuen Inhalte erstellen oder sich selbst anpassen können.
Nicht modellbasiert. Autonome Agents, die vordefinierte Regeln für die Interaktion mit Systemen befolgen, z. B. Mit Videospielfiguren.
Anwendungsfall: Diskriminative KI wird für Predictive Analytics, Empfehlungssysteme und Betrugserkennung verwendet.
In dieser Artikelreihe werden verschiedene KI-Workloads behandelt, die sich bei Bedarf auf bestimmte Typen wie Sprachmodelle konzentrieren.
Wichtig
Denken Sie bei der Auswahl zwischen generativen und diskriminativen Modellen an die Aufgabe, die Sie ausführen müssen. Generative Modelle erstellen neue Daten, während diskriminative Modelle vorhandene Daten basierend auf Features klassifizieren. Wählen Sie für Klassifizierungs- oder Regressionsaufgaben Modelle aus, die dem Auftrag entsprechen. Beispielsweise kann ein Sprachmodell, das klassifizieren kann, vielseitiger sein als ein Modell, das nur klassifiziert wird.
Bewerten Des Builds im Vergleich zu Kaufoptionen
Wenn generische Antworten akzeptabel sind, sollte ein vordefiniertes Modell oder eine KI-dienstbasierte Lösung, die undurchsichtige Verarbeitung verwendet, für Ihre Workload ausreichen. Wenn Sie jedoch Daten benötigen, die für Ihr Unternehmen spezifisch sind oder Complianceanforderungen erfüllen, müssen Sie ein benutzerdefiniertes Modell erstellen.
Berücksichtigen Sie bei der Auswahl zwischen einem benutzerdefinierten Modell, einem vordefinierten Modell oder einem Dienst die folgenden Faktoren:
Datensteuerelement. Benutzerdefinierte Modelle bieten Ihnen mehr Kontrolle über vertrauliche Daten. Vorgefertigte Modelle sind für allgemeine Aufgaben einfacher.
Anpassung. Benutzerdefinierte Modelle sind für individuelle Anforderungen besser geeignet. Vorgefertigte Modelle können nicht flexibel sein.
Kosten und Wartung. Benutzerdefinierte Modelle benötigen fortlaufende Wartung und Ressourcen. Vorkonfigurierte Modelle haben in der Regel niedrigere Anfangskosten und weniger Infrastrukturlast.
Leistung: Vorgefertigte Dienste bieten optimierte Infrastruktur und Skalierbarkeit. Sie eignen sich ideal für Anforderungen mit geringer Latenz oder hoher Skalierbarkeit.
Know-how. Benutzerdefinierte Modelle erfordern ein qualifiziertes Team. Vorgefertigte Modelle können schneller bereitgestellt und einfacher eingesetzt werden, wenn die Expertise begrenzt ist.
Wichtig
Das Erstellen und Verwalten Ihres eigenen Modells erfordert viele Ressourcen, Zeit und Know-how. Vor der Entscheidung ist es wichtig, gründlich zu recherchieren. In der Regel ist die Auswahl eines vordefinierten Modells oder eines verwalteten Diensts eine bessere Option.
Was sind die gemeinsamen Herausforderungen?
Berechnen von Kosten. KI-Funktionen können aufgrund hoher Rechenanforderungen teuer sein, und die Rechenanforderungen können je nach Workloaddesign variieren. Verstehen Sie Ihre Anforderungen, und wählen Sie den richtigen Dienst zum Verwalten von Kosten aus.
Sicherheits- und Complianceanforderungen. Off-the-Shelf-Lösungen erfüllen möglicherweise nicht Ihre Sicherheits- und Complianceanforderungen. Forschungsoptionen, um unnötige Belastungen zu vermeiden.
Datenvolumen. Die Verarbeitung großer Datenvolumes in verschiedenen Formaten bietet Herausforderungen beim Schutz vertraulicher Informationen und einer effizienten Verarbeitung. Optimierung der Speicher-, Verarbeitungs- und Übertragungskosten sollte eine laufende Aktivität sein.
Modellzerfall. Modelle können sich im Laufe der Zeit verschlechtern, was zu ungenauen Ergebnissen führt. Das Testen von KI-Systemen ist aufgrund ihrer Zufälligkeit eine Herausforderung.
Qualifikations-Herausforderungen. Neue KI-Workloads benötigen möglicherweise spezielle Rollen und neue Vorgänge, die umfangreiche Schulungen erfordern.
Tempo der KI-Innovation. Die Einführung der neuesten Technologien kann verlockend sein, auf dem neuesten Stand zu bleiben. Bewerten Sie neue Technologien sorgfältig, um sicherzustellen, dass sie die Benutzererfahrung verbessern und nicht nur die Komplexität erhöhen, um auf dem neuesten Stand zu sein.
Ethische Anforderungen. Sie müssen eindeutig bestimmen, ob Ihr Anwendungsfall ein ethisches Ziel für KI ist. Die Aufrechterhaltung ethischer Standards ist in allen Planungs- und Implementierungsphasen erforderlich, um sicherzustellen, dass Sie ein verantwortungsvolles System erstellen.
Wie verwenden Sie diese Anleitung?
✔ Beginnen Sie mit der Designmethodik, die die Rationale und wiederkehrenden Themen in technischen und operativen Bereichen skizziert. Dieser systematische Ansatz hilft dabei, Anforderungen und Designstrategien zu definieren. Überarbeiten Sie diese Methodik, wenn sie unsicheren Entscheidungen ausgesetzt sind, um mit den Gesamtzielen der Workload in Einklang zu bleiben. Darüber hinaus bietet sie einen Rahmen für die Zusammenarbeit mit den Beteiligten, um technische Entscheidungen zu rechtfertigen und Kundenfeedback zur kontinuierlichen Verbesserung zu integrieren.
✔ Fahren Sie mit den Designprinzipien fort, um zu sehen, wie die Designmethodik mit den wichtigsten Well-Architected-Framework-Säulen übereinstimmt, und zwar unter Berücksichtigung der Wachstumsentwicklung. Bewerten Sie die zugrunde liegenden Prinzipien für alle Säulen zusammen, einschließlich der Tradeoffs.
✔ Konzentrieren Sie sich auf die Entwurfsbereiche , die die größte Auswirkung auf Ihre Lösung haben. Jeder Bereich enthält Überlegungen und Empfehlungen, die Sie durch die Designentscheidungen führen.
✔ Verwenden Sie das Bewertungsüberprüfungstool, um die Bereitschaft Ihrer optimierten KI-Arbeitsauslastung in der Produktion zu bewerten.
Typische Architekturmuster und Entwurfsbereiche
Die Architektur hebt die Integration verschiedener Komponenten hervor, um eine effiziente Datenverarbeitung, Modelloptimierung und Echtzeitanwendungsbereitstellung in KI-gesteuerten Lösungen zu ermöglichen. Es enthält verschiedene Module wie Datenquellen, Datenverarbeitung, Modellschulung, Modellbereitstellung und Benutzeroberflächen, die veranschaulichen, wie Daten vom anfänglichen Sammeln bis zur endgültigen Benutzerinteraktion durch das System fließen.
In der folgenden Tabelle werden einige wichtige Entwurfsbereiche im Zusammenhang mit diesem Muster beschrieben.
Entwurfsbereiche |
---|
Anwendungsdesign. Erfahren Sie mehr über Aspekte, die für KI-Workloads eindeutig sind, die sich auf Ihre vorhandenen Anwendungsentwurfsstandards auswirken können. |
Anwendungsplattform. Ermitteln Sie die besten Plattformen, die zur Unterstützung von AI-Workloadfunktionen verwendet werden sollen, z. B. Modellhosting, Modellschulungen und Ableitungen. |
Entwurf von Schulungsdaten. Entwerfen Sie Strategien für die Datenaufnahme, Vorverarbeitung, Aufbewahrung und Governance,um Ihre Modellschulungsdaten zu behandeln. |
Erdungsdatenentwurf. Entwerfen Sie Strategien zur Optimierung der Suchbarkeit und des Abrufs, während Sie die Sicherheits- und Complianceanforderungen für Ihre Erdungsdaten erfüllen. |
Datenplattform. Ermitteln Sie die beste Hostingplattform, um die großen Mengen und potenziell viele Datenformate zu verarbeiten, die Ihre Workload verwendet. |
Maschinelle Lernvorgänge und generative KI-Vorgänge. Richten Sie moderne DevOps-Methoden ein, um Ihr maschinelles Lernen oder generative KI-Funktionen und -Systeme zu unterstützen. |
Arbeitsauslastungsvorgänge. Modernisieren Sie Ihre betrieblichen Praktiken mit neuen Ansätzen und fügen Sie spezielle Rollen und Schulungen hinzu. |
Tests und Auswertungen. Entwickeln Sie Test- und Auswertungsstrategien, um Merkmale wie Genauigkeit, Genauigkeit, Vertraulichkeit und Spezifität durch Metriken zu messen, die speziell für KI-Workloads bestimmt wurden. |
Workload personas. Verstehen Sie, wie Personas am gesamten Lebenszyklus Ihrer KI-Workload beteiligt sind, um sicherzustellen, dass Ihr Team voll in der Lage ist, sie zu erstellen und zu unterstützen. |
Verantwortungsvolle KI. KI bringt unglaubliche Chancen für neue Produkte und Dienstleistungen, aber sie birgt auch ein erhebliches Risiko. Achten Sie besonders auf die Benutzererfahrung und ethische Auswirkungen der Veröffentlichung Ihrer KI-Lösung für die Öffentlichkeit. |
Tipp
Jede Architekturentscheidung umfasst eine Reihe von Überlegungen und eine Reihe anerkannter Kompromisse, die verschiedene Aspekte des Rahmens ausgleichen. Diese Kompromisse werden durch dieses Symbol gekennzeichnet.