Obciążenia sztucznej inteligencji na platformie Azure

Artykuł
01/08/2025

W tym artykule przedstawiono wyzwania związane z architekturą projektowania obciążeń sztucznej inteligencji. Koncentruje się on na niedeterministycznych funkcjach, projektowaniu danych i aplikacjach oraz operacjach. Zalecenia są oparte na zasadach platformy Azure Well-Architected Framework i zawierają szczegółowe informacje z pomyślnych implementacji platformy Azure.

Te artykuły są przeznaczone dla właścicieli obciążeń i uczestników projektu technicznego, takich jak architekci, liderzy deweloperów i liderzy IT. Wyspecjalizowane role sztucznej inteligencji i danych, takie jak analitycy danych, powinny również mieć świadomość tych wskazówek, ponieważ współpraca między różnymi rolami i zespołami jest kluczowym aspektem.

Uwaga

Platforma Azure oferuje różne usługi sztucznej inteligencji, które można zintegrować z obciążeniem lub tworzyć wokół niego. W zależności od potrzeb biznesowych możesz wybrać między w pełni zarządzanymi rozwiązaniami oprogramowania jako usługi (SaaS), rozwiązaniami platformy jako usługi (PaaS) lub tworzyć własne rozwiązanie sztucznej inteligencji. Określone usługi platformy Azure i ich możliwości nie zostały tutaj omówione. Zalecamy zapoznanie się z odpowiednią dokumentacją produktu w celu uzyskania tych informacji.

Ponadto niektóre obciążenia sztucznej inteligencji nie są w zakresie, takie jak:

Obciążenia, które są realizowane za pośrednictwem ofert z małą ilością kodu i bez kodu, takich jak Copilot Studio.
Obciążenia wymagające obliczeń o wysokiej wydajności.
Obciążenia, które nie implementują przypadków użycia generacyjnych ani dyskryminacyjnych sztucznej inteligencji.

Co to jest obciążenie sztucznej inteligencji?

W kontekście ramy Well-Architected obciążenie AI spełnia wymagania zadań predykcyjnych, dyskryminacyjnych lub generacyjnych. Koncentruje się on na funkcjach etycznych, dostosowaniu się do szybko zmieniających się technologii sztucznej inteligencji oraz zachowaniu odpowiednich i zrozumiałych możliwości. Zastosuj filary Well-Architected Framework w każdym punkcie decyzyjnym, aby upewnić się, że system jest niezawodny, bezpieczny, wydajny i ekonomiczny.

Obciążenia sztucznej inteligencji różnią się od tradycyjnych, ponieważ zastępują funkcje deterministyczne w części obciążenia nieokreślonym zachowaniem, które rozwiązuje problemy w sytuacjach, w których stałe wyniki są niepraktyczne. Zamiast tego łączą kod i dane w jednostkę lub model , aby umożliwić unikalne doświadczenia, czego tradycyjne systemy nie mogą zapewnić.

Przed rozpoczęciem strategii projektowania należy najpierw wziąć pod uwagę te kluczowe kwestie.

Zapoznaj się z szerokimi kategoriami modeli

Generowanie sztucznej inteligencji: używa uczenia maszynowego do autonomicznego tworzenia nowej zawartości. Obejmuje ona modele językowe, które można dostosować za pomocą danych użytkownika lub używane jako usługi, takie jak Azure OpenAI Service. Na przykład GPT, typ modelu językowego, specjalizuje się w naśladowaniu ludzkiego języka konwersacyjnego i jest idealny do rozmów i środowisk języka naturalnego.

Przypadki użycia: Generowanie sztucznej inteligencji umożliwia tworzenie artykułów, historii i sztuki. Może również generować syntetyczne dane, aby zrównoważyć zestawy danych i uczynić czatbotów bardziej ludzkimi.
Dyskryminacyjna sztuczna inteligencja: używa jawnego programowania do wykonywania określonych zadań na podstawie reguł i algorytmów. Jest on podzielony na:
- oparte na modelu: Systemy predykcyjne znajdują wzorce na podstawie trenowania wykonanego z poprzednich obserwacji w celu przewidywania, ale nie mogą tworzyć nowej zawartości ani dostosowywać się samodzielnie.
- nieoparte na modelu: autonomiczne agentów przestrzegają wstępnie zdefiniowanych reguł interakcji z takimi systemami, jak postacie gier wideo.
Przypadek użycia: Sztuczna inteligencja dyskryminacyjna jest używana do analizy predykcyjnej, systemów rekomendacji i wykrywania oszustw.

W tej serii artykułów omawiane są różne zastosowania sztucznej inteligencji, ze szczególnym uwzględnieniem określonych typów, takich jak modele językowe.

Ważne

Jeśli wybierasz między modelami generowania i dyskryminacyjnymi, pomyśl o zadaniu, które należy wykonać. Modele generowania tworzą nowe dane. Modele dyskryminacyjne klasyfikują istniejące dane na podstawie funkcji. W przypadku zadań klasyfikacji lub regresji wybierz modele pasujące do zadania. Na przykład model językowy, który może klasyfikować, może być bardziej wszechstronny niż model, który klasyfikuje tylko klasyfikowanie.

Ocena opcji kompilacji i zakupu

Jeśli odpowiedzi ogólne są akceptowalne, wstępnie utworzony model lub rozwiązanie oparte na usłudze sztucznej inteligencji korzystające z nieprzezroczystego przetwarzania powinno być wystarczające dla obciążenia. Jeśli jednak potrzebujesz danych specyficznych dla twojej firmy lub masz wymagania dotyczące zgodności, utwórz model niestandardowy.

W przypadku wyboru między modelem niestandardowym, wstępnie utworzonym modelem lub usługą należy wziąć pod uwagę następujące czynniki:

kontrola danych: modele niestandardowe zapewniają większą kontrolę nad danymi poufnymi. Wstępnie utworzone modele są łatwiejsze w przypadku zadań ogólnych.
Dostosowywanie: Modele niestandardowe są lepsze dla wyjątkowych potrzeb. Wstępnie utworzone modele mogą nie mieć elastyczności.
Koszt i utrzymanie: Modele niestandardowe wymagają ciągłej konserwacji i zasobów. Wstępnie utworzone modele zwykle mają niższe koszty początkowe i mniejsze obciążenie infrastrukturą.
Wydajność: Wbudowane usługi oferują zoptymalizowaną infrastrukturę i skalowalność. Doskonale nadają się do potrzeb wymagających małych opóźnień lub wysokiej skalowalności.
Ekspertyza: modele niestandardowe wymagają wykwalifikowanego zespołu. Wstępnie utworzone modele są często szybsze do wdrożenia i łatwiejsze w użyciu, jeśli wiedza jest ograniczona.

Ważne

Tworzenie i utrzymywanie własnego modelu wymaga wielu zasobów, czasu i wiedzy. Ważne jest, aby dokładnie zbadać przed podjęciem decyzji. Zazwyczaj wybranie wstępnie utworzonego modelu lub usługi zarządzanej jest lepszym rozwiązaniem.

Jakie są typowe wyzwania?

koszty obliczeń: funkcje sztucznej inteligencji mogą być kosztowne z powodu wysokich potrzeb obliczeniowych, a potrzeby obliczeniowe mogą się różnić w zależności od projektu obciążenia. Poznaj wymagania i wybierz odpowiednią usługę do zarządzania kosztami.
wymagania dotyczące zabezpieczeń i zgodności: gotowe rozwiązania mogą nie spełniać wymagań dotyczących zabezpieczeń i zgodności. Opcje badań, aby uniknąć niepotrzebnych obciążeń.
Ilość danych: Obsługa dużych ilości danych w różnych formatach wiąże się z wyzwaniami dotyczącymi ochrony poufnych informacji i wydajnego przetwarzania. Optymalizacja kosztów magazynowania, przetwarzania i transferu powinna być ciągłym działaniem.
rozkład modelu: Modele mogą ulec pogorszeniu w czasie, co prowadzi do niedokładnych wyników. Testowanie systemów sztucznej inteligencji jest trudne ze względu na ich losowość.
wyzwania związane z umiejętnościami: Nowe obciążenia sztucznej inteligencji mogą wymagać wyspecjalizowanych ról i nowych procesów operacyjnych, które wymagają obszernego szkolenia.
Tempo innowacji w zakresie sztucznej inteligencji: Przyjęcie najnowszych technologii może być kuszące, aby pozostać na czołowej pozycji. Uważnie oceniaj nowe technologie, aby upewnić się, że usprawniają środowisko użytkownika i nie tylko zwiększają złożoność, aby zapewnić aktualność.
wymagania etyczne: jasno określ, czy twój przypadek użycia jest celem etycznym dla sztucznej inteligencji. Utrzymanie standardów etycznych jest niezbędne w fazie planowania i wdrażania, aby upewnić się, że tworzysz odpowiedzialny system.

Jak korzystać z tych wskazówek

✔ Zacznij od metodologii projektowania , która przedstawia uzasadnienie i cykliczne tematy w obszarach technicznych i operacyjnych. Takie systematyczne podejście pomaga definiować wymagania i strategie projektowania. Przejrzyj tę metodologię, gdy masz do czynienia z niepewnymi wyborami, aby pozostać w zgodzie z ogólnymi celami pracy. Zapewnia również ramy współpracy z uczestnikami projektu w celu uzasadnienia decyzji technicznych i uwzględnienia opinii klientów w celu ciągłego ulepszania.

✔ Przejdź do zasad projektowania , aby zobaczyć, jak metodologia projektowania jest zgodna z podstawowymi filarami Well-Architected Framework. Rozważ ewolucję wzrostu. Oceń podstawowe zasady dla wszystkich filarów łącznie, w tym kompromisy.

✔ Skoncentruj się na obszarach projektowych, które mają największy wpływ na Twoje rozwiązanie. Każdy obszar zawiera zagadnienia i zalecenia dotyczące podejmowania decyzji projektowych.

✔ Użyj narzędzia do przeglądu oceny , aby ocenić gotowość zoptymalizowanego obciążenia sztucznej inteligencji w środowisku produkcyjnym.

Typowy wzorzec architektury i obszary projektowe

Na poniższym diagramie przedstawiono przepływ danych przez system z początkowej kolekcji do końcowej interakcji użytkownika.

Architektura wyróżnia integrację różnych składników, aby umożliwić wydajne przetwarzanie danych, optymalizację modelu i wdrażanie aplikacji w czasie rzeczywistym w rozwiązaniach opartych na sztucznej inteligencji. Obejmuje moduły, takie jak źródła danych, przetwarzanie danych, trenowanie modelu, wdrażanie modelu i interfejsy użytkownika.

W poniższej tabeli opisano niektóre kluczowe obszary projektowania związane z tym wzorcem.

Obszary projektowe
projekt aplikacji: dowiedz się więcej o zagadnieniach unikatowych dla obciążeń sztucznej inteligencji, które mogą mieć znaczący wpływ na istniejące standardy projektowania aplikacji.
platforma aplikacji: określ najlepsze platformy do użycia w celu obsługi funkcji obciążeń sztucznej inteligencji, takich jak hosting modelu, trenowanie modelu i wnioskowanie.
Projektowanie danych szkoleniowych: Projektowanie strategii pozyskiwania danych, przetwarzania wstępnego, przechowywania i zarządzania w celu obsługi danych szkoleniowych modelu.
projektowanie danych podstawowych: Strategie projektowania w celu optymalizacji wyszukiwania i pobierania, jednocześnie spełniając wymagania dotyczące zabezpieczeń i zgodności danych podstawowych.
platformy danych: określ najlepszą platformę hostingu do obsługi dużych ilości i potencjalnie wielu formatów danych używanych przez obciążenie.
operacje uczenia maszynowego i operacje generowania sztucznej inteligencji: ustanów nowoczesne rozwiązania DevOps w celu obsługi uczenia maszynowego lub generowania funkcji i systemów sztucznej inteligencji.
Operacje obciążeń: Modernizowanie praktyk operacyjnych przy użyciu nowych podejść i dodawanie wyspecjalizowanych ról i szkoleń.
testowanie i ocena: opracowywanie strategii testowania i oceny w celu mierzenia cech takich jak dokładność, precyzja, czułość i specyfika za pomocą metryk przeznaczonych dla obciążeń sztucznej inteligencji.
personas obciążenia: dowiedz się, w jaki sposób osoby są zaangażowane w pełny cykl życia obciążenia sztucznej inteligencji, aby zapewnić, że zespół jest w pełni zdolny do tworzenia i obsługi.
Odpowiedzialnej Sztucznej Inteligencji: Zwróć szczególną uwagę na doświadczenie użytkownika i etyczne konsekwencje wydania rozwiązania AI dla opinii publicznej. Sztuczna inteligencja oferuje niesamowite możliwości nowych produktów i usług, ale również niesie ze sobą znaczny stopień ryzyka.

Napiwek

Każda decyzja dotycząca architektury obejmuje szereg zagadnień i zestaw uznanych kompromisów, które równoważą różne aspekty struktury. Te kompromisy są wskazywane przez tę ikonę .

Następny krok

Metodologia projektowania

Udostępnij za pośrednictwem