Zalecenia dotyczące wyboru zasobów dla obciążeń sztucznej inteligencji na platformie Azure
Ten artykuł zawiera zalecenia dotyczące wyboru zasobów dla organizacji z obciążeniami sztucznej inteligencji na platformie Azure. Koncentruje się ona na rozwiązaniach PaaS (Azure AI Platform-as-a-Service), w tym Azure AI Studio, Azure OpenAI, Azure Machine Learning i Azure AI Services. Obejmuje ona zarówno obciążenia generowania, jak i niegeneracyjne sztuczną inteligencję.
Dokonywanie świadomych wyborów zasobów sztucznej inteligencji umożliwia organizacjom osiągnięcie lepszej wydajności, skalowalności i efektywności kosztów podczas zarządzania obciążeniami sztucznej inteligencji. Poniższa tabela zawiera omówienie podstawowych rozwiązań PaaS usługi Azure AI i ważnych kryteriów decyzyjnych.
Platforma sztucznej inteligencji | Typ sztucznej inteligencji | opis | Wymagane umiejętności |
---|---|---|---|
Azure OpenAI | Generatywna AI | Platforma do uzyskiwania dostępu do modeli OpenAI | Umiejętności deweloperskie i nauki o danych |
Azure AI Studio | Generatywna AI | Platforma umożliwiająca tworzenie monitów i wdrażanie punktów końcowych sztucznej inteligencji | Umiejętności deweloperskie i nauki o danych |
Usługi platformy Azure AI | Analiza sztucznej inteligencji | Platforma do korzystania ze wstępnie utworzonych modeli uczenia maszynowego | Umiejętności deweloperskie |
Azure Machine Learning | Uczenie maszynowe | Platforma do trenowania i wdrażania modeli uczenia maszynowego | Umiejętności deweloperskie i zaawansowane umiejętności nauki o danych |
Wybieranie zasobów dla generowanych obciążeń sztucznej inteligencji
Generowanie sztucznej inteligencji wymaga połączenia różnych zasobów do przetwarzania i generowania znaczących danych wyjściowych na podstawie danych wejściowych. Właściwy wybór zapewnia, że generowanie aplikacji sztucznej inteligencji, takich jak aplikacje korzystające z pobierania rozszerzonej generacji (RAG), zapewniają dokładne wyniki dzięki uziemieniu modeli sztucznej inteligencji.
W typowym obciążeniu RAG (1) obciążenie odbiera zapytanie użytkownika. (2) Orkiestrator, taki jak Przepływ monitów, Jądro Semantyczne lub LangChain, zarządza przepływem danych. (3) Mechanizm wyszukiwania i pobierania znajduje odpowiednie (4) dane uziemione do wysłania do generowanego punktu końcowego sztucznej inteligencji. (5) Punkt końcowy modelu generowania sztucznej inteligencji generuje odpowiedź na podstawie zapytania użytkownika i danych uziemienia. Skorzystaj z poniższych zaleceń jako struktury, aby tworzyć generowanie obciążeń RAG.
Wybierz generacyjną platformę sztucznej inteligencji. Wdrażanie modeli generacyjnych sztucznej inteligencji i zarządzanie nimi za pomocą usługi Azure OpenAI lub Azure AI Studio. Usługa Azure OpenAI Service zapewnia dostęp do sieci prywatnych modeli OpenAI i filtrowania zawartości. Usługa Azure AI Studio oferuje platformę typu code-first do tworzenia obciążeń sztucznej inteligencji. Ma wbudowane narzędzia do kompilowania i wdrażania aplikacji. Zawiera również duży katalog modeli, przepływ monitów, dostrajanie, filtry bezpieczeństwa zawartości i inne.
Wybierz odpowiedni typ obliczeniowy sztucznej inteligencji. Usługa Azure AI Studio wymaga wystąpień obliczeniowych na potrzeby przepływu monitów, tworzenia indeksów i otwierania programu Visual Studio Code (internetowego lub klasycznego) w programie Studio. Wybierz typ obliczeniowy na podstawie wymagań dotyczących wydajności i budżetu.
Wybierz koordynatora. Popularne orkiestratory do generowania sztucznej inteligencji obejmują semantyczne jądro, przepływ monitów i LangChain. Semantyczne jądro integruje się z usługami platformy Azure. LangChain zapewnia rozszerzalność poza ekosystem firmy Microsoft.
Wybierz mechanizm wyszukiwania i pobierania wiedzy. Aby uziemić modele generowania sztucznej inteligencji, utwórz bazę danych indeksu lub wektora na potrzeby odpowiedniego pobierania danych. Usługa Azure AI Search umożliwia tworzenie tradycyjnych i wektorowych indeksów z różnych źródeł danych, stosowanie fragmentów danych i używanie wielu typów zapytań. Jeśli dane znajdują się w ustrukturyzowanych bazach danych, rozważ użycie usług Azure Cosmos DB, Azure Database for PostgreSQL i Azure Cache for Redis.
Wybierz źródło danych na potrzeby uziemienia danych. W przypadku obrazów, audio, wideo lub dużych zestawów danych przechowuj dane uziemienia w usłudze Azure Blob Storage. Alternatywnie użyj baz danych obsługiwanych przez usługę Azure AI Search lub wektorowych baz danych.
Wybierz platformę obliczeniową. Użyj drzewa decyzyjnego obliczeń platformy Azure, aby wybrać odpowiednią platformę dla obciążenia.
Wybieranie zasobów dla niegeneracyjnych obciążeń sztucznej inteligencji
Niegeneracyjne obciążenia sztucznej inteligencji opierają się na platformach, zasobach obliczeniowych, źródłach danych i narzędziach przetwarzania danych do obsługi zadań uczenia maszynowego. Wybranie odpowiednich zasobów umożliwia tworzenie obciążeń sztucznej inteligencji przy użyciu wstępnie utworzonych i niestandardowych rozwiązań.
W przypadku niegeneracyjnego obciążenia sztucznej inteligencji (1) obciążenie pozyskuje dane. (2) Opcjonalny mechanizm przetwarzania danych wyodrębnia lub manipuluje przychodzącymi danymi. (3) Punkt końcowy modelu AI analizuje dane. (4) Dane obsługują trenowanie lub dostrajanie modeli sztucznej inteligencji. Skorzystaj z poniższych zaleceń jako struktury, aby tworzyć niegeneracyjne obciążenia sztucznej inteligencji.
Wybierz niegeneracyjną platformę sztucznej inteligencji. Usługi Azure AI oferują wstępnie utworzone modele sztucznej inteligencji, które nie wymagają umiejętności nauki o danych. Aby uzyskać wskazówki dotyczące wybierania odpowiedniej usługi Azure AI, zobacz Wybieranie technologii usług Azure AI. Usługa Azure Machine Learning udostępnia platformę do tworzenia modeli uczenia maszynowego z własnymi danymi i korzystania z tych modeli w obciążeniach sztucznej inteligencji.
Wybierz odpowiednie obliczenia sztucznej inteligencji. W przypadku usługi Azure Machine Learning potrzebne są zasoby obliczeniowe do uruchomienia zadania lub hostowania punktu końcowego. Użyj typu obliczeniowego spełniającego wymagania dotyczące wydajności i budżetu. Usługi azure AI nie wymagają zasobów obliczeniowych.
Wybierz źródło danych. W przypadku usługi Azure Machine Learning użyj jednego z obsługiwanych źródeł danych do hostowania danych szkoleniowych. W przypadku usług sztucznej inteligencji platformy Azure wiele usług nie wymaga precyzyjnego dostrajania danych, a niektóre, takie jak usługa Azure AI Custom Vision, udostępniają opcję przekazywania plików lokalnych do zarządzanego rozwiązania magazynu danych.
Wybierz platformę obliczeniową. Użyj drzewa decyzyjnego obliczeń platformy Azure, aby wybrać odpowiednią platformę obciążenia.
Wybierz usługę przetwarzania danych (opcjonalnie). Usługa Azure Functions jest typowym wyborem przetwarzania danych, ponieważ zapewnia opcję bezserwerową. Usługa Azure Event Grid jest również typowym mechanizmem wyzwalacza umożliwiającym rozpoczęcie potoku przetwarzania danych.