Brama mozaiki sztucznej inteligencji
Ważne
Ta funkcja jest dostępna w publicznej wersji zapoznawczej.
W tym artykule opisano usługę Mosaic AI Gateway, rozwiązanie usługi Databricks do zarządzania dostępem i monitorowania do obsługiwanych modeli generowania sztucznej inteligencji oraz skojarzonych z nimi modeli obsługujących punkty końcowe.
Co to jest brama mozaiki sztucznej inteligencji?
Brama mozaiki sztucznej inteligencji została zaprojektowana w celu usprawnienia korzystania z modeli generacyjnych sztucznej inteligencji i zarządzania nimi w organizacji. Jest to scentralizowana usługa, która zapewnia ład, monitorowanie i gotowość produkcyjną do modelowania obsługujących punkty końcowe. Umożliwia również uruchamianie, zabezpieczanie i zarządzanie ruchem sztucznej inteligencji w celu demokratyzacji i przyspieszenia wdrażania sztucznej inteligencji w organizacji.
Wszystkie dane są rejestrowane w tabelach delty w wykazie aparatu Unity.
Aby rozpocząć wizualizowanie szczegółowych informacji z danych bramy sztucznej inteligencji, pobierz przykładowy pulpit nawigacyjny bramy AI z usługi GitHub. Ten pulpit nawigacyjny korzysta z danych ze śledzenia użycia i tabel wnioskowania o ładunku.
Po pobraniu pliku JSON zaimportuj pulpit nawigacyjny do obszaru roboczego. Aby uzyskać instrukcje dotyczące importowania pulpitów nawigacyjnych, zobacz Importowanie pliku pulpitu nawigacyjnego.
Brama sztucznej inteligencji obsługuje następujące funkcje:
- Ograniczanie uprawnień i szybkości w celu kontrolowania, kto ma dostęp i ile dostępu.
- Rejestrowanie ładunku w celu monitorowania i inspekcji danych wysyłanych do interfejsów API modelu przy użyciu tabel wnioskowania.
- Śledzenie użycia w celu monitorowania użycia operacji w punktach końcowych i skojarzonych kosztów przy użyciu tabel systemowych.
- Zabezpieczenia sztucznej inteligencji, aby zapobiec niepożądanym danym i niebezpiecznym danym w żądaniach i odpowiedziach.
- Routing ruchu w celu zminimalizowania przestojów produkcyjnych podczas wdrażania i po jego wdrożeniu.
Brama mozaiki sztucznej inteligencji wiąże się z opłatami w oparciu o włączoną funkcję. W wersji zapoznawczej te płatne funkcje obejmują zabezpieczenia sztucznej inteligencji, rejestrowanie ładunków i śledzenie użycia. Funkcje, takie jak uprawnienia zapytań, ograniczanie szybkości i routing ruchu, są bezpłatne. Opłaty za wszystkie nowe funkcje są naliczane.
W poniższej tabeli przedstawiono współczynnik jednostek usługi Databricks (DBU) na milion tokenów (M) dla płatnych funkcji bramy sztucznej inteligencji. Opłaty są wymienione w Serverless Real-time Inference
ramach jednostki SKU.
Funkcja | Szybkość jednostki DBU |
---|---|
Zabezpieczenia sztucznej inteligencji | 21,429 JEDNOSTEK DBU na tokeny M |
Rejestrowanie ładunku | 2,857 JEDNOSTEK DBU na tokeny języka M |
Śledzenie użycia | 0,571 JEDNOSTEK DBU na tokeny języka M |
Zabezpieczenia sztucznej inteligencji
Zabezpieczenia sztucznej inteligencji umożliwiają użytkownikom konfigurowanie i wymuszanie zgodności danych na poziomie punktu końcowego obsługującego model oraz zmniejszanie szkodliwej zawartości wszystkich żądań wysyłanych do modelu bazowego. Nieprawidłowe żądania i odpowiedzi są blokowane, a do użytkownika jest zwracany komunikat domyślny. Zobacz , jak skonfigurować zabezpieczenia w punkcie końcowym obsługującym model.
Ważne
Zabezpieczenia sztucznej inteligencji są dostępne tylko w regionach, które obsługują interfejsy API modelu foundation pay-per-token.
Poniższa tabela zawiera podsumowanie konfigurowalnych poręczy.
Poręcze | Definicja |
---|---|
Filtrowanie bezpieczeństwa | Filtrowanie bezpieczeństwa uniemożliwia modelowi interakcję z niebezpieczną i szkodliwą zawartością, na przykład z przestępczością brutalną, samookaleczeniami i mową nienawiści. Filtr bezpieczeństwa bramy sztucznej inteligencji został skompilowany za pomocą meta llama 3. Usługa Databricks używa funkcji Llama Guard 2-8b jako filtru bezpieczeństwa. Aby dowiedzieć się więcej o filtrze bezpieczeństwa llama Guard i tematach dotyczących filtru bezpieczeństwa, zobacz kartę modelu Meta Llama Guard 2 8B. Meta Llama 3 jest licencjonowany w ramach licencji LLAMA 3 Community License, Copyright © Meta Platform, Inc. Wszelkie prawa zastrzeżone. Klienci są odpowiedzialni za zapewnienie zgodności z odpowiednimi licencjami modelu. |
Wykrywanie danych osobowych | Klienci mogą wykrywać wszelkie poufne informacje, takie jak nazwy, adresy, numery kart kredytowych dla użytkowników. W przypadku tej funkcji usługa AI Gateway używa interfejsu Presidio do wykrywania następujących kategorii amerykańskich danych piI: numery kart kredytowych, adresy e-mail, numery telefonów, numery kont bankowych i numery ubezpieczenia społecznego. Klasyfikator piI może pomóc zidentyfikować poufne informacje lub dane osobowe w danych ustrukturyzowanych i nieustrukturyzowanych. Ponieważ jednak korzysta ona z mechanizmów automatycznego wykrywania, nie ma gwarancji, że usługa znajdzie wszystkie poufne informacje. W związku z tym należy stosować dodatkowe systemy i zabezpieczenia. Te metody klasyfikacji są głównie ograniczone do kategorii amerykańskich danych pii, takich jak numery telefonów USA i numery ubezpieczenia społecznego. |
Moderowanie tematów | Możliwość wyświetlania listy dozwolonych tematów. Biorąc pod uwagę żądanie czatu, ta poręcz flaguje żądanie, jeśli jego temat nie znajduje się w dozwolonych tematach. |
Filtrowanie słów kluczowych | Klienci mogą określić różne zestawy nieprawidłowych słów kluczowych zarówno dla danych wejściowych, jak i wyjściowych. Jednym z potencjalnych przypadków użycia filtrowania słów kluczowych jest to, że model nie mówi o konkurentach. Ta blokada używa słowa kluczowego lub dopasowania ciągu, aby zdecydować, czy słowo kluczowe istnieje w treści żądania lub odpowiedzi. |
Korzystanie z bramy sztucznej inteligencji
Funkcje bramy sztucznej inteligencji można skonfigurować w modelu obsługującym punkty końcowe przy użyciu interfejsu użytkownika obsługującego. Zobacz Konfigurowanie bramy sztucznej inteligencji w modelu obsługujących punkty końcowe.
Ograniczenia
Poniżej przedstawiono ograniczenia w okresie obowiązywania wersji zapoznawczej:
- Brama sztucznej inteligencji jest obsługiwana tylko w przypadku punktów końcowych obsługujących modele zewnętrzne.
- Gdy są używane poręcze, rozmiar partii żądania, czyli rozmiar partii osadzania, rozmiar partii ukończenia lub
n
parametr żądania czatu, nie może przekraczać 16.