Dowiedz się, jak wygenerować osadzanie za pomocą usługi Azure OpenAI
Osadzanie to specjalny format reprezentacji danych, który może być łatwo używany przez modele i algorytmy uczenia maszynowego. Osadzanie to gęsta reprezentacja semantycznego znaczenia tekstu. Każde osadzanie jest wektorem liczb zmiennoprzecinkowych, tak aby odległość między dwoma osadzaniami w przestrzeni wektorowej została skorelowana z podobieństwem semantycznym między dwoma danymi wejściowymi w oryginalnym formacie. Jeśli na przykład dwa teksty są podobne, ich reprezentacje wektorowe również powinny być podobne. Osadzanie wyszukiwania wektorów zasilania w bazach danych platformy Azure, takich jak Azure Cosmos DB for MongoDB vCore , Azure SQL Database lub Azure Database for PostgreSQL — serwer elastyczny.
Jak uzyskać osadzanie
Aby uzyskać wektor osadzania dla fragmentu tekstu, wysyłamy żądanie do punktu końcowego osadzania, jak pokazano w poniższych fragmentach kodu:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Najlepsze rozwiązania
Sprawdź, czy dane wejściowe nie przekraczają maksymalnej długości
- Maksymalna długość tekstu wejściowego dla naszych najnowszych modeli osadzania wynosi 8192 tokenów. Przed złożeniem żądania należy sprawdzić, czy dane wejściowe nie przekraczają tego limitu.
- W przypadku wysyłania tablicy danych wejściowych w jednym żądaniu osadzania maksymalny rozmiar tablicy to 2048.
- Podczas wysyłania tablicy danych wejściowych w jednym żądaniu należy pamiętać, że liczba tokenów na minutę w żądaniach musi pozostać poniżej limitu przydziału przypisanego podczas wdrażania modelu. Domyślnie modele osadzania najnowszej generacji 3 podlegają limitowi 350 K TPM na region.
Ograniczenia i czynniki ryzyka
Nasze modele osadzania mogą być zawodne lub stanowić zagrożenie społeczne w niektórych przypadkach i mogą powodować szkody w przypadku braku środków zaradczych. Zapoznaj się z naszą zawartością odpowiedzialnej sztucznej inteligencji, aby uzyskać więcej informacji na temat odpowiedzialnego podejścia do ich używania.
Następne kroki
- Dowiedz się więcej na temat korzystania z usługi Azure OpenAI i osadzania w celu przeprowadzania wyszukiwania dokumentów za pomocą naszego samouczka osadzania.
- Dowiedz się więcej o modelach bazowych, które zasilają usługę Azure OpenAI.
- Zapisz osadzanie i przeprowadź wyszukiwanie wektorów (podobieństwa) przy użyciu wybranej usługi:
- Azure AI Search
- Usługa Azure Cosmos DB dla rdzeni wirtualnych bazy danych MongoDB
- Azure SQL Database
- Azure Cosmos DB for NoSQL
- Azure Cosmos DB for PostgreSQL
- Serwery — Azure Database for PostgreSQL — serwer elastyczny
- Azure Cache for Redis
- Używanie usługi Eventhouse jako wektorowej bazy danych — analiza w czasie rzeczywistym w usłudze Microsoft Fabric