Udostępnij za pośrednictwem


Wdrażanie modeli na potrzeby wnioskowania wsadowego i przewidywania

Artykuł opisuje, co Databricks zaleca dla wnioskowania wsadowego.

Aby uzyskać informacje na temat wdrażania modeli w czasie rzeczywistym na platformie Azure Databricks, zobacz Wdrażanie modeli za pomocą Mosaic AI Model Serving.

Używanie ai_query do wnioskowania wsadowego

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

Usługa Databricks zaleca używanie funkcji ai_query z obsługą modelu na potrzeby wnioskowania wsadowego. ai_query to wbudowana funkcja SQL usługi Databricks, która umożliwia wykonywanie zapytań dotyczących istniejących modeli obsługujących punkty końcowe przy użyciu języka SQL. Został zweryfikowany w celu niezawodnego i spójnego przetwarzania zestawów danych w zakresie miliardów tokenów. Aby uzyskać więcej informacji na temat tej funkcji sztucznej inteligencji, zobacz ai_query funkcji .

W przypadku szybkiego eksperymentowania można używać z punktami ai_query płatności za token, ponieważ te punkty końcowe są wstępnie skonfigurowane w obszarze roboczym.

Gdy wszystko będzie gotowe do uruchamiania wnioskowania wsadowego na dużych lub produkcyjnych danych, usługa Databricks zaleca używanie aprowiowanych punktów końcowych przepływności w celu uzyskania szybszej wydajności. Zobacz Aprowizowane interfejsy API modelu przepływności foundation, aby utworzyć punkt końcowy aprowizowanej przepływności.