Udostępnij za pośrednictwem


Aktualizacja procesów uczenia maszynowego do modeli docelowych w środowisku Unity Catalog

W tym artykule wyjaśniono, jak migrować i uaktualniać istniejące przepływy pracy usługi Databricks do używania modeli w środowisku Unity Catalog.

Wymagania

Wymagane uprawnienia

Aby wykonać trenowanie, wdrażanie lub wnioskowanie modelu w Unity Catalog, osoba z uprawnieniami uruchamiająca przepływ pracy musi posiadać uprawnienia USE CATALOG i USE SCHEMA na catalog i schema, które przechowują model.

Wymagane są również następujące uprawnienia:

  • Aby utworzyć model, podmiot zabezpieczeń musi mieć CREATE MODEL uprawnienia.
  • Aby załadować lub wdrożyć model, podmiot zabezpieczeń musi mieć EXECUTE uprawnienia do zarejestrowanego modelu.

Tylko właściciel zarejestrowanego modelu może wykonać następujące czynności:

  • Utwórz nową wersję modelu.
  • Set alias dla zarejestrowanego modelu.

Wymagania dotyczące obliczeń

Zasób obliczeniowy określony dla przepływu pracy musi mieć dostęp do środowiska Unity Catalog. Zobacz Tryby dostępu.

Tworzenie przepływów pracy uczenia równoległego, wdrażania i wnioskowania

Aby uaktualnić przepływy pracy związane z trenowaniem i wnioskowaniem modelu do Unity Catalog, usługa Databricks zaleca podejście przyrostowe, w którym tworzysz równoległy proces trenowania, wdrażania i wnioskowania, który korzysta z modeli w Unity Catalog. Jeśli jesteś zadowolony z wyników przy użyciu Unity Catalog, możesz przełączyć użytkowników dalej w łańcuchu, aby odczytywali wyjściowe dane wsadowe, lub zwiększyć ruch kierowany do modeli w Unity Catalog na punktach końcowych obsługi.

Przepływ pracy trenowania modelu

Sklonuj przepływ pracy trenowania modelu. Upewnij się, że podmiot zabezpieczeń uruchamiający przepływ pracy i obliczenia określone dla przepływu pracy spełniają wymagania.

Następnie zmodyfikuj kod trenowania modelu w sklonowanym przepływie pracy. Może być konieczne sklonowanie notesu uruchamianego przez przepływ pracy lub utworzenie nowej gałęzi git w sklonowanym przepływie pracy. Wykonaj tych kroków, aby zainstalować niezbędną wersję biblioteki MLflow i skonfigurować klienta w celu kierowania Catalog aparatu Unity w kodzie trenowania. Następnie update kod trenowania modelu, aby zarejestrować modele w środowisku Unity Catalog. Zobacz Trenowanie i rejestrowanie modeli zgodnych z platformą Unity Catalog.

Przepływ pracy wdrażania modelu

Sklonuj przepływ pracy wdrażania modelu. Upewnij się, że podmiot zabezpieczeń uruchamiający przepływ pracy i obliczenia określone dla przepływu pracy spełniają wymagania.

Jeśli masz logikę walidacji modelu w przepływie pracy wdrażania, update ją, aby załadować wersje modelu z UC. Użyj aliasów do zarządzania wdrożeniami modelu produkcyjnego.

Przepływ pracy wnioskowania modelu

Przepływ pracy wnioskowania wsadowego

Sklonuj przepływ pracy wnioskowania wsadowego. Upewnij się, że podmiot zabezpieczeń uruchamiający przepływ pracy i obliczenia określone dla przepływu pracy spełniają wymagania.

Przepływ pracy obsługujący model

Jeśli używasz usługi Mosaic AI Model Serving, nie musisz klonować istniejącego punktu końcowego. Zamiast tego użyj funkcji podziału ruchu , aby rozpocząć kierowanie małego ułamka ruchu do modeli w środowisku Unity Catalog. Podczas przeglądania wyników w Unity Catalog, zwiększ ilość ruchu aż do przekierowania całego ruchu.

Podwyższanie poziomu modelu w różnych środowiskach

Promowanie modelu w różnych środowiskach działa inaczej z modelami w środowisku Unity Catalog. Aby uzyskać szczegółowe informacje, zobacz Podwyższanie poziomu modelu w różnych środowiskach.

Używanie elementów webhook zadań do ręcznego zatwierdzania wdrożenia modelu

Usługa Databricks zaleca zautomatyzowanie wdrażania modelu, jeśli to możliwe, przy użyciu odpowiednich testów i testów podczas procesu wdrażania modelu. Jeśli jednak konieczne jest wykonanie ręcznych zatwierdzeń w celu wdrożenia modeli produkcyjnych, możesz użyć powiadomień zadań , aby wywołać zewnętrzne systemy ciągłej integracji/ciągłego wdrażania w celu żądania ręcznego zatwierdzenia wdrożenia modelu po pomyślnym zakończeniu zadania trenowania modelu. Po ręcznym zatwierdzeniu system ciągłej integracji/ciągłego wdrażania może następnie wdrożyć wersję modelu w celu obsługi ruchu, na przykład przez ustawienie aliasu "Champion" na nim.