Uppgradera ML-arbetsflöden till målmodeller i Unity Catalog
Den här artikeln beskriver hur du migrerar och uppgraderar befintliga Databricks-arbetsflöden att använda modeller i Unity Catalog.
Krav
Privilegier som krävs
Om du vill köra ett arbetsflöde för modellträning, distribution eller slutsatsdragning i Unity Catalog måste huvudkontot som kör arbetsflödet ha USE CATALOG
och USE SCHEMA
behörigheter i katalogen och schemat som innehåller modellen.
Följande behörigheter krävs också:
- För att skapa en modell måste huvudkontot ha behörigheten
CREATE MODEL
. - För att kunna läsa in eller distribuera en modell måste huvudkontot ha behörigheten
EXECUTE
för den registrerade modellen.
Endast ägaren av en registrerad modell kan göra följande:
- Skapa en ny modellversion.
- Ange ett alias för en registrerad modell.
Beräkningskrav
Den beräkningsresurs som angetts för arbetsflödet måste ha åtkomst till Unity Catalog. Se Åtkomstlägen.
Skapa parallella arbetsflöden för träning, distribution och slutsatsdragning
För att uppgradera modelltränings- och slutsatsdragningsarbetsflöden till Unity Catalog rekommenderar Databricks en inkrementell metod där du skapar en parallell pipeline för träning, distribution och slutsatsdragning som utnyttjar modeller i Unity Catalog. När du är nöjd med resultatet med Unity Catalog kan du växla nedströmsanvändare för att läsa batchinferensutdata eller öka trafiken som dirigeras till modeller i Unity Catalog i serverslutpunkter.
Arbetsflöde för modellträning
Klona arbetsflödet för modellträning. Bekräfta att huvudkontot som kör arbetsflödet och den beräkning som angetts för arbetsflödet uppfyller kraven.
Ändra sedan modellträningskoden i det klonade arbetsflödet. Du kan behöva klona anteckningsboken som körs av arbetsflödet eller skapa och rikta in dig på en ny git-gren i det klonade arbetsflödet. Följ de här stegen för att installera den nödvändiga versionen av MLflow och konfigurera klienten så att den riktar in sig på Unity Catalog i träningskoden. Uppdatera sedan modellträningskoden för att registrera modeller till Unity Catalog. Se Träna och registrera Unity Catalog-kompatibla modeller.
Arbetsflöde för modelldistribution
Klona arbetsflödet för modelldistribution. Bekräfta att huvudkontot som kör arbetsflödet och den beräkning som angetts för arbetsflödet uppfyller kraven.
Om du har modellverifieringslogik i distributionsarbetsflödet uppdaterar du den till läsa in modellversioner från UC. Använd alias för att hantera distributioner av produktionsmodeller.
Arbetsflöde för modellinferens
Arbetsflöde för batchinferens
Klona arbetsflödet för batchinferens. Bekräfta att huvudkontot som kör arbetsflödet och den beräkning som angetts för arbetsflödet uppfyller kraven.
Arbetsflöde för modellservering
Om du använder Mosaic AI Model Serving behöver du inte klona din befintliga slutpunkt. Använd i stället funktionen trafikdelning för att börja dirigera en liten del av trafiken till modeller i Unity Catalog. När du granskar resultaten med Unity Catalog ökar du mängden trafik tills all trafik omdirigeras.
Höja upp en modell mellan miljöer
Att marknadsföra en modell mellan miljöer fungerar annorlunda med modeller i Unity Catalog. Mer information finns i Flytta upp en modell mellan miljöer.
Använda jobbwebbhooks för manuellt godkännande för modelldistribution
Databricks rekommenderar att du automatiserar modelldistributionen om möjligt med hjälp av lämpliga kontroller och tester under modelldistributionsprocessen. Men om du behöver utföra manuella godkännanden för att distribuera produktionsmodeller kan du använda jobbmeddelanden för att anropa externa CI/CD-system för att begära manuellt godkännande för att distribuera en modell när modellträningsjobbet har slutförts. När manuellt godkännande har angetts kan ditt CI/CD-system sedan distribuera modellversionen för att hantera trafik, till exempel genom att ange aliaset "Champion" på den.