Samouczek: Kreator oceniania modelu uczenia maszynowego dla dedykowanych pul SQL
Dowiedz się, jak łatwo wzbogacić dane w dedykowanych pulach SQL za pomocą predykcyjnych modeli uczenia maszynowego. Modele tworzone przez analityków danych są teraz łatwo dostępne dla specjalistów ds. danych na potrzeby analizy predykcyjnej. Specjalista od danych w usłudze Azure Synapse Analytics może po prostu wybrać model z rejestru modeli usługi Azure Machine Learning do wdrożenia w pulach Azure Synapse SQL i uruchamiać przewidywania w celu wzbogacania danych.
Z tego samouczka dowiesz się, jak wykonywać następujące czynności:
- Trenowanie predykcyjnego modelu uczenia maszynowego i rejestrowanie modelu w rejestrze modeli usługi Azure Machine Learning.
- Użyj kreatora oceniania SQL, aby uruchomić przewidywania w dedykowanej puli SQL.
Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Wymagania wstępne
- obszar roboczy usługi Azure Synapse Analytics z kontem magazynu Azure Data Lake Storage Gen2 skonfigurowanym jako magazyn domyślny. Musisz być współautorem danych obiektów blob usługi Storage w systemie plików Data Lake Storage Gen2, z którym pracujesz.
- Dedykowana pula SQL w obszarze roboczym usługi Azure Synapse Analytics. Aby uzyskać szczegółowe informacje, zobacz Tworzenie dedykowanej puli SQL.
- Połączona usługa Azure Machine Learning w obszarze roboczym usługi Azure Synapse Analytics. Aby uzyskać szczegółowe informacje, zobacz Tworzenie połączonej usługi Azure Machine Learning w Azure Synapse.
Logowanie się do witryny Azure Portal
Zaloguj się do Azure portal.
Trenowanie modelu w usłudze Azure Machine Learning
Przed rozpoczęciem sprawdź, czy wersja narzędzia sklearn to 0.20.3.
Przed uruchomieniem wszystkich komórek w notesie sprawdź, czy wystąpienie obliczeniowe jest uruchomione.
Przejdź do obszaru roboczego usługi Azure Machine Learning.
Pobierz plik Predict NYC Taxi Tips.ipynb.
Otwórz obszar roboczy usługi Azure Machine Learning w usłudze Azure Machine Learning Studio.
Przejdź do pozycji Notesy>Przekaż pliki. Następnie wybierz pobrany plik Predict NYC Taxi Tips.ipynb i przekaż go.
Po przekazaniu i otwarciu notesu wybierz pozycję Uruchom wszystkie komórki.
Jedna z komórek może zakończyć się niepowodzeniem i poprosić o uwierzytelnienie na platformie Azure. Obejrzyj to w danych wyjściowych komórek i uwierzytelnij się w przeglądarce, postępując zgodnie z linkiem i wprowadzając kod. Następnie uruchom ponownie notes.
Notes wytrenuje model ONNX i zarejestruje go za pomocą biblioteki MLflow. Przejdź do pozycji Modele , aby sprawdzić, czy nowy model jest poprawnie zarejestrowany.
Uruchomienie notesu spowoduje również wyeksportowanie danych testowych do pliku CSV. Pobierz plik CSV do systemu lokalnego. Później zaimportujesz plik CSV do dedykowanej puli SQL i użyjesz danych do przetestowania modelu.
Plik CSV jest tworzony w tym samym folderze co plik notesu. Wybierz pozycję Odśwież w Eksplorator plików, jeśli nie widzisz go od razu.
Uruchamianie przewidywań za pomocą kreatora oceniania SQL
Otwórz obszar roboczy Azure Synapse przy użyciu Synapse Studio.
Przejdź do pozycjiPołączone>konta magazynudanych>. Przekaż
test_data.csv
do domyślnego konta magazynu.Przejdź do pozycji Opracowywanie>skryptów SQL. Utwórz nowy skrypt SQL do załadowania
test_data.csv
do dedykowanej puli SQL.Uwaga
Przed uruchomieniem tego skryptu zaktualizuj adres URL pliku.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Przejdź doobszaru roboczegodanych>. Otwórz kreatora oceniania SQL, klikając prawym przyciskiem myszy dedykowaną tabelę puli SQL. Wybierz pozycję Machine LearningPredict with a model (Przewidywanieusługi Machine Learning> przy użyciu modelu).
Uwaga
Opcja uczenia maszynowego nie jest wyświetlana, chyba że masz połączoną usługę utworzoną dla usługi Azure Machine Learning. (Zobacz Wymagania wstępne na początku tego samouczka).
Wybierz połączony obszar roboczy usługi Azure Machine Learning w polu listy rozwijanej. Ten krok ładuje listę modeli uczenia maszynowego z rejestru modeli wybranego obszaru roboczego usługi Azure Machine Learning. Obecnie obsługiwane są tylko modele ONNX, więc w tym kroku będą wyświetlane tylko modele ONNX.
Wybierz właśnie wytrenowany model, a następnie wybierz pozycję Kontynuuj.
Zamapuj kolumny tabeli na dane wejściowe modelu i określ dane wyjściowe modelu. Jeśli model zostanie zapisany w formacie MLflow i podpis modelu zostanie wypełniony, mapowanie zostanie wykonane automatycznie przy użyciu logiki opartej na podobieństwie nazw. Interfejs obsługuje również ręczne mapowanie.
Wybierz opcję Kontynuuj.
Wygenerowany kod T-SQL jest opakowany w procedurę składowaną. Dlatego należy podać nazwę procedury składowanej. Dane binarne modelu, w tym metadane (wersja, opis i inne informacje) zostaną fizycznie skopiowane z usługi Azure Machine Learning do dedykowanej tabeli puli SQL. Dlatego należy określić tabelę, w której ma być zapisywany model.
Możesz wybrać opcję Istniejąca tabela lub Utwórz nową. Po zakończeniu wybierz pozycję Wdróż model i otwarty skrypt , aby wdrożyć model i wygenerować skrypt przewidywania języka T-SQL.
Po wygenerowaniu skryptu wybierz pozycję Uruchom , aby wykonać ocenianie i uzyskać przewidywania.