Zelfstudie: Wizard voor scoren van het Machine learning-model voor toegewezen SQL-pools
Meer informatie over hoe u uw gegevens in toegewezen SQL-pools eenvoudig kunt verrijken met voorspellende Machine Learning-modellen. De modellen die uw gegevensanalisten maken, zijn nu eenvoudig toegankelijk voor gegevensprofessionals voor predictive analytics. Een gegevensprofessional in Azure Synapse Analytics kan eenvoudig een model selecteren in het Azure Machine Learning-modelregister voor implementatie in Azure Synapse SQL-pools en voorspellingen starten om de gegevens te verrijken.
In deze zelfstudie leert u het volgende:
- Een voorspellend machine learning-model trainen en het model registreren in het Azure Machine Learning-modelregister.
- Gebruik de sql-scorewizard om voorspellingen te starten in een toegewezen SQL-pool.
Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.
Vereisten
- Azure Synapse Analytics-werkruimte met een Azure Data Lake Storage Gen2-opslagaccount dat is geconfigureerd als de standaardopslag. U moet de Bijdrager voor opslagblobgegevens zijn van het Data Lake Storage Gen2-bestandssysteem waarmee u werkt.
- Toegewezen SQL-pool in uw Azure Synapse Analytics-werkruimte. Zie Een toegewezen SQL-pool maken voor meer informatie.
- Met Azure Machine Learning gekoppelde service in uw Azure Synapse Analytics-werkruimte. Raadpleeg Een met Azure Machine Learning gekoppelde service maken in Azure Synapse voor meer informatie.
Aanmelden bij Azure Portal
Meld u aan bij de Azure-portal.
Een model trainen in Azure Machine Learning
Controleer voordat u begint of uw versie van sklearn 0.20.3 is.
Voordat u alle cellen in het notebook uitvoert, controleert u of het rekenproces wordt uitgevoerd.
Ga naar uw Azure Machine Learning-werkruimte.
Download Voorspellen NYC Taxi Tips.ipynb.
Open de Azure Machine Learning-werkruimte in Azure Machine Learning Studio.
Ga naar NotitieblokkenBestanden uploaden>. Selecteer vervolgens het bestand Predict NYC Taxi Tips.ipynb dat u hebt gedownload en upload het.
Nadat het notitieblok is geüpload en geopend, selecteert u Alle cellen uitvoeren.
Een van de cellen kan mislukken en u wordt gevraagd om te verifiëren bij Azure. Let hierop in de celuitvoer en verifieer in uw browser door de koppeling te volgen en de code in te voeren. Voer het notebook vervolgens opnieuw uit.
Het notebook traint een ONNX-model en registreert het bij MLflow. Ga naar Modellen om te controleren of het nieuwe model correct is geregistreerd.
Als u het notebook uitvoert, worden de testgegevens geëxporteerd naar een CSV-bestand. Download het CSV-bestand naar uw lokale systeem. Later importeert u het CSV-bestand in een toegewezen SQL-pool en gebruikt u de gegevens om het model te testen.
Het CSV-bestand wordt gemaakt in dezelfde map als het notebook-bestand. Selecteer Vernieuwen in Bestandenverkenner als u dit niet meteen ziet.
Voorspellingen starten met de SQL-scorewizard
Open de Azure Synapse-werkruimte met Synapse Studio.
Ga naarGekoppelde>opslagaccounts voor gegevens>. Upload
test_data.csv
naar de standaard opslagaccount.Ga naar Ontwikkel>SQL-scripts. Maak een nieuw SQL-script om
test_data.csv
in uw toegewezen SQL-pool te laden.Notitie
Werk de bestands-URL in dit script bij voordat u deze uitvoert.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Ga naar Gegevens>Werkruimte. Open de SQL wizard voor scoren door met de rechtermuisknop te klikken op de tabel van de toegewezen SQL-pool. Selecteer Machine Learning>Voorspellen met een model.
Notitie
De optie machine learning wordt alleen weergegeven als u een gekoppelde service hebt gemaakt voor Azure Machine Learning. (Zie Vereisten aan het begin van deze zelfstudie.)
Selecteer een gekoppelde Azure Machine Learning-werkruimte in de vervolgkeuzelijst. Met deze stap wordt een lijst met machine learning-modellen geladen uit het modelregister van de gekozen Azure Machine Learning-werkruimte. Momenteel worden alleen ONNX-modellen ondersteund, dus in deze stap worden alleen ONNX-modellen weergegeven.
Selecteer het model dat u zojuist hebt getraind en selecteer vervolgens Doorgaan.
Wijs de tabelkolommen toe aan de modelinvoer en geef de modeluitvoer op. Als het model is opgeslagen in de MLflow-indeling en de modelhandtekening is ingevuld, wordt de toewijzing automatisch voor u uitgevoerd met behulp van een logica op basis van de overeenkomsten van namen. De interface ondersteunt ook handmatige toewijzing.
Selecteer Doorgaan.
De gegenereerde T-SQL-code wordt verpakt in een opgeslagen procedure. Daarom moet u een opgeslagen procedurenaam opgeven. Het binaire model, inclusief metagegevens (versie, beschrijving en andere informatie), wordt fysiek gekopieerd van Azure Machine Learning naar een toegewezen SQL-pooltabel. U moet dus opgeven in welke tabel u het model wilt opslaan.
U kunt Bestaande tabel of Nieuwe maken kiezen. Wanneer u klaar bent, selecteert u Model implementeren + script openen om het model te implementeren en een T-SQL-voorspellingsscript te genereren.
Nadat het script is gegenereerd, selecteert u Uitvoeren om de score uit te voeren en voorspellingen op te halen.