Delen via


Analyses uitvoeren met Machine Learning Studio (klassiek) met behulp van een SQL Server-database

VAN TOEPASSING OP: Van toepassing op. Machine Learning Studio (klassiek) Is niet van toepassing op.Azure Machine Learning

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Ondernemingen die met on-premises gegevens werken, willen vaak profiteren van de schaal en flexibiliteit van de cloud voor hun machine learning-workloads. Maar ze willen hun huidige bedrijfsprocessen en werkstromen niet verstoren door hun on-premises gegevens naar de cloud te verplaatsen. Machine Learning Studio (klassiek) ondersteunt nu het lezen van uw gegevens uit een SQL Server-database en vervolgens het trainen en scoren van een model met deze gegevens. U hoeft de gegevens niet meer handmatig te kopiëren en te synchroniseren tussen de cloud en uw on-premises server. In plaats daarvan kan de module Gegevens importeren in Machine Learning Studio (klassiek) nu rechtstreeks vanuit uw SQL Server-database lezen voor uw trainings- en scoretaken.

Dit artikel bevat een overzicht van het inkomende SQL Server-gegevens in Machine Learning Studio (klassiek). Hierbij wordt ervan uitgegaan dat u bekend bent met Studio-concepten (klassiek), zoals werkruimten, modules, gegevenssets, experimenten, enzovoort.

Notitie

Deze functie is niet beschikbaar voor gratis werkruimten. Zie Prijzen van Machine Learning Studio (klassiek) voor meer informatie over prijzen en categorieën voor Machine Learning.

De zelf-hostende Integration Runtime van Data Factory installeren

Als u toegang wilt krijgen tot een SQL Server-database in Machine Learning Studio (klassiek), moet u de zelf-hostende Integration Runtime van Data Factory downloaden en installeren, voorheen bekend als de Gegevensbeheer Gateway. Wanneer u de verbinding in Machine Learning Studio (klassiek) configureert, hebt u de mogelijkheid om de Integration Runtime (IR) te downloaden en te installeren met behulp van het dialoogvenster Gegevensgateway downloaden en registreren, zoals hieronder wordt beschreven.

U kunt de IR ook van tevoren installeren door het MSI-installatiepakket te downloaden en uit te voeren vanuit het Microsoft Downloadcentrum. De MSI kan ook worden gebruikt om een bestaande IR te upgraden naar de nieuwste versie, waarbij alle instellingen behouden blijven.

De Zelf-hostende Integration Runtime van Data Factory heeft de volgende vereisten:

  • Voor de zelf-hostende integratie van Data Factory is een 64-bits besturingssysteem met .NET Framework 4.6.1 of hoger vereist.
  • De ondersteunde versies van het Windows-besturingssysteem zijn Windows 10, Windows Server 2012, Windows Server 2012 R2, Windows Server 2016.
  • De aanbevolen configuratie voor de IR-machine is ten minste 2 GHz, 4 Core CPU, 8 GB RAM en 80 GB schijf.
  • Als de hostmachine in de sluimerstand blijft, reageert de IR niet op gegevensaanvragen. Configureer daarom een geschikt energiebeheerschema op de computer voordat u de IR installeert. Als de machine is geconfigureerd voor sluimerstand, wordt in de IR-installatie een bericht weergegeven.
  • Omdat de kopieeractiviteit plaatsvindt met een specifieke frequentie, volgt het resourcegebruik (CPU, geheugen) op de computer ook hetzelfde patroon met piek- en niet-actieve tijden. Het resourcegebruik is ook sterk afhankelijk van de hoeveelheid gegevens die wordt verplaatst. Wanneer er meerdere kopieertaken worden uitgevoerd, ziet u dat het resourcegebruik tijdens piektijden toeneemt. Hoewel de hierboven vermelde minimale configuratie technisch voldoende is, wilt u mogelijk een configuratie met meer resources hebben dan de minimale configuratie, afhankelijk van uw specifieke belasting voor gegevensverplaatsing.

Houd rekening met het volgende bij het instellen en gebruiken van een zelf-hostende Integration Runtime van Data Factory:

  • U kunt slechts één exemplaar van IR installeren op één computer.

  • U kunt één IR gebruiken voor meerdere on-premises gegevensbronnen.

  • U kunt meerdere IP-aanvragen op verschillende computers verbinden met dezelfde on-premises gegevensbron.

  • U configureert een IR voor slechts één werkruimte tegelijk. Momenteel kunnen IR's niet worden gedeeld tussen werkruimten.

  • U kunt meerdere IR's configureren voor één werkruimte. U kunt bijvoorbeeld een IR gebruiken die is verbonden met uw testgegevensbronnen tijdens de ontwikkeling en een productie-IR wanneer u klaar bent om te operationeel te zijn.

  • De IR hoeft zich niet op dezelfde computer als de gegevensbron te bevinden. Maar als u dichter bij de gegevensbron blijft, vermindert u de tijd voordat de gateway verbinding maakt met de gegevensbron. U wordt aangeraden de IR te installeren op een computer die verschilt van de computer die als host fungeert voor de on-premises gegevensbron, zodat de gateway en gegevensbron niet concurreren voor resources.

  • Als u al een IR hebt geïnstalleerd op uw computer die Power BI- of Azure Data Factory-scenario's biedt, installeert u een afzonderlijke IR voor Machine Learning Studio (klassiek) op een andere computer.

    Notitie

    U kunt Data Factory Zelf-hostende Integration Runtime en Power BI Gateway niet uitvoeren op dezelfde computer.

  • U moet de zelf-hostende Integration Runtime voor Machine Learning Studio (klassiek) van Data Factory gebruiken, zelfs als u Azure ExpressRoute gebruikt voor andere gegevens. U moet uw gegevensbron behandelen als een on-premises gegevensbron (die zich achter een firewall bevindt), zelfs als u ExpressRoute gebruikt. Gebruik de zelf-hostende Integration Runtime van Data Factory om verbinding te maken tussen Machine Learning en de gegevensbron.

Gedetailleerde informatie over installatievereisten, installatiestappen en tips voor probleemoplossing vindt u in het artikel Integration Runtime in Data Factory.

Inkomende gegevens uit uw SQL Server-database naar Machine Learning

In dit scenario gaat u een Azure Data Factory Integration Runtime instellen in een Azure Machine Learning-werkruimte, deze configureren en vervolgens gegevens lezen uit een SQL Server-database.

Tip

Voordat u begint, schakelt u de pop-upblokkering van uw browser uit voor studio.azureml.net. Als u de Google Chrome-browser gebruikt, downloadt en installeert u een van de verschillende invoegtoepassingen die beschikbaar zijn in Google Chrome WebStore Klik op Eenmaal app-extensie.

Notitie

Zelf-hostende Integration Runtime van Azure Data Factory werd voorheen Gegevensbeheer Gateway genoemd. In de stapsgewijze zelfstudie wordt hiernaar verwezen als een gateway.

Stap 1: Een gateway maken

De eerste stap is het maken en instellen van de gateway voor toegang tot uw SQL-database.

  1. Meld u aan bij Machine Learning Studio (klassiek) en selecteer de werkruimte waarin u wilt werken.

  2. Klik op de blade INSTELLINGEN aan de linkerkant en klik vervolgens op het tabblad DATA GATEWAYS bovenaan.

  3. Klik onder aan het scherm op NEW DATA GATEWAY .

    Nieuwe gegevensgateway

  4. Voer in het dialoogvenster Nieuwe gegevensgateway de naam van de gateway in en voeg desgewenst een beschrijving toe. Klik op de pijl rechtsonder om naar de volgende stap van de configuratie te gaan.

    Voer de naam en beschrijving van de gateway in

  5. Kopieer in het dialoogvenster Gegevensgateway downloaden en registreren de GATEWAY-REGISTRATIESLEUTEL naar het klembord.

    Gegevensgateway downloaden en registreren

  6. Als u de Microsoft Gegevensbeheer Gateway nog niet hebt gedownload en geïnstalleerd, klikt u op Gegevensbeheergateway downloaden. Hiermee gaat u naar het Microsoft Downloadcentrum waar u de gatewayversie kunt selecteren die u nodig hebt, downloaden en installeren. Gedetailleerde informatie over installatievereisten, installatiestappen en tips voor probleemoplossing vindt u in de beginsecties van het artikel Gegevens verplaatsen tussen on-premises bronnen en de cloud met Gegevensbeheer Gateway.

  7. Nadat de gateway is geïnstalleerd, wordt de Gegevensbeheer Gateway Configuration Manager geopend en wordt het dialoogvenster Gateway registreren weergegeven. Plak de gatewayregistratiesleutel die u naar het klembord hebt gekopieerd en klik op Registreren.

  8. Als u al een gateway hebt geïnstalleerd, voert u de Gegevensbeheer Gateway Configuration Manager uit. Klik op Sleutel wijzigen, plak de gatewayregistratiesleutel die u in de vorige stap naar het klembord hebt gekopieerd en klik op OK.

  9. Wanneer de installatie is voltooid, wordt het dialoogvenster Gateway registreren voor Microsoft Gegevensbeheer Gateway Configuration Manager weergegeven. Plak de GATEWAY-REGISTRATIESLEUTEL die u in een vorige stap naar het klembord hebt gekopieerd en klik op Registreren.

    Gateway registreren

  10. De gatewayconfiguratie is voltooid wanneer de volgende waarden zijn ingesteld op het tabblad Start in Microsoft Gegevensbeheer Gateway Configuration Manager:

    • De naam van de gateway en de naam van het exemplaar worden ingesteld op de naam van de gateway.

    • Registratie is ingesteld op Geregistreerd.

    • De status is ingesteld op Gestart.

    • Op de statusbalk onderaan wordt Verbonden met Gegevensbeheer Gateway Cloud Service weergegeven, samen met een groen vinkje.

      Gegevensbeheer GatewayBeheer

      Machine Learning Studio (klassiek) wordt ook bijgewerkt wanneer de registratie is geslaagd.

    Gatewayregistratie is geslaagd

  11. Klik in het dialoogvenster Gegevensgateway downloaden en registreren op het vinkje om de installatie te voltooien. Op de pagina Instellingen wordt de gatewaystatus weergegeven als Online. In het rechterdeelvenster vindt u status en andere nuttige informatie.

    Gateway-instellingen

  12. Schakel in microsoft Gegevensbeheer Gateway Configuration Manager over naar het tabblad Certificaat. Het certificaat dat op dit tabblad is opgegeven, wordt gebruikt voor het versleutelen/ontsleutelen van referenties voor het on-premises gegevensarchief dat u in de portal opgeeft. Dit certificaat is het standaardcertificaat. Microsoft raadt u aan dit te wijzigen in uw eigen certificaat dat u back-ups maakt in uw certificaatbeheersysteem. Klik op Wijzigen om in plaats daarvan uw eigen certificaat te gebruiken.

    Gatewaycertificaat wijzigen

  13. (optioneel) Als u uitgebreide logboekregistratie wilt inschakelen om problemen met de gateway op te lossen, schakelt u in microsoft Gegevensbeheer Gateway Configuration Manager over naar het tabblad Diagnostische gegevens en schakelt u de optie Uitgebreide logboekregistratie inschakelen voor probleemoplossing in. De logboekgegevens vindt u in de Windows-Logboeken onder het knooppunt Toepassingen en Services ->Gegevensbeheer Gateway. U kunt ook het tabblad Diagnostische gegevens gebruiken om de verbinding met een on-premises gegevensbron te testen met behulp van de gateway.

    Uitgebreide logboekregistratie inschakelen

Hiermee voltooit u het installatieproces van de gateway in Machine Learning Studio (klassiek). U bent nu klaar om uw on-premises gegevens te gebruiken.

U kunt meerdere gateways maken en instellen in Studio (klassiek) voor elke werkruimte. U hebt bijvoorbeeld een gateway waarmee u tijdens de ontwikkeling verbinding wilt maken met uw testgegevensbronnen en een andere gateway voor uw productiegegevensbronnen. Machine Learning Studio (klassiek) biedt u de flexibiliteit om meerdere gateways in te stellen, afhankelijk van uw bedrijfsomgeving. Op dit moment kunt u geen gateway delen tussen werkruimten en kan er slechts één gateway op één computer worden geïnstalleerd. Zie Gegevens verplaatsen tussen on-premises bronnen en cloud met Gegevensbeheer Gateway voor meer informatie.

Stap 2: de gateway gebruiken om gegevens te lezen uit een on-premises gegevensbron

Nadat u de gateway hebt ingesteld, kunt u een importgegevensmodule toevoegen aan een experiment dat de gegevens uit de SQL Server-database invoert.

  1. Selecteer in Machine Learning Studio (klassiek) het tabblad EXPERIMENTEN , klik op +NIEUW in de linkerbenedenhoek en selecteer Leeg experiment (of selecteer een van de verschillende beschikbare voorbeeldexperimenten).

  2. Zoek en sleep de module Gegevens importeren naar het experimentcanvas.

  3. Klik op Opslaan als onder het canvas. Voer 'Machine Learning Studio (klassiek) On-Premises SQL Server-zelfstudie' in voor de naam van het experiment, selecteer de werkruimte en klik op het vinkje OK .

    Experiment opslaan met een nieuwe naam

  4. Klik op de module Gegevens importeren om deze te selecteren en selecteer vervolgens in het deelvenster Eigenschappen rechts van het canvas de optie On-Premises SQL Database in de vervolgkeuzelijst Gegevensbron .

  5. Selecteer de gegevensgateway die u hebt geïnstalleerd en geregistreerd. U kunt een andere gateway instellen door '(nieuwe gegevensgateway toevoegen...)' te selecteren.

    Gegevensgateway selecteren voor importgegevensmodule

  6. Voer de sql Database-servernaam en databasenaam in, samen met de SQL Database-query die u wilt uitvoeren.

  7. Klik op Waarden invoeren onder Gebruikersnaam en wachtwoord en voer uw databasereferenties in. U kunt geïntegreerde Windows-verificatie of SQL Server-verificatie gebruiken, afhankelijk van hoe uw SQL Server is geconfigureerd.

    Databasereferenties invoeren

    Het bericht 'waarden vereist' wordt gewijzigd in 'waarden ingesteld' met een groen vinkje. U hoeft de referenties slechts eenmaal in te voeren, tenzij de databasegegevens of het wachtwoord worden gewijzigd. Machine Learning Studio (klassiek) gebruikt het certificaat dat u hebt opgegeven toen u de gateway installeerde om de referenties in de cloud te versleutelen. Azure slaat nooit on-premises referenties op zonder versleuteling.

    Eigenschappen van gegevensmodule importeren

  8. Klik op UITVOEREN om het experiment uit te voeren.

Zodra het experiment is uitgevoerd, kunt u de gegevens visualiseren die u uit de database hebt geïmporteerd door op de uitvoerpoort van de module Gegevens importeren te klikken en Visualize te selecteren.

Zodra u klaar bent met het ontwikkelen van uw experiment, kunt u uw model implementeren en operationeel maken. Met behulp van de Batch Execution Service worden gegevens uit de SQL Server-database die is geconfigureerd in de module Gegevens importeren gelezen en gebruikt voor scoren. Hoewel u de aanvraagantwoordservice kunt gebruiken voor het scoren van on-premises gegevens, raadt Microsoft aan in plaats daarvan de Excel-invoegtoepassing te gebruiken. Op dit moment wordt het schrijven naar een SQL Server-database via ExportGegevens niet ondersteund in uw experimenten of gepubliceerde webservices.