Delen via


Gegevens importeren in Azure Machine Learning Designer

In dit artikel leert u hoe u uw eigen gegevens in de ontwerpfunctie importeert om aangepaste oplossingen te maken. U kunt gegevens op twee manieren importeren in de ontwerpfunctie:

  • Azure Machine Learning-gegevenssets: registreer gegevenssets in Azure Machine Learning om geavanceerde functies in te schakelen waarmee u uw gegevens kunt beheren.
  • Gegevensonderdeel importeren : gebruik het onderdeel Gegevens importeren om rechtstreeks toegang te krijgen tot gegevens uit onlinegegevensbronnen.

Belangrijk

Als u grafische elementen die in dit document worden vermeld, zoals knoppen in Studio of Designer, niet ziet, hebt u mogelijk niet het juiste machtigingsniveau voor de werkruimte. Neem contact op met de beheerder van uw Azure-abonnement om te controleren of u het juiste toegangsniveau hebt gekregen. Zie Gebruikers en rollen beherenvoor meer informatie.

Azure Machine Learning-gegevenssets gebruiken

U wordt aangeraden gegevenssets te gebruiken om gegevens in de ontwerpfunctie te importeren. Wanneer u een gegevensset registreert, kunt u optimaal profiteren van geavanceerde gegevensfuncties, zoals versiebeheer en tracering en gegevensbewaking.

Een gegevensset registreren

U kunt bestaande gegevenssets programmatisch registreren bij de SDK of visueel in Azure Machine Learning-studio.

U kunt de uitvoer ook registreren voor elk ontwerponderdeel als een gegevensset.

  1. Selecteer het onderdeel dat de gegevens uitvoert die u wilt registreren.

  2. Selecteer in het deelvenster Eigenschappen uitvoer en logboeken>Gegevensset registreren.

    Schermopname die laat zien hoe u naar de optie Gegevensset registreren navigeert

Als de uitvoergegevens van het onderdeel een tabelindeling hebben, moet u ervoor kiezen om de uitvoer te registreren als een bestandsgegevensset of tabellaire gegevensset.

  • Bestandsgegevensset registreert de uitvoermap van het onderdeel als een bestandsgegevensset. De uitvoermap bevat een gegevensbestand en metabestanden die de ontwerper intern gebruikt. Selecteer deze optie als u de geregistreerde gegevensset in de ontwerpfunctie wilt blijven gebruiken.

  • Gegevensset in tabelvorm registreert alleen het uitvoergegevensbestand van het onderdeel als een gegevensset in tabelvorm. Deze indeling wordt eenvoudig gebruikt door andere hulpprogramma's, bijvoorbeeld in Geautomatiseerde Machine Learning of de Python-SDK. Selecteer deze optie als u van plan bent om de geregistreerde gegevensset buiten de ontwerpfunctie te gebruiken.

Een gegevensset gebruiken

Uw geregistreerde gegevenssets vindt u in het onderdelenpalet onder Gegevenssets. Als u een gegevensset wilt gebruiken, sleept u deze naar het pijplijncanvas. Verbind vervolgens de uitvoerpoort van de gegevensset met andere onderdelen in het canvas.

Als u een bestandsgegevensset registreert, is het uitvoerpoorttype van de gegevensset AnyDirectory. Als u een tabellaire gegevensset registreert, wordt het uitvoerpoorttype van de gegevensset als DataFrameDirectory gebruikt. Houd er rekening mee dat als u de uitvoerpoort van de gegevensset verbindt met andere onderdelen in de ontwerpfunctie, het poorttype van gegevenssets en onderdelen moet worden uitgelijnd.

Schermopname van de locatie van opgeslagen gegevenssets in het ontwerppalet

Notitie

De ontwerpfunctie ondersteunt versiebeheer van gegevenssets. Geef de versie van de gegevensset op in het eigenschappenvenster van het gegevenssetonderdeel.

Beperkingen

  • Op dit moment kunt u alleen tabellaire gegevenssets visualiseren in de ontwerpfunctie. Als u een bestandsgegevensset buiten designer registreert, kunt u deze niet visualiseren in het ontwerpcanvas.
  • Momenteel ondersteunt de ontwerpfunctie alleen preview-uitvoer die zijn opgeslagen in Azure Blob Storage. U kunt uw uitvoergegevensarchief controleren en wijzigen in de Uitvoerinstellingen op het tabblad Parameters in het rechterdeelvenster van het onderdeel.
  • Als uw gegevens zijn opgeslagen in een virtueel netwerk (VNet) en u een voorbeeld wilt bekijken, moet u de beheerde identiteit van het gegevensarchief in de werkruimte inschakelen.
    1. Ga naar het gerelateerde gegevensarchief en klik op Verificatie bijwerkenReferenties bijwerken
    2. Selecteer Ja als u een beheerde identiteit voor de werkruimte wilt inschakelen. Beheerde identiteit voor werkruimte inschakelen

Gegevens importeren met het onderdeel Gegevens importeren

Hoewel u wordt aangeraden gegevenssets te gebruiken om gegevens te importeren, kunt u ook het onderdeel Gegevens importeren gebruiken. Het onderdeel Gegevens importeren slaat het registreren van uw gegevensset in Azure Machine Learning over en importeert gegevens rechtstreeks vanuit een gegevensarchief of HTTP-URL.

Zie de referentiepagina Gegevens importeren voor gedetailleerde informatie over het gebruik van het onderdeel Gegevens importeren.

Notitie

Als uw gegevensset te veel kolommen bevat, kan de volgende fout optreden: 'Validatie is mislukt vanwege groottebeperking'. U kunt dit voorkomen door de gegevensset te registreren in de interface gegevenssets.

Ondersteunde bronnen

In deze sectie vindt u een overzicht van de gegevensbronnen die door de ontwerper worden ondersteund. Gegevens worden in de ontwerpfunctie opgehaald uit een gegevensarchief of uit een gegevensset in tabelvorm.

Gegevensopslagbronnen

Zie Access-gegevens in Azure Storage-services voor een lijst met ondersteunde gegevensopslagbronnen.

Bronnen voor gegevenssets in tabelvorm

De ontwerpfunctie ondersteunt tabellaire gegevenssets die zijn gemaakt op basis van de volgende bronnen:

  • Bestanden met scheidingstekens
  • JSON-bestanden
  • Parquet-bestanden
  • SQL-query's

Data types

De ontwerper herkent de volgende gegevenstypen intern:

  • Tekenreeks
  • Geheel getal
  • Decimaal
  • Booleaans
  • Date

De ontwerper gebruikt een intern gegevenstype om gegevens door te geven tussen onderdelen. U kunt uw gegevens expliciet converteren naar de indeling van de gegevenstabel met behulp van het onderdeel Converteren naar gegevensset. Elk onderdeel dat andere indelingen dan de interne indeling accepteert, converteert de gegevens op de achtergrond voordat deze worden doorgegeven aan het volgende onderdeel.

Gegevensbeperkingen

Modules in de ontwerpfunctie worden beperkt door de grootte van het rekendoel. Voor grotere gegevenssets moet u een grotere Azure Machine Learning-rekenresource gebruiken. Zie Wat zijn rekendoelen in Azure Machine Learning in Azure Machine Learning voor meer informatie over Azure Machine Learning-berekeningen?

Toegang tot gegevens in een virtueel netwerk

Als uw werkruimte zich in een virtueel netwerk bevindt, moet u aanvullende configuratiestappen uitvoeren om gegevens in de ontwerpfunctie te visualiseren. Zie Azure Machine Learning-studio gebruiken in een virtueel Azure-netwerk voor meer informatie over het gebruik van gegevensarchieven en gegevenssets in een virtueel Azure-netwerk.

Volgende stappen

Leer de basisprincipes van de ontwerper met deze zelfstudie: Autoprijs voorspellen met de ontwerper.