Tabel aantal importeren
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Hiermee importeert u een eerder gemaakte tabel met tellingen
Categorie: Learning met tellingen
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Import Count Table in Machine Learning Studio (klassiek) gebruikt.
Het doel van de module Import Count Table is om klanten die een tabel met statistieken op basis van tellingen hebben gemaakt met behulp van een eerdere versie van Machine Learning hun experiment te upgraden. In deze module worden de bestaande teltabellen samengevoegd met nieuwe gegevens.
Zie Voor algemene informatie over het aantal tabellen en hoe ze worden gebruikt om functies te maken, Learning met tellingen.
Belangrijk
Deze module is uitsluitend bedoeld voor achterwaartse compatibiliteit met experimenten die gebruikmaken van de afgeschafte Build Count Table en afgeschafte Count Featurizer-modules. U wordt aangeraden uw experiment bij te werken om de nieuwere modules te gebruiken, zodat u kunt profiteren van nieuwe functies.
Voor alle nieuwe experimenten raden we u aan de volgende modules te gebruiken:
Import count table configureren
Open Machine Learning Studio (klassiek) een experiment met een count-tabel die is gemaakt met behulp van de afgeschafte module Build Count Table.
Voeg de module Import Count Table toe aan het experiment.
Verbinding maken uitvoer van de module Build Count Table (afgeschaft) toe aan de overeenkomende invoerpoorten van de Import Count Table.
Als u een andere gegevensset met tellingen hebt die u wilt samenvoegen met de geïmporteerde count-tabel, verbindt u deze met de meest rechtse invoer voor de module Import Count Table .
Gebruik de optie Teltype om op te geven waar en hoe de teltabel wordt opgeslagen:
Gegevensset: de gegevens die worden gebruikt voor het bouwen van tellingen, worden opgeslagen als een gegevensset in Machine Learning Studio (klassiek).
Blob: De gegevens die worden gebruikt om tellingen te bouwen, worden opgeslagen als een blok-blob in Windows Azure-opslag.
MapReduce: de gegevens die worden gebruikt om tellingen te bouwen, worden opgeslagen als een blob in Windows Azure-opslag.
Deze optie heeft doorgaans de voorkeur voor zeer grote gegevenssets. Als u toegang wilt krijgen tot de tellingen, moet u het HDInsight-cluster activeren. Er wordt een MapReduce-taak gestart om de telling uit te voeren. Voor beide activiteiten kunnen opslag- en rekenkosten in rekening worden brengen.
Nadat u de gegevensopslagmodus hebt opgegeven, moet u mogelijk aanvullende verbindingsgegevens voor de gegevens opgeven, zelfs als u eerder een module Gegevens importeren in het experiment hebt gebruikt om toegang te krijgen tot gegevens. Dat komt doordat de module Count Featurizer (afgeschaft) afzonderlijk toegang heeft tot de gegevensopslag om de gegevens te lezen en de vereiste tabellen te bouwen.
Gebruik de optie Tabeltype tellen om de indeling en opslagmodus op te geven van de tabel die wordt gebruikt voor het opslaan van tellingen.
Woordenlijst: maakt gebruik van een woordenlijsttellingstabel.
Alle kolomwaarden in de geselecteerde kolommen worden behandeld als tekenreeksen en worden gehasht met behulp van een bit-matrix van maximaal 31 bits. Daarom worden alle kolomwaarden vertegenwoordigd door een niet-negatief 32-bits geheel getal.
CMSketch: maakt gebruik van een tabel die is opgeslagen in de minimale tekentabel aantal.
Met deze indeling worden meerdere onafhankelijke hash-functies met een kleiner bereik gebruikt om de geheugenefficiëntie te verbeteren en de kans op hash-bots te verminderen.
Over het algemeen moet u de optie Woordenlijst gebruiken voor kleinere gegevenssets (<1 GB) en de optie CMSketch gebruiken voor grotere gegevenssets.
Voer het experiment uit.
Wanneer u klaar is, klikt u met de rechtermuisknop op de uitvoer van de module Import Count Table , selecteert u Opslaan als transformatie en typt u een naam voor de transformatie. Wanneer u dit doet, worden de samengevoegde tellingstabellen en eventuele featurization-parameters die u mogelijk hebt toegepast, opgeslagen in een indeling die kan worden toegepast op een nieuwe gegevensset.
Voorbeelden
Bekijk voorbeelden van op count gebaseerde featurization met behulp van deze voorbeeldexperimenten in de Azure AI Gallery:
Voorspelling van vluchtvertraging: toont hoe featurization op basis van aantallen nuttig kan zijn in een zeer grote gegevensset.
Learning counts: classificatie met meerdere klassen met NYC-taxigegevens: demonstreert het gebruik van count-based functies in een voorspellingstaak met meerdere klassen.
Learning counts: binaire classificatie met NYC-taxigegevens: maakt gebruik van functies op basis van tellingen in een binaire classificatietaak.
Notitie
Deze galerieexperimenten zijn allemaal gemaakt met behulp van de eerdere en nu afgeschafte versie van de Learning met counts-modules. Wanneer u het experiment opent in Studio (klassiek), wordt het experiment automatisch bijgewerkt om de nieuwere modules te gebruiken.
Verwachte invoer
Naam | Type | Description |
---|---|---|
Metagegevens tellen | Gegevenstabel | De metagegevens van de tellingen |
Tabel aantal | Gegevenstabel | De tabel Count |
Getelde gegevensset | Gegevenstabel | De gegevensset die wordt gebruikt voor het tellen |
Moduleparameters
Naam | Type | Bereik | Optioneel | Standaard | Beschrijving |
---|---|---|---|---|---|
Teltype | CountingType | Vereist | Het teltype |
Uitvoerwaarden
Naam | Type | Description |
---|---|---|
Transformatie tellen | ITransform-interface | De teltransformator |
Uitzonderingen
Uitzondering | Description |
---|---|
Fout 0003 | Uitzondering treedt op als een of meer invoer null of leeg zijn. |
Fout 0018 | Er treedt een uitzondering op als de invoerset ongeldig is. |
Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).
Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.