Naslaginformatie over algoritme en onderdelen voor Azure Machine Learning Designer

Artikel
01/30/2025

VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)

Notitie

Designer ondersteunt twee soorten onderdelen, klassieke vooraf samengestelde onderdelen en aangepaste onderdelen. Deze twee typen onderdelen zijn niet compatibel.

Klassieke vooraf gebouwde onderdelen bieden belangrijke vooraf gedefinieerde onderdelen voor gegevensverwerking en traditionele machine learning-taken, zoals regressie en classificatie. Dit type onderdeel wordt nog steeds ondersteund, maar er worden geen nieuwe onderdelen toegevoegd.

Met aangepaste onderdelen kunt u uw eigen code als onderdeel opgeven. Het biedt ondersteuning voor delen tussen werkruimten en naadloze creatie in Studio-, CLI- en SDK-interfaces.

Dit artikel is van toepassing op klassieke vooraf samengestelde onderdelen.

Deze referentie-inhoud biedt de technische achtergrond van elk van de klassieke vooraf gedefinieerde onderdelen die beschikbaar zijn in de Azure Machine Learning-ontwerpfunctie.

Elk onderdeel vertegenwoordigt een set code die onafhankelijk kan worden uitgevoerd en een machine learning-taak kan uitvoeren, gezien de vereiste invoer. Een onderdeel kan een bepaald algoritme bevatten of een taak uitvoeren die belangrijk is in machine learning, zoals ontbrekende waardevervanging of statistische analyse.

Zie voor hulp bij het kiezen van algoritmen

Tip

In elke pijplijn in de ontwerpfunctie krijgt u informatie over een specifiek onderdeel. Selecteer de koppeling Meer informatie in de onderdeelkaart wanneer u de muisaanwijzer op het onderdeel in de lijst met onderdelen plaatst of in het rechterdeelvenster van het onderdeel.

Onderdelen voor gegevensvoorbereiding

Functionaliteit	Beschrijving	bestanddeel
Gegevensinvoer en -uitvoer	Verplaats gegevens uit cloudbronnen naar uw pijplijn. Schrijf uw resultaten of tussenliggende gegevens naar Azure Storage of SQL Database, terwijl u een pijplijn uitvoert of gebruik cloudopslag om gegevens uit te wisselen tussen pijplijnen.	Gegevens handmatig invoeren Gegevens exporteren Gegevens importeren
Gegevenstransformatie	Bewerkingen op gegevens die uniek zijn voor machine learning, zoals het normaliseren of binning van gegevens, dimensionaliteitsreductie en het converteren van gegevens tussen verschillende bestandsindelingen.	Kolommen toevoegen Rijen toevoegen Wiskundige bewerking toepassen SQL-transformatie toepassen Ontbrekende gegevens opschonen Clipwaarden Converteren naar CSV Converteren naar gegevensset Converteren naar indicatorwaarden Metagegevens bewerken Gegevens groeperen in opslaglocaties Join-gegevens Gegevens normaliseren Partitie en voorbeeld Dubbele rijen verwijderen SLOEG Transformatie van kolommen selecteren Kolommen selecteren in gegevensset Gegevens splitsen
Onderdelen selecteren	Selecteer een subset van relevante, nuttige functies die u kunt gebruiken om een analytisch model te bouwen.	Functieselectie op basis van filter Urgentie van functie permutatie
Statistische functies	Bieden een breed scala aan statistische methoden met betrekking tot gegevenswetenschap.	Gegevens samenvatten

Machine learning-algoritmen

Functionaliteit	Beschrijving	bestanddeel
Regressie	Een waarde voorspellen.	Regressie van versterkte beslissingsstructuur Beslissingsforestregressie Snelle kwantielregressie van forest Lineaire regressie Regressie van neuraal netwerk Poisson-regressie
Clustering	Gegevens groeperen.	K-Means-clustering
Classificatie	Een klasse voorspellen. Kies uit binaire algoritmen (twee klassen) of algoritmen met meerdere klassen.	Beslissingsstructuur met meerdere klassen verhoogd Beslissingsforest met meerdere klassen Logistieke regressie met meerdere klassen Neurale netwerk met meerdere klassen One vs. All Multiclass One versus One Multiclass Gemiddelde perceptron van twee klassen Two-Class Boosted Decision Tree Beslissingsforest met twee klassen Tweeklasse logistieke regressie Twee klassen neuraal netwerk Ondersteuningsvectormachine van twee klassen

Onderdelen voor het bouwen en evalueren van modellen

Functionaliteit	Beschrijving	bestanddeel
Modeltraining	Gegevens uitvoeren via het algoritme.	Clusteringmodel trainen Trainingsmodel PyTorch-model trainen Hyperparameters van model afstemmen
Modelscore en -evaluatie	Meet de nauwkeurigheid van het getrainde model.	Transformatie toepassen Gegevens toewijzen aan clusters Model kruislings valideren Model evalueren Afbeeldingsmodel scoren ScoreModel
Python-taal	Schrijf code en sluit deze in een onderdeel in om Python te integreren met uw pijplijn.	Python-model maken Python-script uitvoeren
R-taal	Schrijf code en sluit deze in een onderdeel in om R te integreren met uw pijplijn.	R-script uitvoeren
Text Analytics	Bieden gespecialiseerde rekenkundige hulpprogramma's voor het werken met zowel gestructureerde als ongestructureerde tekst.	Word converteren naar vector N Gram-functies extraheren uit tekst Functie-hashing Tekst vooraf verwerken Latent Dirichlet-toewijzing Score Vowpal Wabbit Model Vowpal Wabbit-model trainen
Computer Vision	Onderdelen voor verwerking van afbeeldingsgegevens en herkenning van installatiekopieën.	Afbeeldingstransformatie toepassen Converteren naar afbeeldingsmap Init-afbeeldingstransformatie Map met gesplitste installatiekopieën DenseNet ResNet
Aanbeveling	Aanbevelingsmodellen bouwen.	Aanbevelingsfunctie evalueren SVD-aanbevelingsfunctie scoren Score Wide and Deep Recommender SVD-aanbevelingsfunctie trainen Wide and Deep Recommender trainen
Anomaly Detection	Modellen voor anomaliedetectie bouwen.	Anomaliedetectie op basis van PCA Anomaliedetectiemodel trainen

Webservice

Meer informatie over de webserviceonderdelen, die nodig zijn voor realtime deductie in Azure Machine Learning Designer.

Foutberichten

Meer informatie over de foutberichten en uitzonderingscodes die u kunt tegenkomen met behulp van onderdelen in Azure Machine Learning Designer.

Onderdelenomgeving

Alle ingebouwde onderdelen van de ontwerpfunctie worden uitgevoerd in een vaste omgeving die wordt geleverd door Microsoft.

Voorheen was deze omgeving gebaseerd op Python 3.6 en is nu bijgewerkt naar Python 3.8. Deze upgrade is transparant aangezien de onderdelen automatisch worden uitgevoerd in de Python 3.8-omgeving en er geen actie van de gebruiker wordt vereist. De omgevingsupdate kan van invloed zijn op de uitvoer van onderdelen en het implementeren van realtime-eindpunten vanuit een realtime deductie. Zie de volgende secties voor meer informatie.

Uitvoer van onderdelen verschilt van eerdere resultaten

Nadat de Python-versie is bijgewerkt van 3.6 naar 3.8, kunnen de afhankelijkheden van ingebouwde onderdelen ook dienovereenkomstig worden bijgewerkt. Daarom kunnen sommige onderdelenuitvoer afwijken van eerdere resultaten.

Als u het onderdeel Python-script uitvoeren gebruikt en eerder pakketten hebt geïnstalleerd die zijn gekoppeld aan Python 3.6, kunnen er fouten optreden zoals:

"Kan geen versie vinden die voldoet aan de vereiste."
'Geen overeenkomende distributie gevonden'. Vervolgens moet u de pakketversie opgeven die is aangepast aan Python 3.8 en uw pijplijn opnieuw uitvoeren.

Probleem met realtime deductiepijplijn implementeren vanuit realtime-deductiepijplijn

Als u een realtime-eindpunt rechtstreeks implementeert vanuit een vorige voltooide realtime deductiepijplijn, kan dit fouten veroorzaken.

Aanbeveling: kloon de deductiepijplijn en verzend deze opnieuw en implementeer deze vervolgens in realtime-eindpunt.

Volgende stappen

Zelfstudie: Een model bouwen in de ontwerpfunctie om automatische prijzen te voorspellen

Delen via