Naslaginformatie over algoritme en onderdelen voor Azure Machine Learning Designer
VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)
Notitie
Designer ondersteunt twee soorten onderdelen, klassieke vooraf samengestelde onderdelen en aangepaste onderdelen. Deze twee typen onderdelen zijn niet compatibel.
Klassieke vooraf gebouwde onderdelen bieden belangrijke vooraf gedefinieerde onderdelen voor gegevensverwerking en traditionele machine learning-taken, zoals regressie en classificatie. Dit type onderdeel wordt nog steeds ondersteund, maar er worden geen nieuwe onderdelen toegevoegd.
Met aangepaste onderdelen kunt u uw eigen code als onderdeel opgeven. Het biedt ondersteuning voor delen tussen werkruimten en naadloze creatie in Studio-, CLI- en SDK-interfaces.
Dit artikel is van toepassing op klassieke vooraf samengestelde onderdelen.
Deze referentie-inhoud biedt de technische achtergrond van elk van de klassieke vooraf gedefinieerde onderdelen die beschikbaar zijn in de Azure Machine Learning-ontwerpfunctie.
Elk onderdeel vertegenwoordigt een set code die onafhankelijk kan worden uitgevoerd en een machine learning-taak kan uitvoeren, gezien de vereiste invoer. Een onderdeel kan een bepaald algoritme bevatten of een taak uitvoeren die belangrijk is in machine learning, zoals ontbrekende waardevervanging of statistische analyse.
Zie voor hulp bij het kiezen van algoritmen
Tip
In elke pijplijn in de ontwerpfunctie krijgt u informatie over een specifiek onderdeel. Selecteer de koppeling Meer informatie in de onderdeelkaart wanneer u de muisaanwijzer op het onderdeel in de lijst met onderdelen plaatst of in het rechterdeelvenster van het onderdeel.
Onderdelen voor gegevensvoorbereiding
Functionaliteit | Beschrijving | bestanddeel |
---|---|---|
Gegevensinvoer en -uitvoer | Verplaats gegevens uit cloudbronnen naar uw pijplijn. Schrijf uw resultaten of tussenliggende gegevens naar Azure Storage of SQL Database, terwijl u een pijplijn uitvoert of gebruik cloudopslag om gegevens uit te wisselen tussen pijplijnen. |
Gegevens handmatig invoeren Gegevens exporteren Gegevens importeren |
Gegevenstransformatie | Bewerkingen op gegevens die uniek zijn voor machine learning, zoals het normaliseren of binning van gegevens, dimensionaliteitsreductie en het converteren van gegevens tussen verschillende bestandsindelingen. |
Kolommen toevoegen Rijen toevoegen Wiskundige bewerking toepassen SQL-transformatie toepassen Ontbrekende gegevens opschonen Clipwaarden Converteren naar CSV Converteren naar gegevensset Converteren naar indicatorwaarden Metagegevens bewerken Gegevens groeperen in opslaglocaties Join-gegevens Gegevens normaliseren Partitie en voorbeeld Dubbele rijen verwijderen SLOEG Transformatie van kolommen selecteren Kolommen selecteren in gegevensset Gegevens splitsen |
Onderdelen selecteren | Selecteer een subset van relevante, nuttige functies die u kunt gebruiken om een analytisch model te bouwen. |
Functieselectie op basis van filter Urgentie van functie permutatie |
Statistische functies | Bieden een breed scala aan statistische methoden met betrekking tot gegevenswetenschap. | Gegevens samenvatten |
Machine learning-algoritmen
Functionaliteit | Beschrijving | bestanddeel |
---|---|---|
Regressie | Een waarde voorspellen. |
Regressie van versterkte beslissingsstructuur Beslissingsforestregressie Snelle kwantielregressie van forest Lineaire regressie Regressie van neuraal netwerk Poisson-regressie |
Clustering | Gegevens groeperen. | K-Means-clustering |
Classificatie | Een klasse voorspellen. Kies uit binaire algoritmen (twee klassen) of algoritmen met meerdere klassen. |
Beslissingsstructuur met meerdere klassen verhoogd Beslissingsforest met meerdere klassen Logistieke regressie met meerdere klassen Neurale netwerk met meerdere klassen One vs. All Multiclass One versus One Multiclass Gemiddelde perceptron van twee klassen Two-Class Boosted Decision Tree Beslissingsforest met twee klassen Tweeklasse logistieke regressie Twee klassen neuraal netwerk Ondersteuningsvectormachine van twee klassen |
Onderdelen voor het bouwen en evalueren van modellen
Webservice
Meer informatie over de webserviceonderdelen, die nodig zijn voor realtime deductie in Azure Machine Learning Designer.
Foutberichten
Meer informatie over de foutberichten en uitzonderingscodes die u kunt tegenkomen met behulp van onderdelen in Azure Machine Learning Designer.
Onderdelenomgeving
Alle ingebouwde onderdelen van de ontwerpfunctie worden uitgevoerd in een vaste omgeving die wordt geleverd door Microsoft.
Voorheen was deze omgeving gebaseerd op Python 3.6 en is nu bijgewerkt naar Python 3.8. Deze upgrade is transparant aangezien de onderdelen automatisch worden uitgevoerd in de Python 3.8-omgeving en er geen actie van de gebruiker wordt vereist. De omgevingsupdate kan van invloed zijn op de uitvoer van onderdelen en het implementeren van realtime-eindpunten vanuit een realtime deductie. Zie de volgende secties voor meer informatie.
Uitvoer van onderdelen verschilt van eerdere resultaten
Nadat de Python-versie is bijgewerkt van 3.6 naar 3.8, kunnen de afhankelijkheden van ingebouwde onderdelen ook dienovereenkomstig worden bijgewerkt. Daarom kunnen sommige onderdelenuitvoer afwijken van eerdere resultaten.
Als u het onderdeel Python-script uitvoeren gebruikt en eerder pakketten hebt geïnstalleerd die zijn gekoppeld aan Python 3.6, kunnen er fouten optreden zoals:
- "Kan geen versie vinden die voldoet aan de vereiste."
- 'Geen overeenkomende distributie gevonden'. Vervolgens moet u de pakketversie opgeven die is aangepast aan Python 3.8 en uw pijplijn opnieuw uitvoeren.
Probleem met realtime deductiepijplijn implementeren vanuit realtime-deductiepijplijn
Als u een realtime-eindpunt rechtstreeks implementeert vanuit een vorige voltooide realtime deductiepijplijn, kan dit fouten veroorzaken.
Aanbeveling: kloon de deductiepijplijn en verzend deze opnieuw en implementeer deze vervolgens in realtime-eindpunt.